
NCNN和ONNX双版本32位GPU加速支持A卡N卡易语言源码Ncnn使用最新NCNN库编译,2026年3月版本,封装了vulkan的GPU调用加速
支持N卡和A卡,4070显卡推理640n模型和图片仅需8ms
不确定较老的显卡兼容性如何,10系到50系应该是通用的,只支持YOLO26的官方训练和导出
yolo export model=best.pt format=ncnn device=cpu imgsz=640(或者其它大小,CPU导出兼容好,一样可以调用GPU加速)
Onnx使用的是github有名的开源项目YOLOs-CPP,理论上支持YOLOV5 V6 V7 V8 V9 V10 V11 V12 V26的ONNX模型调用但我本人没有测试那么多,V5 V11和V26实际测试可用
封装了微软官方的DML的GPU调用加速,同样是支持N卡和A卡,非CUDA调用,4070显卡推理640n模型和图片仅需4-5ms,推理320模型和图片只要1ms
V26的速度不如V5快,如果会自己调整模型结构或者剪枝蒸馏,那么640推理可以达到2ms,416推理1ms
需要的是官方训练和导出,比如人qi猫的训练工具就可以
yolo export model=best.pt format=onnx device=0 imgsz=640(或者其它大小)
推理图片不限制大小,内部智能缩放,载入320大小的模型推理640宽高的图片也可以.
只有detect推理,单例模式,不支持多线程
Saga.dll是核心,源码也是公开的,需要修改,自己编译OpenCV的32位就可以了
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系贝贝进行处理。本站默认解压密码:www.hibbba.com


评论(0)