最近更新于 2022-06-05 09:20

本文资源文件下载:https://pan.baidu.com/s/17TQB6Z380U9ftklTQqXZrg?pwd=b1o0

因为一个任务要求,要做到把这些合在一起识别。经过考虑采用 BDD100K 数据集,虽然这个数据集是在美国采集的,但是在中国基本上没区别。开始的时候我是去官网下载这个数据集,但是这个数据集很庞大,而且下载过程中老是莫名的被终止(可能当作机器人了吧),后面采用的网友分享的:https://blog.csdn.net/qq_46244851/article/details/106453685

我这里使用 YOLOv5 进行检测,自己写了一个脚本对标注格式进行转换(放在数据集目录下的)。其中有一些目标我这里不需要识别,转换格式的时候就不管那些标注了,最终训练的类别和对应的标签量:

训练步骤同:https://blog.iyatt.com/?p=5536,使用预训练模型为 n 模型,训练了 20 代。

下面是在验证集上推理的

然后我在 B 站上找了一段视频(https://www.bilibili.com/video/BV1tw411R7Xw?p=2),用作测试,

Intel i5-8265U CPU 下十几的帧率,显卡 GeForce MX230 下帧率二十几。

目前还不完善,对于交通信号灯的状态,交通标志的内容识别还未完成,后续继续。