[]计算机视觉:YOLO算法简介
“You Only Look Once”或“YOLO”是一个对象检测算法的名字 , 这是Redmon等人在2016年的一篇研究论文中命名的 。 YOLO实现了自动驾驶汽车等前沿技术中使用的实时对象检测 。 让我们看看是什么使该算法如此受欢迎 , 并概述其工作原理 。
本文插图
对象检测示例
背景
实时的重要性
人们看到图像以后 , 可以立即识别其中的对象、它们的位置和相对位置 。 这使得我们能够在几乎无意识的情况下完成复杂的任务 , 比如开车 。 因此 , 对汽车进行自动驾驶训练需要类似水平的反应能力和准确性 。 在其最基本的形式中 , 这样的系统必须能够分析实时视频中的道路 , 并能够在继续确定路径之前检测各种类型的对象及其在现实世界中的位置 , 所有这些都必须是实时的 。
在YOLO之前
先前的检测系统使用分类器对测试图像的不同切片进行评估 。 例如 , Deformable Parts Model (DPM)涉及到在图像中均匀间隔的位置上滑动窗口并在这些部件上运行分类器 。 R-CNN(Region-based Convolutional Neural Networks)是另一种模型 , 它运行一种分割算法将一幅图像分割成一个个小块 , 然后在这些小块上运行一个分类器 。 但是 , 速度慢、优化困难一直困扰着这种YOLO之前的系统 。
YOLO算法
YOLO将对象检测重新定义为一个回归问题 。 它将单个卷积神经网络(CNN)应用于整个图像 , 将图像分成网格 , 并预测每个网格的类概率和边界框 。 例如 , 以一个100x100的图像为例 。 我们把它分成网格 , 比如7x7 。
本文插图
然后 , 对于每个网格 , 网络都会预测一个边界框和与每个类别(汽车 , 行人 , 交通信号灯等)相对应的概率 。
本文插图
每个边界框可以使用四个描述符进行描述:
- 边界框的中心
- 高度
- 宽度
- 值映射到对象所属的类
最后 , 我们对每个类的对象应用一个称为“非最大抑制(Non Max Suppression)”的方法来过滤出“置信度”小于阈值的边界框 。 这为我们提供了图像预测 。
本文插图
重要性
【[]计算机视觉:YOLO算法简介】YOLO非常快 。 由于检测问题是一个回归问题 , 所以不需要复杂的管道 。 它比“R-CNN”快1000倍 , 比“Fast R-CNN”快100倍 。 它能够处理实时视频流 , 延迟小于25毫秒 。 它的精度是以前实时系统的两倍多 。 同样重要的是 , YOLO遵循的是“端到端深度学习”的实践
推荐阅读
- 微型计算机Series X与PS5你挺谁?,次世代主机的新碰撞,Xbox
- 北晚新视觉网可能引发经济社会多次暂停和重启,央行:全球新冠疫情或反复
- 北晚新视觉网全球亏损最多?,LV老板疫情期损失300亿美元
- 微型计算机杂志神舟战神Z9-CU7PK游戏本,十代酷睿新品赏析
- 科技小辛辛弱电工程数据中心计算机房内布线漫谈
- 北晚新视觉网旅客下月入境需自我隔离14天,英国为避免疫情二次暴发
- 北晚新视觉网宁卖房不卖股筹现金,或将租房住,特立独行的亿万富翁马斯克
- 北晚新视觉网多国暴发聚集性感染,全球新冠病毒感染超400万!美国超130万
- 北晚新视觉网韩国首尔暂停运营部分娱乐场所,再次出现小规模聚集性感染
- 北晚新视觉网连出两起确诊病例,特朗普称将每天一测,病毒“入侵”白宫
