越来越多地使用AI来帮助人类操作员处理来自CCTV和其他安全来源的大量图像。人员重新识别(ReID)是一种方法,其中AI可以识别从不同相机或在不同场合拍摄的同一个人的图像。这有助于在覆盖大型公共空间的CCTV网络(例如地下网络)中追踪嫌疑犯。对于机器,ReID极具挑战性,因为它们必须在不同的光源,姿势和外观变化(例如衣服)下考虑并区分同一个人。
萨里视觉,语音和信号处理中心(CVSSP)的专家在今年首尔举行的国际计算机视觉国际会议上发表的论文中,该会议是最负盛名的视觉人工智能会议,来自萨里视觉,语音和信号处理中心(CVSSP)的专家详细介绍了他们如何开发独特的系统名为OSNet的OS胜过许多已在使用的流行识别系统。
CVSSP团队表明,OSNet能够深入分析各种空间尺度上的信息,以帮助准确地进行重新标识-从最小的细节(例如T恤上的徽标)到其他较大的因素(例如嫌疑人穿的外套类型。
令人难以置信的是,OSNet只需要220万个参数,这在深度神经网络模型的背景下是一个很小的数目,胜过许多基于使用2400万个参数的流行ResNet50基础架构构建的竞争对手,这暗示OSNet可以成为视觉识别的标准技术。如此小的参数大小意味着该模型可以“在边缘”部署,这意味着繁重的计算工作可以在摄像机本身而不是在远程数据中心进行,从而节省了用于从中传输大量视频数据的带宽摄像机连接到数据服务器。
CVSSP的计算机视觉和机器学习杰出教授Tao Xiang表示:“借助OSNet,我们着手开发一种工具,该工具可以克服其他设置面临的许多人员重新识别问题,但结果远远超过了我们的期望:OSNet所达到的ReID精度明显超过了操作人员。
“ OSNet不仅显示出它在许多重新识别问题上的性能优于同类产品,而且结果如此,我们相信它可以单独用作独立的视觉识别技术。”
CVSSP主任Adrian Hilton教授说:“这是Xiang教授及其团队在实现世界领先的重新识别技术方面取得的巨大成就。他们在OSNet上的工作具有突破性的潜力,可以帮助塑造视觉效果。这是人工智能和机器感知技术的一个很好的例子,它造福了社会,为更安全的公共场所提供了使能技术。”