在半山花园社区,当老人意外摔倒时,安装在公共区域的摄像头会在3秒内识别并触发警报;而在12公里外的南山矿区,摄像头正24小时盯着生产车间,任何违规操作或人员闯入都逃不过AI的“眼睛”。驱动这些场景的视觉算法,来自小视科技(江苏)股份有限公司(以下简称小视科技)。成立于2015年的小视科技,正通过自主研发的灵犀工业视觉大模型,重新定义机器“看”世界的方式。
“如果把摄像头比作眼睛,传统AI只能‘看到’杯子是杯子。而我们的视觉大模型,要像人脑一样理解‘杯子为什么倾倒、是否可能引发事故’。”小视科技平台研发部部长蔡鑫浩用“神经元网络”比喻其核心技术,面对各类场景中复杂的环境,如何多模态融合抗干扰,毫秒级动态推演,一直是小视科技AI视觉算法的追求方向。
“我们曾只用7天就做出了国内首个戴口罩人脸识别,这在当时对技术的挑战性非常高。然而,成果也是显著的,我们很快就在南京市江宁区1000多个小区实现了应用,打造了国内最大规模的智慧社区。”蔡鑫浩回忆起小视科技一路“升级打怪”的历程,从智慧城市、智慧社区到智慧矿山、智慧校园,小视科技的发展伴随着“数据标注训练—模型开发—场景编排—部署应用”全流程链路,它搭建的AI开发平台,包含500多种算法,俨然一座“算法生产工厂”。“算力是基础,关键是平台,我们把所有物联网数据、成熟算法仓库都放一起,哪里需要就直接调用算法仓,如果没有现成的,我们可以做中长尾定制。我们算过一笔账,这比以往传统算法开发,效率提升80%以上。”蔡鑫浩表示。
支撑场景落地的,是小视科技深厚的底层技术积累。作为国内首批做人工智能视觉的公司之一,小视科技钻研人工智能视觉算法10年,突破多目标追踪技术——MiniTrack追踪、视觉大模型显著性检测、图像复原及稳健识别、小样本学习等多项关键核心技术,获得国际视觉顶级赛事CVPR全球第一及江苏省科学技术奖一等奖。目前产值也位居国内细分赛道前列。
走进小视科技南京研发中心,工程师向记者演示了视觉大模型的“超能力”:动态追踪,给AI装上“预判神经”;小样本学习,定制工业AI;多模态融合,安上穿透雨雾的“透视眼”……“我们的大模型就是要当工业界的‘火眼金睛’。”小视科技项目研发部部长葛鹏飞举例说,在小视科技已有的场景应用中,无论是山西煤矿的矿车卸货检测算法,还是北京后厨的动火离人预警系统,都可以快速部署,高精度识别,及时给出反应,误报率大大降低。其MOT多目标追踪技术,可以处理复杂光线、视线遮挡、运动模糊、微小目标等棘手问题,这使得小视科技的视觉大模型变成了守护安全的“电子哨兵”。
“对于深耕马鞍山,我们是非常有决心的。未来,南山矿试点的成功经验可以转化为标准化方案。”小视科技项目管理中心负责人周吉祥称,目前,小视科技以政企协同为根,以场景攻坚为脉,将马鞍山的产业基因转化为技术进化的驱动力,系统性构建“南京强研发+马鞍山深应用”双核驱动生态,“未来,我们将继续扎根于此,让所有需要人眼判断的场景,都有AI的解决方案,让人工智能不仅是工具,更是新质生产力成长的土壤。”(韩德生 张令琪 柴胜松)
驱动这些场景的视觉算法,来自小视科技(江苏)股份有限公司(以下简称小视科技)。成立于2015年的小视科技,正通过自主研发的灵犀工业视觉大模型,重新定义机器“看”世界的方式。