阅读新闻

依图加速行人重识别(ReID)大规模商业化落地

发布日期:2022-07-15 22:25   来源:未知   阅读:

  人脸识别之后的下一个风口是什么?对于这个问题,业界似乎早已有了共识。从AI的人脸识别能力超越人类以来,学术界和产业界的目光逐渐转向另一个更具科研意义和应用价值的课题——行人重识别(Person Re-identification,ReID)。

  近日,依图科技在ReID领域取得新突破,刷新业界三大权威数据集当前最优成绩(SOTA),算法性能达到业界迄今最高标准,极大拓展了算法和应用的边界。

  注:YITU算法结果在不利用时空信息,不进行重排再优化(Re-ranking),等限制下取得

  还记得2018年底依图进军智能语音,随即在中文语音识别领域创下识别精度的新纪录。2019年5月推出全球首颗云端视觉AI芯片,而且“发布即商用”。似乎无论进入哪个技术领域,依图都能快速将行业整体水平推至新的高点,并加速技术的产业化落地。

  在交通运输、工业制造和城市规划等实际场景下,99%的图像都是不含人脸或人脸部分是极其模糊的,仅有几个像素大小,这时候人脸识别的作用较为有限。

  行人重识别(ReID,也称“行人再识别”),是指在多摄像设备网络下对行人进行检索,利用步态动作、身体特征等更为全面的信息来识别人物,无论单独使用还是与人脸识别相结合,都能发挥更大的应用价值。

  除了智能零售、智慧交通、智能城市等经常提及的应用场景,ReID技术的应用也将使日常生活更加便捷:游乐园更易寻找走失儿童、宠物/家庭机器人可以凭背影准确识别主人或顾客并提供相应服务。

  然而,由于ReID需要从不同摄像机拍摄的图像或视频中找出同一个人物,而这些摄像机所覆盖的范围彼此并不重叠,导致缺乏连贯的信息,而且不同画面中人物的姿态、行为甚至外观(比如: 正身、侧身、背身)会发生较大变化,不同时间、场景的光照、背景和遮挡物各不相同(背景中常还有体型、衣着相似的其他人物干扰),摄像机的分辨率也有高有低,人物在画面中出现的位置有远有进, 这些都对ReID技术提出了极大的挑战。

  依图科技凭借自身工程与研发实力,深度优化了ReID算法框架,显著提升了算法效率,通过结合AutoML等前沿技术,进一步创新性地实现了模型参数的自动搜索与迭代,突破了依赖算法研究员手工设计与调优的传统算法开发流程,在降低人力成本的同时,使得算法的泛化性能更强。

  此次依图自研算法在业界最具影响力的三大ReID数据集Market1501、DukeMTMC-ReID、CUHK03上,将衡量算法性能的两大关键指标“首位命中率”(Rank- 1 Accuracy)及“平均精度均值”(Mean Average Precision,mAP)6项数据全部提升,充分显示了依图的技术实力,进一步稳固了中国技术团队在该任务下领跑地位。

  需要指出,首位命中率高,只意味着算法能够在众多图像中准确找出最容易识别或者说匹配的那张,并不能反应模型的真实能力,尤其是应对复杂场景的表现。

  因此,评价ReID算法性能时需要结合mAP值,它反映的是系统的综合检索性能。mAP值越高,说明系统的实用性越好,既能查得全也能查得准,能够较好地应对多遮挡、光线暗、画面模糊等情况。

  面对又一项业界纪录,依图团队却十分平静。依图研发人员表示,这次刷榜只是一次尝试,依图在工业界实战落地的ReID项目,其规模与问题的复杂程度已经远超三大数据集,可以说,学术界现有ReID基准已经无法体现工业界算法的最高水平。

  举个例子, Market-1501在清华大学内采集,行人(ID)基本上是穿短袖、短裤和裙装的亚洲人,DukeMTMC-reID在杜克大学内采集,ID主要是身着冬季服饰的欧美人, 这些在特定场景, 特定时间段采集的数据往往与真实世界中的图像分布不一致。在真实场景下ReID算法需要做到在跨时间段, 跨场景, 跨不同成像质量的图像采集设备下进行高精度的快速识别. 其数据分布远远与问题复杂程度远远大于现有的学术数据集。

  这些现实因素导致了现有ReID学术界数据集无法有效模拟或者还原实际真实情况。因此,基于现有ReID数据集的基准具有很大的局限性。依图研究人员表示,业界需要更好的ReID数据集,也需要更全面的算法衡量数据集,至少对于商业化落地的算法是如此。

  实战场景下的ReID任务,不仅对算法提出更高要求,也需要更高效的芯片提供强大的算力支持,二者缺少任意一个,都会影响ReID的实际应用价值。目前看来,依图是当下同时具备算法和算力能力的公司。依图在2017年投入云端AI芯片QuestCore(求索)的研发,并于2019年5月“发布即商用”。QuestCore是全球首颗云端视觉AI芯片,提供强大算力,单路摄像头功耗不到1W。

  在ReID实战应用中,依图研发人员针对本次提出的算法做了进一步优化, 依托依图自研AI芯片, 在仅凭穿着、步态特征的条件下,已能将ReID做到2017年~2018年人脸识别的精度。这不仅加速了ReID的大规模商业化落地,更解锁了新的应用场景。

  2017年,以苹果FaceID为代表的人脸识别商业化应用开始在全球范围内普及。如今,刷脸支付、刷脸乘车已经渗透到我们的日常生活。有理由相信,世界级的ReID算法,加上自研AI芯片, 业界期待的下一个计算机视觉领域“杀手级应用”已经到来。(一鸣)

  相比之下,37.4%的公众关注“中国是否存在粮食安全问题?如何解决粮食浪费问题?”

  1972年,徐淙祥高中毕业,可他并没有选择进城当干部,而是回村做农民。“人什么时候都要吃饭,把粮种好,比干啥效益都大!”徐淙祥心想。

  “从这里招聘的学生省心,毕业生得提前定。”每年,深圳市大疆创新科技有限公司都会到天津现代职业技术学院无人机专业选学生。该公司负责招聘的工作人员告诉记者:“这儿的学生干活踏实,学习能力强,肯吃苦,有担当。”

  原本颜色发白的猪肉,经暖红色灯光照射,变得光鲜亮丽……这种通过调整光照颜色让食品看起来更“新鲜”的灯具在业内被称作“生鲜灯”,近年来在各大商店超市、生鲜市场上运用相当普遍。

  张华烈士的雕塑就立在广场对面,仿佛与他们进行着时空对话。空军军医大学基础医学院“张华队”队长王静告诉记者,自2018年开始,学校就将晚点名活动作为一项仪式固定下来,旨在引导学员们纪念英雄、争当英雄。

  海关总署7月9日晚发布公告,宣布即日起进一步优化完善进口冷链食品口岸疫情防控措施,此前境外生产企业输华冷链食品或其包装被检出新冠病毒核酸阳性将被暂停进口申报的措施同时废止。根据国务院相关工作部署,科学、精准做好进口冷链食品口岸新冠肺炎疫情防控工作,巩固疫情防控成果,保障产业链供应链安全。

  研究过十几万只蚊子的他,一直有个问题萦绕在心头:为何它们能将病毒传播得如此之快。蚊子可以快速传播疟疾、登革热、脑炎等疾病,短短半年就能让一个城市疫情横行。全球经由蚊子传播的病毒每年甚至可导致十亿人感染。

  这艘“种子方舟”设计库容3万份,目前已入库保存华中地区药用植物种质资源3000余份,涉及500多种药用植物。

  发展数字经济是把握新一轮科技革命和产业变革的新经济战略选择。近年来,江苏实施推进数字乡村建设“五大行动”,截至2021年底,江苏光纤宽带和4G网络已实现深度覆盖,农村宽带接入用户数量超1500万户,同比增长10.2%,居全国第一。

  7月7日,记者从西安交通大学第一附属医院获悉,国际期刊《细胞》子刊《细胞通讯》5日在线发表该院刘冰/王亚文教授团队在噬菌体抑菌领域的最新研究成果,揭示了其首次发现的噬菌体编码细菌糖代谢通路的抑制蛋白并为其自主命名:PEIP。

  天空中绝大多数发光的天体都是恒星,恒星中大约一半位于双星系统,而双星共有包层演化阶段可以比作宇宙中的“双黄蛋”。

  文昌位于海南省东北部,紧邻省会海口,东、南、北三面临海,优美绵长的海岸线让这个城市处处充满了风景和故事。2016年,曾经在西藏开民宿的祝影和丈夫回到文昌龙楼,开了这家名为“云卷云舒”的民宿,过上了“面朝大海,春暖花开”的闲适日子。但让祝影选择文昌的,不仅是这里的美景,更是一个与星辰大海有关的机遇。

  日前,科技部等发布《关于做好科研助理岗位开发和落实工作的通知》,要求统筹推进科技研发、高新技术企业成长、高新技术产业发展和科研助理岗位开发工作,发挥科技计划和创新基地平台依托单位的引领作用,大幅增加科研助理岗位数量。

  国家航天局发布的消息显示,截至6月29日,“天问一号”任务环绕器正常飞行706天,获取了覆盖火星全球的中分辨率影像数据,各科学载荷均实现火星全球探测。

  7月5日,在中国气象局例行发布会上,中国气象局应急减灾与公共服务司副司长王亚伟通报,6月全国平均降水量112.1毫米,较常年同期偏多9.1%;吉林、辽宁、山东降水量为历史同期最多。

  最近,我国慧眼卫星团队在编号为Swift J0243.6+6124的中子星X射线千电子伏的回旋吸收线,其对应的中子星表面磁场强度超过16亿特斯拉。相关研究成果在线发表于《天体物理杂志通讯》。

  近日,中央宣传部、国家卫生健康委联合印发《关于开展2022年“最美医生”学习宣传活动的通知》

  “慧眼”卫星团队最近在编号为Swift J0243.6+6124的中子星X射线千电子伏的回旋吸收线亿特斯拉的中子星表面磁场。