关键词: 科技 视频行为理解
在近日举行的全球视频行为理解领域数据规模最大、最具影响力的技术竞赛——Activity Net挑战赛上,来自成都高新区的人工智能企业成都睿沿科技有限公司(以下简称“睿沿科技”)作为四川省首家参赛企业获得全球第9名的成绩,标志着成都高新区企业在“视频(行为)理解”这一计算机视觉领域的挑战性问题上获得世界权威机构认可。
Activity Net挑战赛由IEEE计算机协会和CVF计算机视觉基金会主办,历年来吸引了卡内基梅隆大学、悉尼科技大学、微软亚洲研究院等众多世界一流高校和科研机构参赛。CVPR2018分为6个挑战赛,自4月17日开放、6月8日结束。睿沿科技是一家注册在成都高新区的一家人工智能企业。比赛中,参赛团队通过对数据集中57万以上的场景识别测试结果,评估算法识别视频片段行为内容的能力。参赛的国内机构还包括百度、北京大学、浙江大学等;国外机构、来自英特尔和麻省理工的团队,分别位列第13名和第14名。
“视频理解”一直是人工智能研发领域的重点和难点,该项技术能让机器像人类一样拥有更完整的连续视觉。在业内看来,静态图像的理解获取的信号是“名词”,视频行为理解获取的信号是“动词”。“举个例子来说,一张照片上有一个人站在路边,但是照片并不会告诉你‘动作的叙述’,这个人在那边站了多久?是呆站着还是来回徘徊?也就是说,照片可提供的资讯在某些领域或应用是不够的,这些内容只能通过视频理解来获得。”睿沿科技CEO吉翔说。
“比如,一段‘拉小提琴’的视频,不应识别成‘一个人抬着手做运动’,而两人见面拥抱的视频,不能识别成两人碰撞在一起,也就是说,比赛时需要评估机器对视频行为的理解能力。”吉翔介绍,本次人工智能的竞赛是在学术领域进行全球最前端技术的探讨,这也是企业第一次参加全球人工智能竞赛,目前正在全力搭建具有自主知识产权的人工智能平台,瞄准模式识别技术、机器深度学习、人工智能算法及大数据基础架构领域,提供综合智能解决方案。
附件下载