教人工智能以“我”的视角看世界
要令人工智能系统如同人类一样与世界交互,人工智能领域需要发展出一种全新的第一人称感知范式。这意味着人工智能在实时运动、交互时,要以第一人称视角理解日常活动。
世界是多维的,生活中同样的景物在不同的视角下会呈现出不同的形态。若要让人工智能更像人类,就要让其视角更接近人。从人类的角度观察环境,人工智能或许会看到一个新的天地。
近日,由脸谱(Facebook)和9个国家的13所大学及实验室组成的学术联盟宣布,11月将开源让人工智能拥有以第一人称视角与世界进行交互能力的Ego4D(Egocentric 4D Perception)项目。这个项目包含超过3025小时的第一人称视频,涉及来自73个城市的700多名参与者的日常生活。这些视频将有助于使人工智能认知世界的方式更加趋向于人类。
那么,目前人工智能主要通过哪种视角认知世界,不同视角对于人工智能认知环境会产生哪些影响?人工智能感知环境、认识世界主要通过哪些技术?想要认知世界的方式更像人类,人工智能还需突破哪些瓶颈?
人工智能通常采用第三人称视角
“要令人工智能系统如同人类一样与世界交互,人工智能领域需要发展出一种全新的第一人称感知范式。这意味着人工智能在实时运动、交互时,要以第一人称视角理解日常活动。”脸谱首席研究科学家克里斯汀·格劳曼曾言。
今天的计算机视觉系统大多是利用数百万张以第三人称视角拍摄的照片和视频进行学习的。“为了构建新的感知范式,我们需要教会人工智能像人类一样,从第一人称角度即‘我’的视角,沉浸式观察理解世界,并与之交互,这种认知方式也可以称为自我中心认知。”10月26日,远望智库人工智能事业部部长、图灵机器人首席战略官谭茗洲在接受科技日报记者采访时指出。
如何理解人工智能的第一人称和第三人称视角?谭茗洲解释道:“第一人称视角代入感很强,比如在玩游戏时,你如身临其境,看到的游戏画面就是你真实世界看到的画面。第三人称视角又叫作上帝视角,仿佛你一直飘在角色身边一样,如影随形,可以看到角色本身及周围的情况。例如,第三人称视角下藏在掩体后可以看到掩体前面的情况;而在第一人称视角下,囿于视角范围,在掩体后则只能看到掩体本身。”
“再如自动驾驶,其视觉系统如果只从旁观者的(如车的角度)收集数据,即便通过数十万个基于旁观视角看到的车辆行进图像或视频进行训练,人工智能可能依然不知道如何去做,很难达到现在的自动驾驶水平。因为这种旁观者的视角与坐在车内方向盘前的视角很不一样,第一人称视角下,真人驾驶员做出的反应还包括点刹、猛刹等行为,这些数据是从旁观者视角无法搜集的。”谭茗洲进一步说。
“以前人工智能界很少以第一人称视角收集数据集,这个项目弥补了人工智能视角体系的短板。未来AR、VR的发展十分重要,如果人工智能可以从‘我’出发,以第一人称视角来观察理解世界,将开启人类和人工智能沉浸式体验的新时代。”谭茗洲指出。
克里斯汀·格劳曼也表示:“下一代人工智能系统需要从一种完全不同的数据中学习,即从事件中心视觉而不是边线视觉展示世界的视频中学习。”
建立真实世界数据集
目前让人工智能感知环境、认识世界,建立类人化的认知体系主要通过什么“抓手”展开?
业内专家指出,历史证明,基准和数据集是人工智能行业创新的关键催化剂。今天,几乎可以识别图像中任何对象的计算机视觉系统都是建立在数据集和基准之上的,数据集和基准为研究人员提供了一个研究真实世界图像的实验台。
“脸谱日前发布的这个项目,其实本身就是建立一个数据集,旨在训练人工智能模型更像人类。其开发了5个围绕第一人称视觉体验的基准挑战,即把第一人称视角拆解成5个目标,开展相应的训练集竞赛。”谭茗洲指出。
Ego4D的5个基准是:情景记忆,什么时候发生?预测,我接下来可能会做什么?手—物交互,我在做什么?视听日记,谁在什么时候说了什么?社交互动,谁在和谁互动?
谭茗洲强调,上述基准测试将促进开发人工智能助手所必需的构建模块的研究。人工智能助手不仅可以理解现实世界中的指令并与之交互,同时可以在元宇宙中实现对元宇宙中指令的理解和交互。
为了建立这个数据集,与脸谱合作的大学团队向研究参与者分发了现成的头戴式摄像头和其他可穿戴传感器,以便捕获第一人称的、未经编辑的日常生活视频。项目的重点是参与者从日常场景中捕获视频,比如购物、烹饪、边玩游戏边聊天,以及与家人和朋友进行其他团体活动等。
视频采集了摄像头佩戴者在特定环境中选择注视的对象,以及摄像头佩戴者如何从自我中心角度与人和物互动。到目前为止,摄像头佩戴者已经执行了数百项活动,并与数百种不同的对象进行交互,项目的所有数据都是公开的。
“脸谱这项研究能够更快地推动人工智能领域自我中心认知研究的进步。这将对我们未来的生活、工作和娱乐方式产生积极影响。”谭茗洲表示。
让人工智能认知能力更像人
人工智能发展的终极目标是让人类受益,让我们能够应对现实世界中日益复杂的挑战。想象一下,通过AR设备能够在琴、棋、书、画课堂中准确显示如何弹琴、下棋、握笔和勾勒;形象生动地指导家庭主妇根据食谱烘焙烧烤、烹饪菜肴;健忘的老人借以眼前全息图的帮助回忆过去……
脸谱强调,希望通过Ego4D项目为学术界和行业专家开辟一条全新的道路,帮助构建更智能、更灵活和更具交互性的计算机视觉系统。随着人工智能越加深入理解人类的日常生活方式,相信将这个项目能以前所未有的方式对人工智能的体验进行情境化和个性化。然而,目前的研究还只是触及自我中心认知的皮毛。
如何才能让人工智能的认知能力更像人类?“首先是注意力,人工智能的注意力机制更接近直觉,而人类的注意力是有选择性的。目前来说,大部分人工智能注意力机制,是在训练过程中重复告诉人工智能应该注意哪些地方,哪些东西是有关联的。未来也许可以让参与试验的人戴上特殊的可以捕捉眼球关注点的装置,来进一步收集相关数据。”谭茗洲指出。
“第二,还需要以事件和行为的关联为研究中心,定义人工智能的行为。一件事情的发生包括多个行为,要用人类反馈的方式训练人工智能系统,使人工智能的行为与我们的意图一致。”谭茗洲进一步表示。
谭茗洲强调:“此外,听觉和视觉、语言和行为等之间还需要配合、响应、联动,这就要构建多模态交互模型,纵深研究视角为何会聚焦投向并与意图识别相结合,形成与行为之间联动的机制等。”
(责编:王震、陈键)您可能也感兴趣:
为您推荐
建新股份2021年预计净利900万-1300万元 同比下降超七成
凤凰传媒董事长梁勇辞职 第三季度净利润为3.62亿元
汇鸿集团副总裁丁海辞职 第三季度净利润为2994万元
排行
精彩推送
- 三部门印发《中央财政海绵城市建设示范补助资金绩效评价办法》
- 十问中国经济2022:碳达峰碳中和如何稳步推进?
- 银行业保险业创新金融服务 助力冰雪产业可持续、高质量发展
- 覆盖食住行游购娱等多元需求 数字人民币与冬奥特色场景深度融...
- 京张高铁冬奥列车今日开启赛时运输服务
- 夯实“三农”压舱石 开启农业新篇章
- 2021年“三农”工作成绩单公布!请查收
- 针对春节就地过年需求 各地增加蔬菜等重要民生商品市场供应
- 春节期间菜价走势如何?农业农村部回应
- 进场观赛别开热点、蓝牙!一图读懂北京冬奥会无线电管理要求
- 长江流域成世界最大清洁能源走廊 6座梯级水电站2021年发电量...
- 数说交通|2021年12月我国中心城市轨道交通客运量达200868万人次
- 工信部:产业转型迈上快车道 打好工业稳增长“组合拳”
- 近半数央企已进入生态环保产业 行业集约化发展势头增强
- 最新风险提示!防范虚假宣传、“首月0元”等“套路”行为
- 银保监会发布《保险公司非现场监管暂行办法》 3月1日起施行
- 31省份2021年居民人均消费支出数据出炉 上海北京均超4万元
- 31省份2021年居民人均可支配收入数据出炉 上海北京均超7万元
- 国家邮政局:加快与交通等产业协同发展 推动快递服务更便捷更...
- 提升投资者金融素养 加大金融知识宣教力度
- 民航局:加快构建现代民航体系 为现代综合交通运输体系提供民...
- 交通运输部:补短板、强弱项、扬优势 加快建设人民满意、世界...
- 中消协发布春节消费警示:低价打折有可能是“陷阱” 理性消费...
- 工信部:2021年我国工业和信息化发展呈现四方面特点
- 最高分辨率0.5米!我国高分多模卫星正式投入使用
- 工信部:“动态清零”政策对地方产业链、供应链影响有限
- 六部门联合解读《“十四五”现代综合交通运输体系发展规划》
- 十问中国经济2022:如何增强创新“第一动力”?
- 我国明确“十四五”时期智能制造发展路径 巩固实体经济根基
- 发改委:从四方面推动交通运输高质量发展 实现“五个转变”
- 践行“开放办奥”理念 多措并举展示中国良好形象
- 人民银行:涉冬奥移动支付、数字人民币等支付服务筹备工作均...
- 1月LPR“双降”:1年期降10个基点 5年期以上降5个基点
- 国家税务总局:坚决依法打击偷逃成品油消费税违法犯罪行为
- 辽宁省税务局查处部分企业偷逃成品油消费税案件
- 网传“出台《互联网企业上市及投融资操作规范》”属不实信息
- 36.3万亿元、10亿吨、70%:从三个数据看中央企业2021年答卷
- 《“十四五”现代综合交通运输体系发展规划》发布 都市圈1小...
- “十三五”时期我国综合交通网络总里程突破600万公里 高铁运...
- 国知局新规:外国专利代理机构可在华设立常驻代表机构
- 商务部部长:中国始终支持最不发达国家融入多边贸易体制
- 我国国际重要湿地生态保护成效显著 湿地植物达2258种
- 银保监会发布《关于精简保险资金运用监管报告事项的通知》
- 2021年央企“成绩单”发布:全年实现营收36.3万亿元 效益增长...
- 中国石化在湖北恩施发现超千亿方页岩气
- 财政部修订出台《事业单位财务规则》 明确提出全面实施绩效管...
- 水利部部署黄河防凌工作:做好堤防巡查抢险 责任落实到段、到...
- 发展成果惠及于民 “共享办奥”让冰天雪地变金山银山
- 宜安科技2021年预计亏损1.85亿-2.25亿元 同比由盈转亏
- 建新股份2021年预计净利900万-1300万元 同比下降超七成
- 凤凰传媒董事长梁勇辞职 第三季度净利润为3.62亿元
- 汇鸿集团副总裁丁海辞职 第三季度净利润为2994万元
- *ST中天副总经理徐天啸辞职 第三季度净亏损1.16亿元
- 十问中国经济2022:如何为中小企业解忧纾困?
- 1月18日全国预计发送旅客2530.5万人次
- 人民银行:发挥货币政策双重功效 稳中求进更加主动有为
- 生态环境部:2021年黄河中上游5省(自治区)累计清理各类固废...
- 解读五大税收流行语 看2021税收工作新成效
- 嫦娥四号“打工”已满三年 玉兔二号月球车行驶超1000米
- 人民银行谈2021年金融统计数据:金融对实体经济支持力度稳固
- 人民银行:近期房地产销售、购地、融资等行为已逐步回归常态
- 人民银行:数字人民币试点场景已超过808.51万个
- 农业农村部:22.18万退捕渔民实现应保尽保
- 我国首次实现低轨宽带通信卫星批产 卫星互联网建设提速
- 交通运输部:2021年网络货运行业完成运单量6912万单
- 科技“施魔法” “云上”办冬奥
- 国家发改委:2021年经济社会发展主要目标任务较好完成
- 国家发改委:个别高杠杆房地产企业境外违约事件属于市场自我调节
- 国家春耕肥储备3-5月投放市场 今年新增夏管肥临时储备
- 十问中国经济2022:如何防范化解重大风险?
- 我国首个地理标志五年规划发布
- “5G商用产业联盟”等28家非法社会组织被依法取缔
- “预制菜”行业发展引关注 业内:竞逐万亿级市场须构筑安全生...
- 交通运输部:春运首日全国预计发送旅客2489万人次
- 今夜24时油价上调 加满一箱多花13.5元
- 绿色办奥,让北京冬奥会“冰雪之约”变得“绿意盎然”
- 猪粮比价进入过度下跌三级预警区间
- 推广应用电子客票 交通运输部:鼓励采用人脸识别等方式进站乘...
- 如何用43年做好一张纸?
- 交通运输部:严查终到、途经北京、张家口旅客核酸证明
- 2021年三北防护林工程营造林1343万亩 科学绿化实现良好开局
- 国家统计局:国民经济持续恢复 逐步回归常态运行
- 2022年春运正式开启 首都机场预计运送旅客377.8万人次
- 加强疫情防控 保障春运平安 国航开启2022年“春运模式”
- 2022年春运今日启动 铁路部门推出多项便民措施确保春运安全有...
- 利通电子财务总监吴开君辞职 第三季度净利润为754万元
- 海汽集团股东减持349.27万股 价格区间为14.45-17.39元/股
- 招商南油股东建行江苏分行减持2400万股 价格区间为1.93-2.1元/股
- 国发股份股东朱蓉娟减持524万股 价格区间为5.99-6.32元/股
- 2021年中国经济稳字当头 高质量发展取得新成效
- 国家统计局:2021年全国居民人均可支配收入35128元
- 2021年我国造船三大指标全面增长 国际市场份额提升全球领先
- 10个基点!人民银行下调MLF、逆回购操作利率
- 国家发改委:以工代赈项目要最大程度提高劳务报酬发放比例
- 亿晶光电股东荀建华减持4331.69万股 价格区间为4.16-5.15元/股
- 国家发改委:鼓励春节期间网络视频平台限时低价电影放映
- 证监会:依法从严查处证券中介机构违法行为
- 2021年国内生产总值(GDP)1143670亿元 比上年增长8.1%
- 国家统计局:2021年全国人口增加48万人
- 国家统计局:2021年社会消费品零售总额增长12.5%