据外媒报道,美国加州大学洛杉矶分校(UCLA)和美国陆军研究实验室(United States Army Research Laboratory)的研究人员提出了一种新方法,可通过给数据驱动的技术增加物理感知,以改进人工智能(AI)驱动的计算机视觉技术。
(资料图)
显示了将物理整合到机器学习过程中的两种技术(图片来源:加州大学洛杉矶分校)
该研究被发表在《自然杂志机器智能》期刊上,其中概述了一种混合方法,旨在改进AI机器实时感知环境、与周围环境互动以及对环境做出响应的能力,例如,自动驾驶汽车将如何移动以及行驶,或者机器人如何使用该改进技术来执行精确行动。
计算机视觉允许AI通过解码数据和从图像中推断物理世界的属性来观察和理解周围环境。虽然此类图像通过光与机械的物理现象形成,但传统的计算机视觉技术主要关注数据驱动型机器学习,以驱动性能提升。不过,基于物理学的研究在一个单独的轨道上发展起来,以探索很多计算机视觉挑战背后的各种物理原理。
将对物理学的理解,即控制质量、运动等的定律,纳入神经网络发展中一直是一个挑战,在神经网络中,AI模型模仿有数十亿个节点的人类大脑,以处理大量图像数据集,直至理解了“看到”的东西。但现在有一些有发展前景的研究方向,试图将物理感知元素添加到强大的数据驱动网络中。
UCLA的研究旨在利用数据的深度知识以及真实世界物理学知识的力量,创建增强型混合AI。
UCLA Samueli工程学院电子与计算机工程助理教授Achuta Kadambi表示:“汽车、机器人或使用图像感知视觉的健康仪器等视觉机器最终需要在我们所在的物理世界中完成任务。物理感知形式的推理可让汽车更安全地行驶,或者让手术机器人更加精确。”
该研究团队概述了将物理学和数据结合至计算机AI中的三种方式:
1、将物理特性纳入到AI数据集中
用额外的信息标记目标,例如目标移动的速度或重量,类似于视频游戏中的角色
2、将物理特性纳入到网络体系结构中
通过网络过滤器运行数据,以将物理属性编码到摄像头捕捉到的图像中
3、将物理特性纳入网络损失函数
利用建立在物理特性上的知识来帮助AI解释其观察到的训练数据
这三方面的研究已经在改进计算机视觉方面产生了令人鼓舞的结果。例如,混合法让AI更精确地跟踪和预测物体的运动,并能够从因恶劣天气被遮挡的场景中产生准确、高分辨率的图像。
研究人员表示,随着此类双模态方法的不断进步,基于深度学习的AI甚至可能可以自己开始学习物理定律。