在科学技术领域,人们长期以来一直在努力提高各种测量的精度,同时也在努力提高图像的分辨率。随之而来的一个目标是减少从所收集的数据(可视的或其他方式的)中可以做出的估计和得出的推论的不确定性。然而,不确定性永远不可能完全消除。既然我们必须接受它,至少在某种程度上,通过尽可能精确地量化不确定性,我们可以获得很多东西。
换句话说,我们想知道我们的不确定性有多不确定。
麻省理工学院计算机科学与人工智能实验室(CSAIL)的博士后Swami Sankaranarayanan和他的合著者——加州大学伯克利分校的Anastasios Angelopoulos和Stephen Bates在一项新的研究中讨论了这个问题;以色列理工学院的Yaniv Romano;以及麻省理工学院电气工程和计算机科学副教授菲利普·伊索拉(Phillip Isola)。这些研究人员不仅成功地获得了对不确定性的精确测量,他们还找到了一种以普通人能够理解的方式显示不确定性的方法。
他们的论文于12月在新奥尔良举行的神经信息处理系统会议上发表,涉及计算机视觉——人工智能的一个领域,涉及训练计算机从数字图像中收集信息。这项研究的重点是部分被玷污或损坏(由于缺少像素)的图像,以及旨在揭示受损或以其他方式隐藏的信号部分的方法——特别是计算机算法。Sankaranarayanan解释说,这种算法“把模糊的图像作为输入,然后给你一个干净的图像作为输出”——这个过程通常分为几个步骤。
首先,有一个编码器,这是一种由研究人员专门训练的神经网络,用于消除模糊图像的模糊。编码器获取扭曲的图像,并由此创建一个抽象(或“潜在”)的干净图像的形式-由一组数字组成-这对计算机来说是可以理解的,但对大多数人来说是没有意义的。下一步是解码器,解码器有几种类型,通常都是神经网络。Sankaranarayanan和他的同事使用一种被称为“生成”模型的解码器。特别地,他们使用了一个名为StyleGAN的现成版本,它从编码表示(例如一只猫)中获取数字作为输入,然后构造一个完整的、清理过的图像(特定猫的图像)。因此,整个过程,包括编码和解码阶段,从最初混乱的渲染中产生了清晰的图像。
但是人们能对最终图像的准确性有多大的信心呢?而且,正如2022年12月的论文中所述,什么是表示图像中的不确定性的最佳方式?标准的方法是创建一个“显著性图”,它赋予一个概率值——在0到1之间——来表示模型对每个像素的正确性的置信度,每次取一个。Sankaranarayanan表示,这种策略有一个缺点,“因为对每个像素的预测是独立执行的。但有意义的对象出现在像素组中,而不是在单个像素中,”他补充道,这就是为什么他和他的同事们提出了一种完全不同的评估不确定性的方法。
他们的方法以图像的“语义属性”为中心——当把一组像素放在一起时,它们就有了意义,例如,组成一张人脸、一只狗或其他一些可识别的东西。Sankaranarayanan坚持认为,目标是“以一种与人类容易理解的像素分组相关的方式来估计不确定性。”
尽管标准方法可能只产生一张图像,构成对真实图像应该是什么样子的“最佳猜测”,但这种表示中的不确定性通常很难辨别。
这篇新论文认为,为了在现实世界中使用,不确定性应该以一种对非机器学习专家的人有意义的方式呈现。作者并不是只生成一张图像,而是设计了一种生成一系列图像的程序——每一张图像都可能是正确的。此外,它们可以在范围或间隔上设置精确的界限,并提供一个概率保证,真实的描述位于该范围内的某个地方。如果用户对90%的确定性感到满意,则可以提供更窄的范围,如果可以接受更大的风险,则可以提供更窄的范围。
作者认为,他们的论文提出了第一个为生成模型设计的算法,该算法可以建立与图像有意义(语义可解释)特征相关的不确定性区间,并提供“正式的统计保证”。虽然这是一个重要的里程碑,但Sankaranarayanan认为这只是朝着“最终目标”迈出的一步。到目前为止,我们已经能够为简单的事情做到这一点,比如恢复人脸或动物的图像,但我们希望将这种方法扩展到更关键的领域,比如医学成像,在这些领域,我们的‘统计保证’可能特别重要。”
他补充说,假设胸部x光片模糊了,“你想重建图像。如果给你一组图像,你想知道真实的图像包含在这个范围内,这样你就不会漏掉任何关键的信息”——这些信息可能会揭示病人是否患有肺癌或肺炎。事实上,Sankaranarayanan和他的同事已经开始与一位放射科医生合作,看看他们预测肺炎的算法是否在临床环境中有用。
他说,他们的工作可能也与执法领域有关。“监控摄像头拍摄的画面可能很模糊,你想要增强这一点。这样做的模型已经存在,但衡量不确定性并不容易。你不想在生死关头犯错误吧。”他和他的同事正在开发的工具可以帮助确定一个有罪的人,并帮助一个无辜的人免罪。
Sankaranarayanan指出,我们所做的大部分事情以及我们周围世界发生的许多事情都笼罩在不确定性之中。因此,更坚定地把握这种不确定性可以在无数方面帮助我们。首先,它可以告诉我们更多我们不知道的东西。
安杰洛普洛斯得到了美国国家科学基金会的支持。贝茨得到了数据科学研究所基金会和西蒙斯研究所的支持。Romano得到了以色列科学基金会和Technion的职业发展奖学金的支持。Sankaranarayanan和Isola对该项目的研究由美国空军研究实验室和美国空军人工智能加速器赞助,并根据合作协议编号FA8750-19-2- 1000完成。麻省理工学院超级云和林肯实验室超级计算中心也提供了计算资源,为本工作报告的结果做出了贡献。
注:本文由院校官方新闻直译,仅供参考,不代表指南者留学态度观点。