加州大学伯克利分校 | 伯克利讲座:Jitendra Malik谈人工智能的感觉运动之路

他继续说:“我们可以说智能始于大约5.5亿年前的寒武纪，当时我们有了第一批可以四处活动的多细胞动物。”“所以，这些是最早可以移动的动物，这给了它们一个优势，因为它们可以在不同的地方找到食物。但是如果你想在不同的地方移动和寻找食物，你需要感知，你需要知道去哪里，这意味着你需要有某种视觉系统或感知系统。这就是为什么我们有这个口号，这是吉布森的，“我们看是为了移动，我们移动是为了看。”

马利克说，对于一个机器人来说，它需要某种视觉系统，才能在特定的地形上导航，比如踏脚石或楼梯。

“但是我们如何训练视觉系统呢?他问道。“我们想让它在野外学习。所以，这是我们的直觉:如果你想象一个在楼梯上的机器人，它的本体感觉，它的感觉，它的关节角度可以让它计算出它的左腿和右腿的深度，等等。它的几何形状来自它的关节角，来自它的内部状态。那么，我们可以用它来训练吗?这个想法是本体感觉预测每条腿的深度然后视觉系统得到一个图像。

我们让视觉系统做的是预测1.5秒后的深度。

“这就是我们的想法——你只需要改变它1.5秒后知道的信号，然后用它来做这种高级预测。我们有这个机器人，它每天都在学习。第一天，它很笨拙。第二天，价格进一步上涨。然后，最后，在第三天，你会看到它……一路走来。”

马利克的讲座于3月20日举行，是今年春天世界顶尖人工智能专家在伯克利举行的一系列公开讲座的第一场。其他演讲嘉宾还包括伯克利大学博士得主John Schulman, OpenAI的联合创始人和ChatGPT的主要架构师;他是麻省理工学院荣誉退休教授，也是机器人领域的领先专家，以及其他四位伯克利人工智能领域的主要教员，他们将讨论计算机视觉、机器学习和机器人领域的最新进展。

请看下面马利克的演讲视频。

https://youtu.be/f6fDpKDxpL0