游戏百科

谷歌DeepMind CEO:AGI 到来,只差一两个突破性创新

当被问及离通用人工智能还有多远时,德米斯·哈萨比斯停顿片刻,给出一个精确的工程预测:“只差一两个突破性创新,就像Tran

当被问及离通用人工智能还有多远时,德米斯·哈萨比斯停顿片刻,给出一个精确的工程预测:“只差一两个突破性创新,就像Transformer或AlphaGo那样的根本性飞跃。”

最近,谷歌DeepMind联合创始人兼CEO德米斯·哈萨比斯在一场深度访谈中,透露通用人工智能发展的具体路径与时间表。这位AI领域的先驱者表示,人类正站在AGI实现的临界点上,仅需解决少数几个关键瓶颈。

这场对话中,哈萨比斯深度剖析了当前AI系统的根本缺陷、未来突破方向以及全球AI竞赛的最新格局,为理解AI技术发展趋势提供了清晰的框架。

当前AI系统的三大能力断层

哈萨比斯在访谈中点出当下最先进AI系统存在的能力不连贯性。他指出,现有模型在不同任务上表现出显著的性能波动,形成了明显的“智能断层”。

第一个断层是“专家型局限”。当前模型在狭窄领域可能达到甚至超越人类专家水平,却缺乏将这些专业知识迁移到相关领域的能力。

一个在蛋白质结构预测中表现优异的AI,面对稍微调整的分子模拟任务时,可能就需要几乎从头开始训练。

第二个断层是推理深度不足。哈萨比斯指出,现有系统能够进行表面层级的逻辑推演,但在需要多步抽象思维或反事实推理的复杂任务中表现迅速下降。

他以国际象棋为例,AI可以计算数百万种走法,却难以理解“如果棋规改变,策略应如何调整”这类元认知问题。

最根本的第三个断层是学习机制单一。当前AI系统主要依赖静态数据集的批量训练,缺乏人类那种从持续交互中在线学习、自我修正的能力。

这种“一次学习,终身应用”的模式限制了AI在动态环境中的适应性和进化潜力。

通往AGI的两大关键技术突破

当被问及实现AGI还需要哪些关键技术突破时,哈萨比斯明确指向两个方向:世界模型的构建与持续学习架构的创新。

世界模型的核心是让AI系统不仅能识别模式,还能理解现象背后的因果机制。

哈萨比斯分享了DeepMind内部项目Genie的进展——这个系统能够生成一致、可交互的虚拟环境,用户可以在AI创建的世界中自由探索。这一技术标志着AI从“识别世界”向“模拟世界”的关键转变,是理解物理规律的基础。

持续学习架构的突破则可能更加根本。哈萨比斯指出,当前神经网络在学习新知识时普遍存在“灾难性遗忘”问题——学会新技能的同时快速丢失旧能力。

真正的AGI需要类似生物大脑的弹性可塑性与稳定性平衡,能够在整个生命周期中不断整合新旧知识。

哈萨比斯表示,这两方向的实现,将直接推动AI能力产生阶跃式提升。

多模态演进:感知融合如何重塑AI认知边界

哈萨比斯特别强调了多模态能力对于AGI发展的重要性。他透露,DeepMind的Gemini系统从设计之初就是原生多模态架构,而非后期拼接的模块化系统。

这种设计使得Gemini能够实现跨模态的深度融合理解。例如,系统可以同时分析视频画面、语音内容和文字字幕,捕捉不同信息流之间的隐含关联。

哈萨比斯举例说,当分析一个演讲视频时,Gemini不仅能转录音频内容,还能结合演讲者的肢体语言、面部表情和观众反应,给出更全面的情境解读。

目前Gemini展现出了的多模态推理能力。哈萨比斯分享了一个案例:向系统展示一段音乐家演奏乐器的短视频,然后询问“演奏者此刻的情感状态如何?”

Gemini能够综合听觉特征、视觉表现甚至音乐理论知识,给出有依据的情感判断。

这种跨模态的认知融合正逐渐接近人类理解世界的方式。哈萨比斯预测,未来一年将是多模态AI快速成熟的时期,尤其是在视频理解与生成领域将出现显著进展。

智能体成熟度:从工具到伙伴的技术演进曲线

哈萨比斯对AI智能体的发展给出了明确的时间预测:

一年内将出现首批真正实用的任务导向型智能体系统。但他同时强调,这一过程将遵循渐进式的成熟路径。

第一阶段是“有限任务执行者”,能够在严格定义的环境中完成特定工作,如整理电子邮件或安排会议。这类系统已经实现,但可靠性和边界情况处理能力仍有待提高。

第二阶段是“跨域协调者”,能够整合多个专业工具完成复杂项目。哈萨比斯描绘了这样的场景:用户告诉AI“我想在后院建一个菜园”,系统便能协调设计软件、采购平台、施工指南等资源,提供端到端的解决方案。

最终阶段是“通用助理”,能够理解用户的长期目标与价值观,主动提供个性化支持。这类系统需要突破当前AI的诸多限制,包括对语境的理解、记忆的连贯性以及目标的持久追踪能力。

哈萨比斯特别指出,随着智能体自主性增强,价值对齐问题将变得更加重要。如何确保AI的目标与用户意图保持一致,是技术成熟前必须解决的核心挑战。

中美AI竞赛的新阶段

哈萨比斯访谈中,对中美人工智能竞争的评估既现实又微妙。他认为美国目前在算法创新和基础模型性能方面保持领先,但这种优势正在逐渐缩小。

中国的研究团队展现出强大的工程能力和快速迭代速度,在某些应用领域已经实现了同等水平的表现。

中国人工智能发展的一个显著特点是迅速跟进和规模化应用的能力。在开源模型和特定垂直领域的应用上,中国团队已经展示了强大的竞争力。

这种竞争态势推动全球AI研究加速前进,促使各方在技术创新和伦理安全方面持续投入。

值得注意的是,哈萨比斯认为当前的差距更多体现在“几个月而非几年”的时间维度上。这意味着技术领先的窗口期正在迅速缩短,任何重大突破都可能迅速改变竞争格局。

AGI到来,将如何重构人类工作与价值?

超越技术讨论,哈萨比斯深入探讨了AGI可能引发的社会结构变革。他预测,未来十年将见证工作性质的根本性转变,而非简单的岗位替代。

第一批受影响的将是信息处理类工作,如文档分析、数据整理和基础内容创作。这些任务AI已经能够以更高速度和一致性完成,人类角色将转向监督、优化和创造性拓展。

中期来看,专业决策类工作也将发生变化。医生、律师、工程师等专业人士将借助AI增强分析能力,专注于更高层次的判断、伦理考量和人际关系处理。

哈萨比斯认为,这可能导致专业培训体系的重构,更加注重机器难以复制的人类能力培养。

长期而言,AGI可能催生全新的价值创造模式。

哈萨比斯提出了“极致丰裕”愿景——当物质生产基本自动化后,人类活动可能转向更深层次的探索:科学研究、艺术创作、体验设计和精神追求。

哈萨比斯总最后结道:“挑战不在于技术实现,而在于社会适应。我们需要提前思考在智能丰裕时代,什么才是值得追求的人类繁荣。”