DeepMind推出改进芯片设计、解决数学难题Agent,帮助Gemini训练

今日热点· 2025-05-15 16:03:56

大型语言模型 (LLM) 功能极其丰富,它们可以汇总文档、生成代码,甚至集思广益,提出新想法。现在,谷歌 DeepMind 扩展了这些功能,使其能够解决数学和现代计算领域中基础且高度复杂的问题。

近日,谷歌 DeepMind 公布了其在自动化算法探索领域的最新进展——AlphaEvolve。该系统融合了大型语言模型的强大代码生成能力与进化算法的迭代优化思想,构成一个能够自主发现并改进复杂算法的 AI 智能体,致力于在通用算法的发现和优化方面取得突破。

AlphaEvolve 利用谷歌的 Gemini 大型语言模型家族(包括Gemini Flash 和 Gemini Pro)为各种不同的任务生成和改进代码。其核心在于其创新的“进化”方法:它不仅仅是单次生成代码,而是通过一个迭代循环,不断对 Gemini 生成的算法进行测试、评估、筛选和优化。表现不佳的方案被剔除,有潜力的方案则被进一步调整和改进,直至系统收敛到当前问题下的最优算法。在许多测试中,其结果比现有的、由人类专家编写的最佳解决方案更高效或更准确。

据悉,AlphaEvolve 提升了谷歌数据中心、芯片设计和 AI 训练流程的效率,包括训练 AlphaEvolve 本身所依赖的 LLM。它还帮助设计了更快的矩阵乘法算法,并为一些悬而未决的数学问题找到了新的解决方案,展现出在众多科学和工程领域应用的巨大潜力。



工作原理

AlphaEvolve 延续了谷歌 DeepMind 多年来的研究方向,其核心理念是通过人工智能推动数学与科学领域的人类认知边界。2022 年问世的 AlphaTensor 模型在计算机科学基础难题——矩阵乘法求解上取得突破,将保持了 50 余年的计算效率纪录一举刷新;2023 年推出的 AlphaDev 则发现了每日执行数万亿次的基础运算的加速方法。这两项技术均将数学问题转化为"游戏对弈"模式,通过寻找最优步骤序列来破解难题。

而 2023 年底亮相的 FunSearch 实现了范式革新——它用具备代码生成能力的大语言模型替代了游戏 AI。由于大语言模型具有多任务处理能力,相比仅专精单一游戏类型的早期系统,FunSearch 能攻克更多样化的问题。该工具甚至成功破解了纯数学领域一个长期悬而未决的著名难题。

AlphaEvolve 是 FunSearch 的升级版本。与 FunSearch 只能生成解决特定问题的简短代码片段不同,它能编写长达数百行的完整程序。这一突破使其能够应对更广泛的问题类型。

从理论上说,任何能用代码描述且解决方案可通过计算机评估的问题,AlphaEvolve 都能处理。"算法驱动着我们周围的世界,因此这项技术的影响将无比深远,"谷歌 DeepMind 算法探索团队负责人 Matej Balog 说道。



文章链接: http://www.huangxinwei.com/aizixun/7984.html Chat AI人工智能机器人在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑,如存在版权问题请发送邮件至398879136@qq.com,我们会在3个工作日内处理。非原创标注的文章,观点仅代表作者本人,不代表炎黄立场。