欧易

您数字货币与 Web3的直通车

数字货币交易和 Web3 - 为您轻松实现

欧易交易所
当前位置:首页-资讯-详情

谷歌与斯坦福研究:优化测试计算超越模型参数扩展

2024年9月19日消息,谷歌DeepMind团队于2024年8月6日发布的论文《优化 LLM 测试时计算比扩大模型参数规模更高效》探讨了在面对复杂问题时,大型语言模型(LLM)是否可以通过增加测试时的计算量来提升决策质量。研究结果表明,相比于扩展模型参数规模,增加测试时计算的效果更加显著。这一发现与OpenAI近期发布的o1模型原理有着类似之处。

测试计算与模型参数的对比

DeepMind的研究指出,通过增加测试时计算量(test-time compute),模型能够在推理过程中进行更多的中间步骤,从而逐步完善其思维过程和策略。这种方法有助于提升模型的整体性能,因为它允许模型在生成最终答案之前,先进行一系列的中间推理,尝试不同的策略,并且能够识别并纠正自身的错误。这一思路与OpenAI的o1模型相符,o1模型在给出答案之前,会先生成中间推理步骤,从而不断完善和优化其思维过程。

思维链技术的应用

此外,谷歌与斯坦福大学的研究人员在2024年1月发布的论文《思维链赋能 Transformer 解决本质上的串行问题》中,也提出了类似的观点。该论文探讨了“思维链”(Chain of Thought,简称CoT)技术,这种技术旨在突破Transformer模型在串行推理方面的限制。通过采用思维链技术,模型能够更高效地处理复杂问题,提升推理过程中的连贯性和准确性。

从模型参数扩展到硬件能力

这些研究成果表明,AI领域的大模型竞争正在从单纯的模型参数扩展转向更高效的测试时计算和硬件能力的提升。随着技术的发展,拥有更强大的算力已经成为在AI领域获得竞争优势的关键因素。例如,OpenAI近期宣布了其首款芯片计划,该芯片采用了台积电最新的A16级工艺,专为Sora视频应用打造。这一举措表明,大模型的竞争已经开始向硬件能力的扩展,未来的竞争将不仅限于模型的规模,还将涉及到硬件性能的提升。

总的来说,优化测试时计算和提升硬件能力正在成为AI大模型领域的新竞争点。这些进展不仅推动了模型性能的提升,也为未来AI技术的发展开辟了新的方向。

相关报道

加密资产获批提速,主流币种名单浮出水面 2025-07-31

加密资产获批提速,主流币种名单浮出水面

近期,随着美国证券交易委员会(SEC)对加密资产交易所交易产品(ETP)上市标准的调整,符合条件的加密资产数量逐渐明朗。

Read More
特朗普暂停低价值货物免税待遇引发关税调整 2025-07-31

特朗普暂停低价值货物免税待遇引发关税调整

当地时间7月30日,美国白宫发布声明,美国总统特朗普签署了一项新的行政命令,宣布暂停对低价值进口货物的最低限度免税待遇。

Read More
高盛看美联储鸽派分歧 关注秋季宽松可能性 2025-07-31

高盛看美联储鸽派分歧 关注秋季宽松可能性

高盛资产管理公共投资首席投资官Ashish Shah近日就美联储最新利率决议发表了观点。

Read More
马克龙批欧盟对美贸易谈判软弱 呼吁加强战略威慑力 2025-07-31

马克龙批欧盟对美贸易谈判软弱 呼吁加强战略威慑力

法国总统埃马纽埃尔·马克龙近日在一次内阁会议上对欧盟在对美贸易谈判中的表现表示不满。

Read More
美司法部终止调查Dragonfly投资Tornado Cash事宜 2025-07-30

美司法部终止调查Dragonfly投资Tornado Cash事宜

近日,据The Block报道,美国司法部(DOJ)在7月30日的庭审中正式表示,将不再就风投公司Dragonfly早期对加密货币混币平台Tornado Cash的投资行为进行调查。

Read More
香港启动稳定币监管 全球机构加速进场加密市场 2025-07-30

香港启动稳定币监管 全球机构加速进场加密市场

7月30日,据4E观察报道,香港金融管理局(HKMA)正式宣布,将于2025年8月1日至9月30日开放首批稳定币发行人牌照的申请窗口,标志着香港稳定币监管体系进入实质性实施阶段。

Read More

立即创建 账号,开始交易!

创建账号