OpenAI发布开放权重人工智能模型

发布时间：2025-08-06 14:07 浏览次数：次作者：小编

当地时间8月5日，OpenAI首席执行官山姆・奥尔特曼宣布，公司将在未来几天内推出多项新成果。其中，周二迎来了一项“小而重磅”的更新——备受瞩目的开源模型GPT-OSS正式亮相。实际上，OpenAI在当日发布了两款开放权重AI推理模型。参数量达1170亿的gpt-oss-120b性能更为强劲，可由单个英伟达专业数据中心GPU驱动；而参数量为210亿的gpt-oss-20b模型，则能在配备16GB内存的消费级笔记本电脑上运行。

局部截取_20250806_140627.png

今年1月，DeepSeek引发了开源AI热潮，此后奥尔特曼曾承认OpenAI在开源技术方面“站在了历史的错误一边”，这或许正是OpenAI重新推出开源模型的原因。这两款模型均依据宽松的Apache2.0许可证发布，企业在进行商用前无需支付费用或获取额外许可。奥尔特曼在社交媒体上表示：“gpt-oss是一项重大突破，它是最先进的开放权重推理模型，具备与o4-mini相当的强大现实世界性能，并且可以在个人电脑（或手机的较小版本）上本地运行。我们坚信这是世界上最佳且最实用的开放模型。”

与此同时，亚马逊宣布将首次向客户提供OpenAI的模型，并计划在其Bedrock和SageMaker平台上推出OpenAI的开放AI权重新模型，这也是云计算巨头亚马逊首次涉足OpenAI产品领域。

gpt-oss-20b和120b的发布，是OpenAI战略转向的重要标志。此前，该公司多次推迟开放权重模型的发布，并开展了全面的安全测试与评估，以防止模型被恶意利用。OpenAI介绍，两款gpt-oss模型运用了其最先进的预训练和后训练技术，尤其注重推理能力、效率以及在不同部署环境中的实用性。它们均采用专家混合（MoE）架构的Transformer，以减少处理输入时所需的活跃参数数量。gpt-oss-120b每个token激活5.1亿参数，总参数量为1170亿；gpt-oss-20b激活3.6B参数，总参数量为210亿。模型采用交替的密集和局部带状稀疏注意力模式，支持高达128k的上下文长度。OpenAI称gpt-oss-20b是一款中型开放模型，gpt-oss-120b则是可在“大多数台式机和笔记本电脑”上运行的大型开放模型。

OpenAI表示，较小的模型至少需要16GB显存或统一内存才能达到最佳性能，并且“非常适合高端消费级GPU和搭载苹果芯片的Mac电脑”。较大的全尺寸模型则需要至少60GB显存或统一内存。

在性能评估方面，OpenAI披露，gpt-oss-120b在核心推理基准测试中接近OpenAIo4-mini的表现。较小的gpt-oss-20b模型在相同评估中达到或超过OpenAIo3-mini的性能。gpt-oss-120b在竞赛编码（Codeforces）、通用问题求解（MMLU和HLE）以及工具调用（TauBench）方面均优于OpenAIo3‑mini，并匹敌甚至超越了OpenAIo4-mini。它在健康相关查询（HealthBench⁠）和竞赛数学（AIME2024和2025）方面的表现甚至超过o4-mini。即便规模较小，gpt-oss-20b在上述同类的评估中也匹敌甚至超越了OpenAIo3‑mini，甚至在竞赛数学和健康方面也超越了后者。

值得注意的是，与o3和o4-mini模型相比，这两款开放模型更容易产生幻觉。OpenAI解释称，由于较小的模型所拥有的世界知识少于大型前沿模型，所以更容易出现幻觉也在预料之中。在OpenAI内部用于衡量模型对人物知识准确性的PersonQA基准测试中，gpt-oss-120b和gpt-oss-20b分别对49%和53%的问题产生幻觉，达到o1模型的3倍多，也高于o4-mini模型的36%。

此外，奥尔特曼同时强调本周晚些时候会有一项“重大更新”。鉴于公司近期不断引发业界关注的举动，市场普遍预期OpenAI下一个重磅更新将是推出GPT-5。

OpenAI对开放权重模型的安全性给予了特别关注，因为一旦发布，对手可能对模型进行恶意微调。该公司在预训练期间过滤了与化学、生物、放射性和核（CBRN）相关的有害数据。为直接评估风险，OpenAI对模型进行了专门的生物学和网络安全数据微调，创建了攻击者可能制作的特定领域非拒绝版本。经过内部和外部测试，这些恶意微调的模型无法达到其准备框架中的“高能力”阈值。

OpenAI此次发布开放权重模型，很大程度上是受到市场竞争压力的驱使。OpenAI总裁GregBrockman在本周二的记者会上表示：“看到生态系统的发展令人兴奋，我们很高兴能为此做出贡献，真正推动技术前沿的发展，然后观察后续的变化。OpenAI与英伟达、AMD、Cerebras和Groq等芯片制造商合作，确保模型在各种芯片上都能良好运行。英伟达CEO黄仁勋在声明中称：OpenAI向世界展示了在英伟达AI上可以构建的成果——现在他们正在推进开源软件的创新。

国常会部署深入实施“人工智能+”行动

人工智能时代，日本为何成为掉队者

热门标签

一周快聘人工智能移动端智能考勤智能办公布局流畅用户界面自动化工资计算职业技能培训智能招聘