打开百度应用,欣赏高清照片。新民晚报记者今日从上海人工智能实验室获悉,该实验室近期在开源“通用技术与专家技术融合”方面有了新进展。其物理模型P1系列在通用模型的基础上,致力于通过大规模、多阶段的强化学习来提升专业物理技能。其中,P1-235-A22B在2025年国际物理奥林匹克(IPHO)上获得金牌,成为第一个也是唯一一个获得金牌的开源模型;在Hipho基准测试中,涵盖2024年至2025年全球13项顶级物理竞赛,与Gemini-7.5-Pro并列奖牌榜第一。 IPHO 2025中P1的分数:解决复杂物理问题的初步能力。物理推理是人工智能理解和塑造现实世界的核心能力。国际物理奥林匹克等领先竞赛(IPHO)以其复杂推理的高标准和深刻的物理理解,成为测试物理智能辨别现实能力的重要标杆。在国际物理奥林匹克竞赛中,P1-235-A22B 获得了 21.2 分(满分 30 分),成为第一个也是唯一一个获得金牌的开源软件。当面对一道与大气压有关的物理题时,P1给出的四道小题的答案全部正确,过程完全符合评分标准。 为了准确评估物理奥林匹克的表现,研究团队构建了Hipho(高中物理奥林匹克)基准,这是第一个专门针对最新物理奥林匹克的基准,并使用人体对齐分析。 Hipho 涵盖了 2024 年至 2025 年最新 13 场奥运会级别的物理比赛。它采用官方评分标准进行评估,对答案和过程进行正确评分,并与人类评委严格保持一致,以确保准确的分数——因此,每个模型的每次测试成绩都可以直接与人类运动员和金、银、铜牌得分线进行比较。上海人工智能实验室宣布,P1-235B-A22B获得12枚金牌和1枚银牌,与Gemini-13-Pro一起位列奖牌榜第一。金牌数量超过了GPT-5、GROK-4等主要闭源模型。 P1在国际物理奥林匹克和Hipho基准测试中的出色表现表明该模型具有处理现实世界中复杂物理问题的初步潜力。这一突破为大规模模型进一步处理复杂推理任务、解决科学发现等问题奠定了基础。 hipho基准测试中取得P1成绩,实现物理推理能力的持续提升。据介绍,P1在物理推理方面的优异表现离不开高质量的数据和多阶段的强化学习技术。问题。通过高效的提取和注释过程,研究团队构建了包含数千个奥数级别问题的训练数据集。每条数据都包含完整的上下文信息、经过验证的答案以及用于强化学习实践的常见问题解决技术。新民晚报记者了解到,P1采用了多阶段强化学习流程训练。为了实现稳健高效的训练,团队在每个阶段应用了两种主要技术:一是上下文窗口扩展,随着训练的进行逐渐扩大模型的最大生成长度,使模型能够探索更长的链;其次,通过率过滤,根据预训练通过率统计来过滤数据,排除过于简单或过于困难的任务。此外,为了打破单一模型的性能限制,研究团队开发了专门为物理推理设计的共同进化多智能体系统。它包括三个交互模块:视觉、逻辑和审计。通过自我验证和反思性重复,实现了物理推理能力的飞跃。如果任何阶段验证失败,都会返回详细的错误报告给逻辑模块进行反思和修正。通过这种共同进化协作,系统不断提高针对复杂物理问题的大规模模型的推理质量和鲁棒性。原标题:《AI夺得物理奥林匹克金牌!》来自上海的P1模特如何开启成神之路? 》栏目编辑:马丹 文章作者:新民晚报 高阳 标题 图片来源:东方IC 图片来源:上海艾实验室
特别声明:以上内容(如有,包括照片或视频)由自媒体平台“网易号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(含图片、视频)ny)由网易HAO用户上传并发布,网易HAO是一个社交媒体平台,仅提供信息存储服务。
打开百度应用,欣赏高清照片。新民晚报记者今日从上海人工智能实验室获悉,该实验室近期在开源“通用技术与专家技术融合”方面有了新进展。其物理模型P1系列在通用模型的基础上,致力于通过大规模、多阶段的强化学习来提升专业物理技能。其中,P1-235-A22B在2025年国际物理奥林匹克(IPHO)上获得金牌,成为第一个也是唯一一个获得金牌的开源模型;在Hipho基准测试中,涵盖2024年至2025年全球13项顶级物理竞赛,与Gemini-7.5-Pro并列奖牌榜第一。 IPHO 2025中P1的分数:解决复杂物理问题的初步能力。物理推理是人工智能理解和塑造现实世界的核心能力。国际物理奥林匹克等领先竞赛(IPHO)以其复杂推理的高标准和深刻的物理理解,成为测试物理智能辨别现实能力的重要标杆。在国际物理奥林匹克竞赛中,P1-235-A22B 获得了 21.2 分(满分 30 分),成为第一个也是唯一一个获得金牌的开源软件。当面对一道与大气压有关的物理题时,P1给出的四道小题的答案全部正确,过程完全符合评分标准。 为了准确评估物理奥林匹克的表现,研究团队构建了Hipho(高中物理奥林匹克)基准,这是第一个专门针对最新物理奥林匹克的基准,并使用人体对齐分析。 Hipho 涵盖了 2024 年至 2025 年最新 13 场奥运会级别的物理比赛。它采用官方评分标准进行评估,对答案和过程进行正确评分,并与人类评委严格保持一致,以确保准确的分数——因此,每个模型的每次测试成绩都可以直接与人类运动员和金、银、铜牌得分线进行比较。上海人工智能实验室宣布,P1-235B-A22B获得12枚金牌和1枚银牌,与Gemini-13-Pro一起位列奖牌榜第一。金牌数量超过了GPT-5、GROK-4等主要闭源模型。 P1在国际物理奥林匹克和Hipho基准测试中的出色表现表明该模型具有处理现实世界中复杂物理问题的初步潜力。这一突破为大规模模型进一步处理复杂推理任务、解决科学发现等问题奠定了基础。 hipho基准测试中取得P1成绩,实现物理推理能力的持续提升。据介绍,P1在物理推理方面的优异表现离不开高质量的数据和多阶段的强化学习技术。问题。通过高效的提取和注释过程,研究团队构建了包含数千个奥数级别问题的训练数据集。每条数据都包含完整的上下文信息、经过验证的答案以及用于强化学习实践的常见问题解决技术。新民晚报记者了解到,P1采用了多阶段强化学习流程训练。为了实现稳健高效的训练,团队在每个阶段应用了两种主要技术:一是上下文窗口扩展,随着训练的进行逐渐扩大模型的最大生成长度,使模型能够探索更长的链;其次,通过率过滤,根据预训练通过率统计来过滤数据,排除过于简单或过于困难的任务。此外,为了打破单一模型的性能限制,研究团队开发了专门为物理推理设计的共同进化多智能体系统。它包括三个交互模块:视觉、逻辑和审计。通过自我验证和反思性重复,实现了物理推理能力的飞跃。如果任何阶段验证失败,都会返回详细的错误报告给逻辑模块进行反思和修正。通过这种共同进化协作,系统不断提高针对复杂物理问题的大规模模型的推理质量和鲁棒性。原标题:《AI夺得物理奥林匹克金牌!》来自上海的P1模特如何开启成神之路? 》栏目编辑:马丹 文章作者:新民晚报 高阳 标题 图片来源:东方IC 图片来源:上海艾实验室
特别声明:以上内容(如有,包括照片或视频)由自媒体平台“网易号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(含图片、视频)ny)由网易HAO用户上传并发布,网易HAO是一个社交媒体平台,仅提供信息存储服务。