热门话题
每日早报
排行榜
AI
科技动态
财经快讯
医疗产业
汽车
专业版

© 2026 NoCode 无码科技（杭州）有限公司浙ICP备17005035号-6 联系我们加入我们产品介绍 MCP 接入

浙公网安备 33010902002965 号浙 B2-20181004

科技新闻，每天 3 分钟

OpenAI 宣布开源 SimpleQA 新基准，专治大模型「胡言乱语」

OpenAI 宣布开源 SimpleQA 新基准，专治大模型「胡言乱语」

2024 年 10 月 31 日

OpenAI 推出名为 SimpleQA 的新开源基准，旨在衡量语言模型在回答事实寻求问题时的准确性。该基准通过确保问题答案的正确性和多样性，以及挑战性，旨在解决现有语言模型生成错误或未经证实答案的问题。SimpleQA 具有简洁的问题和答案格式，便于评估，并且经实验证明对前沿模型如 GPT-4o 具有挑战性。然而，SimpleQA 的准确性仅限于短查询的事实导向问题。OpenAI 希望通过开源 SimpleQA 促进 AI 研究，进一步提升模型的可信度和可靠性，并已提供开源链接和论文供研究参考。

OpenAI 宣布开源 SimpleQA 新基准，专治大模型「胡言乱语」

IT 之家

OpenAI 推出 SimpleQA 新基准，治理 AI 大模型乱说话现象

ITBear 科技资讯

OpenAI 发布 SimpleQA 新基准，助力语言模型准确性大提升

ITBear 科技资讯

展开全部报道

话题追踪

2026-07-10

OpenAI 发布 GPT-5.6 系列模型：性能全面超越 Claude，价格最低仅为竞品十六分之一

2026-07-09

奥尔特曼：OpenAI 全新大模型智能自主编码的 Token 效率提升 54%

2026-05-21

OpenAI 宣布攻克 80 年数学难题 AI 首次自主证明 Erdős 开放问题

2026-05-08

OpenAI 发布三款实时语音模型，针对推理对话、实时翻译和实时转录

2026-04-22

OpenAI 推出 ChatGPT Images 2.0 图像模型

2026-04-20

OpenAI 将于未来数周内发布全新图像模型

2026-03-06

OpenAI 发布 GPT-5.4 系列模型，强化专业工作与智能体能力

2026-02-13

OpenAI 推出首款搭载英伟达竞争对手 Cerebras 芯片的 AI 模型

2025-12-17

OpenAI：面向所有用户在 ChatGPT 中推出全新图像模型及功能

2025-12-04

OpenAI 推出 AI「忏悔」框架：旨在训练模型承认不当行为，提高诚实度

查看更多

专业版功能

登录

体验专业版特色功能，拓展更丰富、更全面的相关内容。

行业标签

订阅

订阅

订阅

二维码

24 小时

资讯推送

进群体验