daily
May 31, 2026

AI 日报 — 2026-05-31

中文 English

OpenAI 面向审查通过的开发者和政府伙伴推出 Rosalind Biodefense · OpenAI Robotics 取得进展;招聘工程师构建物理世界 AI · Parakeet 语音转...


涵盖 19 条 AI 新闻

🔥 今日焦点

1. OpenAI 面向审查通过的开发者和政府伙伴推出 Rosalind Biodefense

OpenAI 扩大对 GPT-Rosalind 的可信访问范围,将其开放给通过审查的开发者和美国政府合作伙伴,用于推进生物防御、公共卫生以及疫情应对能力。该计划旨在通过为获批用户提供由 AI 驱动的防御和公共卫生工具,提升社会的整体韧性。 来源-x

2. OpenAI Robotics 取得进展;招聘工程师构建物理世界 AI

OpenAI 表示,其机器人项目正在演进为 OpenAI Robotics,并在迈向能在物理世界中运作的 AI 方面取得快速进展。该团队正在招聘全栈硬件、运营、系统和机器学习工程师,帮助编程与制造机器人以服务社会,初期聚焦支持技术工人,之后将进一步发展为个人机器人。该项目由 Aditya Ramesh 领导,强调硬件与机器学习研究的协同共设计,并邀请应聘者通过邮件发送个人背景与成果进行申请。 来源-x

3. Parakeet 语音转文本移植至 ggml,与 NeMo 输出一致且更快

NVIDIA 的 Parakeet 语音转文本模型已被移植到纯 C++/ggml,从而在无需 Python 或 PyTorch 的前提下即可在 CPU 和 GPU 上运行。其输出在字节级与 NeMo 完全一致,在 f32/f16 路径上字错误率(WER)为 0,并且运行速度显著更快(大型模型在 GPU 上最高快约 5 倍、量化后在 CPU 上约快 1.86 倍),同时占用更少内存。该项目提供量化的 GGUF 变体(f16、q8_0、q6_k、q5_k、q4_k),支持缓存感知流式处理、实时话语结束检测、带置信度的词级时间戳,并提供一个精简的 C API 以便集成。 来源-reddit

📰 重点报道

Open Source & LLM Development

  • GitHub 上从零训练开源 LLM 的项目 — 一个 GitHub 项目展示了如何使用 PyTorch 在单块 GPU 上从零开始训练基于 Transformer 的 LLM。该项目有望降低研究者在小到中等规模模型上进行实验的门槛,尽管真正的大规模训练依然需要高昂资源投入。 来源-github

  • Llama Studio v0.2.0 新增按模型脚本、多 GPU 与自动加载 — Llama Studio v0.2.0 对 llama-server 的 WebUI 进行了更新,改为按模型使用独立 shell 脚本,并增加了多 GPU 支持、会话存储,以及为无头服务器提供启动自动加载功能。 来源-reddit

AI Safety & Evaluation

  • 13 个 Abliterated Gemma-4 E2B 变体在 44 GPU 小时内完成评测 — Abliterlitics 对 9 位作者贡献的 13 个 abliterated Gemma-4 E2B 变体进行了评测,总耗时 44 GPU 小时;其中 coder3101 的变体在保持模型能力的同时实现了 96% 的 ASR,而 treadon 的变体虽达到了 100% ASR,却在 GSM8K 上丢失了 3 分,这对各变体“能力完全保留”的说法提出质疑。完整数据集、图表与日志已发布在 HuggingFace。 来源-reddit

AI Ethics & Research / IP

  • 三位图灵奖得主重发关键 AI 方法论文,署名争议浮现 — 三位图灵奖得主在重新发表一些具有深远影响的 AI 方法时,没有向最初的创作者致谢,引发关于学术归功的持续争议,而这些争议正被 IDSIA 的 AI priority 页面持续追踪。 来源-x

Tools & Agentic AI

  • Codex 实时控制浏览器,演示效果极具冲击力 — 演示展示了 Codex 实时控制浏览器执行超出原有测试环境范围的任务,被描述为一个“震撼时刻”,并附带了关于 HLS 播放与浏览器自动化方面的说明。 来源-x

LLM Models & Industry

  • Claude 试用对比 Codex XHigh;5.5 仍被认为更胜一筹 — 一位 AI 爱好者表示,在尝试使用 Claude 几天后又回到了 Codex XHigh,认为 5.5 版本在整体体验上依旧明显优于 Claude 和 Codex XHigh。 来源-x

Open Source & LLM Tools

  • GitHub 上从零训练开源 LLM 的项目 —(已在 “Open Source & LLM Development” 下列出)这里进一步强调其在社区共建学习与可复现性方面的作用。 来源-github

Hardware & WebUI

  • Llama Studio v0.2.0 新增按模型脚本、多 GPU 与自动加载 —(已在前文提及)此处补充指出,它持续改进多 GPU 工作流相关工具链。 来源-reddit

Platform Updates & Open Access

  • 数百万用户因明日限额重置而欢呼 — 一条社交媒体帖子庆祝即将到来的使用配额重置,同时对模型能力进行了比较,从侧面反映现实平台使用中的竞争与动态。 来源-x

Models, Code & Community

  • Claude 试用对比 Codex XHigh;5.5 仍被认为更胜一筹 —(也被归入 “LLM Models & Industry”)凸显社区对模型性能与对齐趋势的持续讨论与分歧。 来源-x

⚡ 快讯速览

  • 当 LLaMA 从显存溢出到系统内存时会发生什么 — 解释了当 LLaMA 的数据从显存溢出至系统内存时,内存分页机制如何运作以及由此带来的性能权衡。 来源-reddit

  • 家庭数据中心驱动 9 张 GPU 用于机器学习实验 — 介绍了一个家庭环境下运行 9 张 GPU 以进行机器学习实验的搭建方式,以及其中的实际取舍。 来源-reddit

  • Qwen3.6-35B-A3B-Claude 的 APEX-MTP GGUF 发布 — 发布 GGUF 权重,以便在多种模型上实现更高推理速度。 来源-reddit

  • Computex 上确认搭载 NVIDIA N1X 的 Dell XPS — Dell 在 Computex 上确认其笔记本产品线将配备 NVIDIA N1X。 来源-reddit

  • GPT Realtime 2 让你用语音控制电脑 — 通过 GPT Realtime 2 增加了基于语音的电脑控制能力。 来源-x

  • Hermes Agent 内置 100+ 预启用技能 — Hermes Agent 预装并启用了 100 多种技能,方便智能体直接调用。 来源-x

  • G7 就开源 AI 与开放权重 AI 的共同表述达成一致 — G7 试图在如何表述开源 AI 和开放权重方面建立统一框架。 来源-reddit

  • 征求对 Qwen3.6b-27b KV Cache 量化的看法 — 社区正在征求对于不同 Qwen 模型 KV cache 量化方案的意见与经验。 来源-reddit

  • LLM 推理轨迹中的语义步骤预测 — 探讨多步 LLM 推理路径中的语义步骤预测问题。 来源-reddit


由 AI News Agent 生成 | 2026-05-31