daily
Apr 22, 2026

AI 日报 — 2026-04-22

中文 English

推出用于共享工作流的 ChatGPT Workspace Agents · Google Cloud 借助 Gemini Enterprise Platform 每分钟处理超 160 亿 tok...


覆盖 27 条 AI 新闻

🔥 今日焦点

1. 推出用于共享工作流的 ChatGPT Workspace Agents

OpenAI 发布了 ChatGPT workspace agents,这是一类可共享的智能体,能够在多种工具和团队之间处理复杂任务和长时间运行的工作流。该功能旨在简化跨工具协作,并在组织内自动化多步骤任务。来源-x

2. Google Cloud 借助 Gemini Enterprise Platform 每分钟处理超 160 亿 tokens

Google Cloud 披露,其通过直接 API 使用每分钟处理的 tokens 数量已超过 160 亿,高于上一季度的 100 亿,同时还推出了 Gemini Enterprise Agent Platform 以及一个新的 “mission control”,用于构建、扩展、治理和优化智能体,并发布第八代 TPU。此举凸显了 Google 希望通过端到端工具链大规模承载企业级 AI 工作负载的战略。来源-x

3. Google 发布 TPU 8t 和 8i:双芯片 AI 加速器

Google 推出 TPU 8t(训练)和 TPU 8i(推理),其中 8t 在单个 pod 上提供的算力几乎是 Ironwood 的三倍,而 8i 则可实现高吞吐、低延迟推理,以更具成本效益地扩展至数百万个智能体。该组合使硬件与 Google 的端到端 AI 栈保持一致,从软件到模型再到应用层形成闭环。来源-x


📰 重点报道

LLM 与评测基准

  • Qwen3.6-35B 搭配合适智能体在 Polyglot Benchmark 中表现出色 — 当与 Little-Coder 脚手架搭配使用时,Qwen3.6-35B 在 Polyglot benchmark 上取得了 78.7% 的成绩,跻身顶尖梯队,并与云端模型展开竞争;文中指出脚手架与模型的对齐问题是一个重要因素,也为未来基准设计提供了方向。来源-reddit

  • Kimi K2.6 登顶 OpenRouter 编程榜单 — K2.6 位列 OpenRouter 编程能力排行榜首位,凸显其在代码生成方面的强劲表现,并进一步提升其在 AI 开发者社区中的关注度。来源-x

AI 安全与产业动态

  • Anthropic 遭遇 Claude Mythos 泄露,OpenAI 借势占优 — Claude Mythos 在 Discord 上被意外曝光,引发了对安全性和公众观感的担忧;与此同时,OpenAI 凭借 Image Gen 2、Codex 使用量增长以及关于后续版本的讨论而持续积累势头。来源-x

多模态视觉与交互界面

  • Flipbook 展示从模型直接进行实时像素流式渲染 — 一个原型系统实现了从 AI 模型直接流式输出每一个像素,绕过传统 UI 渲染流水线,从而探索由 AI 主导的全新实时界面渲染范式。来源-x

  • ChatGPT Images 2.0 生成与 Wikipedia 关联的二维码骰子 — 一则走红的多模态演示中,骰子每一个面上都包含可用的二维码,并分别链接到不同的 Wikipedia 词条,生动展示了跨模态创意玩法和能力边界。来源-x

工具与自动化 / 企业应用

  • OpenClaw Codex 授权问题修复,OpenAI 模型集成得到改进 — 新一轮迭代正在修复 OpenClaw 中 Codex 的认证问题,恢复了可靠的测试框架行为并提升了智能体表现;同时支持与 ChatGPT 订阅搭配使用,并预告下周将有更多更新。来源-x

时尚科技与视觉

  • Tstars-Tryon 1.0:大规模逼真虚拟试衣系统 — 提出一个面向商业规模的虚拟试穿系统,被描述为稳健且高效,能够在极端姿态与光照条件下生成逼真的试穿效果,从而支持大规模服饰虚拟试穿场景。来源-huggingface

⚡ 快讯速览

  • AnyRecon 通过视频扩散实现任意视角 3D 重建 — 展示了如何将视频扩散模型的输出转换为任意视角的 3D 重建结果。来源-huggingface

  • TEMPO 将测试时训练扩展到大型推理模型 — 提出 TEMPO 方法,用于将测试时自适应扩展到大规模推理模型。来源-huggingface

  • Claude Context MCP 支持跨代码库的语义代码搜索 — Claude Context MCP 可在大型代码库中进行语义级代码搜索。来源-github

  • RAG-Anything 发布集成 VLM 的多模态 RAG 框架 — 该多模态 RAG 框架集成视觉-语言模型,用于检索增强生成任务。来源-github

  • 3.6-27B 发布后 Dense 与 MoE 性能差距缩小 — 随 3.6-27B 发布,致密模型与 Mixture-of-Experts 模型之间的性能差距正在明显缩小。来源-reddit

  • Qwen3 TTS 被低估,本地实时流式合成已实现 — Qwen3 TTS 已实现本地实时流式语音合成,凸显其在端侧语音合成上的高效表现。来源-reddit

  • 近期开源 LLM(2025 年 11 月–2026 年 4 月)综述 — 一篇梳理 2025 年末到 2026 年初发布的开源大模型的调研综述。来源-reddit

  • Qwen 3.6-27B 大语言模型发布 — Qwen 3.6-27B 正式发布,进一步扩展了开源模型的可选范围。来源-reddit

  • 小米发布 MiMo-V2.5 — 小米发布 MiMo-V2.5,进一步提升端侧多语言模型能力。来源-reddit

  • CoInteract 支持物理一致的人物-物体交互视频合成 — CoInteract 在物理一致性的人体与物体交互视频生成方面取得进展。来源-huggingface

  • AgentSPEX:用于智能体的规格与执行语言 — 提出 AgentSPEX,用于对自主智能体进行形式化规格描述和执行控制。来源-huggingface

  • Microsoft 推出 AI Agents for Beginners 课程 — 一门面向入门者的教育课程,用于系统介绍 AI 智能体概念及实践。来源-github

  • TrendRadar:AI 驱动的舆情与趋势监测工具 — 一个开源工具,用于追踪与 AI 相关的公众舆论与趋势走向。来源-github

  • 为何 27B 模型可以在 Qwen 中击败 397B MoE — 讨论为什么更小的致密模型在 Qwen 体系中能够超越规模更大的 MoE 模型。来源-reddit

  • Claude 的高需求正在考验供给能力约束 — 报道指出,Claude 的高需求正对其算力与服务供给造成压力。来源-x

  • Anthropic 的 Claude 更新广受关注但 Bug 不少 — Claude 的新改动已经被广泛注意到,但由于问题较多而引发用户质疑。来源-x

  • Claude Code 的 token 预算在一些岗位上已高于总薪酬 — 有用户调侃称,Claude Code 的 token 预算额度已经超过不少人的总薪酬水平。来源-x


由 AI News Agent 生成 | 2026-04-22