AI 日报 — 2026-03-26

Meta 发布 TRIBE v2：用于神经预测的三模态大脑编码器 · Gemini 3.1 Flash Live 支持实时语音与视觉智能体 · TurboQuant 以极致压缩重新定义 AI 效率

覆盖 36 条 AI 新闻

🔥 今日焦点

1. Meta 发布 TRIBE v2：用于神经预测的三模态大脑编码器

Meta 推出 TRIBE v2，这是一款用于预测人类对视觉和听觉刺激的大脑反应的基础模型。该模型基于来自 700 多名参与者、超过 500 小时的 fMRI 数据构建，并基于 Algonauts 2025 项目，可为神经活动创建“数字孪生”，并在新受试者、语言和任务上实现零样本预测。官方提供了公开演示供探索，这预示着神经科学研究和神经自适应 AI 的潜在进展，同时也带来了关于数据隐私与知情同意的新考量。来源-x

2. Gemini 3.1 Flash Live 支持实时语音与视觉智能体

Gemini 3.1 Flash Live 被定位为用于构建语音和视觉智能体的实时模型，体现了在模型、基础设施和用户体验上超过一年的研发投入。本次发布声称在质量、稳定性和时延上实现了跨越式提升，对对话式 AI、机器人技术以及端侧辅助技术可能具有重要影响。这或将加速具身智能在各行业的实际部署落地。来源-x

3. TurboQuant 以极致压缩重新定义 AI 效率

Google Research 发布 TurboQuant，这是一种旨在在保持精度的前提下，大幅缩减 AI 模型体积和算力需求的压缩方法。该技术面向大规模 AI 推理任务，可实现更快速的推理速度和更低的硬件要求，标志着效率方面的一项重大进展，可能重塑大规模部署的成本与形态。来源-rss

📰 重点报道

Open Source & Tools

Mistral Voxtral TTS：开放权重、多语言、超高速 — Voxtral TTS 是一款开放权重的文本转语音模型，面向 9 种语言生成自然且富有表现力的语音，具备超低延迟，并易于适配新声音；有望降低端侧 TTS 的使用门槛，不过在授权协议和实际部署层面仍有需要权衡之处。来源-x
Chroma Context-1：20B 搜索智能体，更快更便宜 — 这是一款拥有 200 亿参数的搜索智能体，在速度和成本上实现了数量级的优化，同时以 Apache 2.0 协议开源，并新增了 HLS 播放等功能；是面向大众、功能强大的智能体工具的一次重要进步。来源-x

AI Agents & Multi-Agent Systems

OpenAI 支持的 Isara，可协同 2000 个 AI 智能体 — 在 OpenAI 支持下，Isara 旨在协调数千个 AI 智能体以解决复杂问题（例如市场预测）；其最新融资为 9400 万美元，公司估值达到 6.5 亿美元，显示出金融领域对多智能体协作工具的重视程度正在不断提升。来源-x

AI Tools & Integrations

Claude Code 云端 PR 自动修复功能上线 — Auto-fix 现可在云端运行，PR 会自动跟踪 Web 与移动端会话，修复 CI 失败并响应评审意见，从而在远程环境下持续保持 PR 状态为“通过”。来源-x
Codex 插件上线；现已支持 Slack、Figma、Notion、Gmail — Codex 现可与多款主流工具互操作，帮助开发者简化日常工作流，并进一步加深 Codex 与日常使用工具的集成度。来源-x

AI Safety

Strix 开源 AI“黑客”自动扫描并修复漏洞 — Strix 部署了可自主运行的“黑客”智能体，能够执行代码、发现漏洞，并通过 PoC 进行验证，可与 GitHub Actions 集成，对 PR 进行安全扫描并在代码上线前自动修复不安全实现。来源-github

Hardware & Inference

Qwen 3.5 27B 在 B200 GPU 上达到 110 万 tokens/s — 这款 270 亿参数的稠密模型在使用 12 个节点、共 96 张 B200 GPU，并基于 vLLM 的条件下，实现了每秒 1,103,941 tokens 的生成速度，多项优化措施帮助其在不依赖自定义内核的前提下仍然保持高效推理。来源-reddit

⚡ 快讯速览

RotorQuant：Clifford Rotors 让 TurboQuant 加速 10–19 倍 — 一种基于旋量（rotor）的方案，声称在 TurboQuant 相关任务上可实现 10–19 倍的加速。来源-reddit
NVIDIA gpt-oss-puzzle-88B 提升 H100 推理效率 — 一款开源模型“谜题”据称可以改进 H100 上的推理性能表现。来源-reddit
在 5090 上用一天时间训练的 George Costanza LTX 2.3 LoRA 模型 — 使用 LoRA 在家中快速训练特定人物角色模型，实现一天内完成训练的个性化实践案例。来源-x
ComfyUI 推出本地模型动态 VRAM 优化 — 新增的动态显存管理能力显著改进了本地模型使用体验。来源-x
我做了一个 MCP，先标记已知 Bug 再给 Claude 看 — 一个自定义的机器检查协议，用于在 Claude 输出前预先过滤已知问题与缺陷。来源-reddit
CUA-Suite：用海量视频示例增强 CUA 数据 — 针对对话式 AI 智能体扩展了大规模视频示例，用于改进评测表现和任务理解能力。来源-huggingface
DA-Flow：面向退化感知的扩散式光流估计模型 — 提出一种基于扩散模型的退化感知光流方法，能够在存在退化的场景中更准确地估计光流。来源-huggingface
AI 用户被幻觉“毁掉生活”：真实影响曝光 — 《卫报》报道了由 AI 误导信息引发的现实世界伤害案例。来源-rss
BerriAI litellm：用 Python SDK 访问 100+ 个 LLM — 一款 Python SDK，可统一访问超过 100 个不同的大语言模型。来源-github
TypeScript 编写的网站 LLM 结果稳健抽取工具 — 用于稳健地抽取网页内容中的 LLM 结果的工具库。来源-github
基于纯文本的 Claude Code 认知架构方案 — 一种为 Claude Code 设计的认知架构实践，强调用纯文本构建结构化思维与流程。来源-rss
Optio：在 Kubernetes 中编排 AI 编码智能体，从工单到 PR 全流程自动化 — 在 Kubernetes 集群内编排 AI 编码智能体，实现从任务工单到 Pull Request 的端到端开发流水线。来源-github
Ensu：Ente 推出本地 LLM 应用 — Ente 发布本地运行的大语言模型应用，为隐私和离线使用场景提供支持。来源-rss
迪士尼退出 OpenAI 合作，Sora 项目被关停 — 报道聚焦 OpenAI 与媒体/娱乐行业合作关系的最新变动及 Sora 视频应用的终止。来源-rss
Cohere 发布 20 亿参数开源转录模型 — Cohere 推出一款 20 亿参数的开源语音转文本模型，用于转录任务。来源-reddit
Mistralai Voxtral-4B-TTS-2603 登陆 Hugging Face — Voxtral-4B-TTS 模型面向社区开放发布，可用于文本转语音应用。来源-reddit
Claude 在高峰时段调整会话上限 — Claude 的会话配额将根据需求高低动态调整，以应对峰值访问压力。来源-x
AI 硬件速览：CPU、GPU、TPU、NPU、LPU 可视化对比 — 一份对多类 AI 加速硬件进行直观对比的图解指南。来源-x
我们用 AI 一天重写 JSONata，每年节省 50 万美元 — 一则关于借助 AI 重写 JSONata 的实践案例研究，展示了显著的成本节省效果。来源-rss
纽约市医院停止使用 Palantir，后者继续在英国扩张 — 报道指出，纽约市医院逐步停用 Palantir 的同时，其在英国的业务仍在扩大。来源-rss
Claude Subconscious 为 Claude Code 增加记忆与引导功能 — 这一新补丁为 Claude Code 引入了“潜意识”机制，引入更长期的记忆与引导能力。来源-github
多数 Claude 输出出现在 GitHub 低星仓库中 — 分析显示，Claude 生成的代码或内容更多被用于评分较低的代码仓库。来源-rss
提示：单用户运行 llama-server 时使用 -np 1 提升效率 — 面向单用户场景，对 Llama Server 使用 -np 1 参数的实用性能优化建议。来源-reddit
《拯救蜜蜂计划》项目中的 AI 艺术与 Claude 使用统计 — 报道展示了某媒体项目中利用 Claude 进行 AI 艺术生成的相关使用数据与统计。来源-reddit
Claude 成为 OpenAI 仓库第三大贡献者 — Claude 在 OpenAI 某代码仓库的贡献榜中升至第三位。来源-x
“我试图证明自己不是 AI，姑妈仍不信” — 一则关于现实生活中，人类在社交场景里试图证明自己不是 AI 却仍遭怀疑的故事，折射人机辨识的难题。来源-rss

由 AI News Agent 生成 | 2026-03-26