AI 日报 — 2026-03-30

Qwen3.5-Omni 发布原生 Omni-Modal AGI · ARC-AGI-3 基准：AI 在全新环境中得分接近零 · 在 MacBook 上跑 397B Qwen3.5：无云端，纯 ...

共收录 39 条 AI 新闻

🔥 今日焦点

阿里巴巴的 Qwen3.5-Omni 推出了一款原生 omni-modal（全模态）AI，能够进行文本、图像、音频和视频理解，并支持实时交互。其引入 Audio-Visual Vibe Coding，可从视觉信息生成网站或游戏，自称在音频-视觉性能上达到 SOTA，并支持长时媒体、多语种以及细粒度语音控制。这标志着向完全集成的多模态技术栈转型，可能改变企业级 AI 采纳的竞争格局。来源-x

2. ARC-AGI-3 基准：AI 在全新环境中得分接近零

François Chollet 的 ARC-AGI-3 引入了 135 个全新的游戏环境，没有任何说明或任务目标，需要实时探索与适应。未经训练的人类可以解出所有环境，而顶尖 AI 模型得分不到 1%，凸显出严重的泛化能力差距，以及在稳健的、无指令通用智能方面的持续挑战。回到 ARC-AGI-3 这一版本强调了当前系统距离灵活的真实世界适应性还有多遥远。来源-x

3. 在 MacBook 上跑 397B Qwen3.5：无云端，纯 C/Metal

一位 AI 工程师展示了在一台配备 48GB 内存的 MacBook Pro 上运行 3970 亿参数模型（Qwen3.5-397B），使用纯 C/Metal 推理引擎（flash-moe），完全不依赖云端、GPU 或 Python。系统从 SSD 流式读取 209GB 的模型，每个 token 只加载 512 个专家中的 4 个，活动内存使用约 5.5GB，在支持完整工具调用的同时实现 4.4 token/秒的速度。这一成果突显了消费级硬件在本地部署 AI 负载方面惊人的潜力。来源-x

📰 重点报道

Open Source & Embeddings

Microsoft Harrier OSS 多语言 Embedding 模型（27B/0.6B/270M） — Harrier OSS v1 提供多语言 decoder-only 文本嵌入模型，使用最后一个 token 池化和 L2 归一化，可用于检索、聚类、语义相似度、分类等任务；发布时号称在 Multilingual MTEB v2 上达到 SOTA 水平。来源-reddit
基于 Claude 蒸馏微调的 Qwen3.5-27B，本地推理可用 — 基于 Claude-4.6-Opus 蒸馏数据微调的 Qwen3.5-27B 提升了推理能力；在 16GB（4-bit）或 32GB（8-bit）硬件上可本地运行，并已在 HuggingFace 发布。来源-x

Tools & Interfaces

Claude Code 新增计算机使用能力以实现 UI 自动化 — Claude Code 现在支持“使用电脑”能力，可以打开应用、点击操作 UI，并从命令行测试构建；目前在 Pro 和 Max 方案中以研究预览形式开放。来源-x
通过新插件在 Claude Code 中使用 Codex — Anthropic 的 Claude Code 通过插件市场新条目（openai/codex-plugin-cc）接入 OpenAI Codex，支持 /codex:review、/codex:adversarial-review 等命令。来源-x

AI Safety & Research

斯坦福与哈佛发布令人不安的 AI 论文 — 一条 Reddit 帖子关注了斯坦福与哈佛在 arXiv 上的预印本（2602.20021），被描述为“今年最令人不安的 AI 论文”，并讨论了其更广泛的影响。来源-reddit

Benchmarks & Frontier Models

Opus 在 Cursor 基准中比 Claude Code 高 20% — 在一项前沿模型基准中，Cursor 的表现优于 Claude Code 和其他工具；Opus 从 77% 提升到 93%，GPT-5.4 从 82% 提升到 88%，Gemini 从 52% 提升到 57%，评测维度是 100 个功能点的 PRD 指标。来源-x

Multimodal & Vision

Hybrid Memory 让视频世界模型能在遮挡下追踪目标 — 提出 Hybrid Memory，一种用于视频世界模型的记忆架构，在保留静态背景的同时跟踪动态目标，以避免主体在画面中“消失”，旨在提升长时视频理解能力。来源-huggingface

（注：39 条统计包含本期的重点报道与快讯速览。）

⚡ 快讯速览

ShotStream 支持实时交互式多镜头视频生成 — 通过 ShotStream 实现实时交互式视频生成。来源-huggingface
Claude Code 最佳实践开源指南发布 — 一份 Claude Code 最佳实践指南现已公开发布。来源-github
HJB 方程串联起强化学习与 Diffusion 模型 — 讨论如何通过 HJB 将强化学习与扩散模型联系起来。来源-rss
AI 将工作拆分为低薪碎片，而非直接消灭岗位 — 分析指出，AI 更倾向于重组工作任务，而不是完全消除职位。来源-rss
警方使用 AI 人脸识别错误逮捕北达州一名田纳西女性 — 该案例凸显了带偏见或出错的人脸识别系统的风险。来源-rss
AI 数据中心热潮或演变为 9 万亿美元大泡沫 — 从行业层面评估 AI 基础设施扩张的系统性风险。来源-rss
本地 Qwen3-VL 支持无需转录的语义视频搜索 — 本地运行的 Qwen3-VL 能在无需转录的情况下实现语义视频搜索。来源-reddit
通过 Text-to-SQL 基准测试小型本地与 OpenRouter 模型 — 使用 Text-to-SQL 任务对本地模型进行基准评估。来源-reddit
llama.cpp 在 Apple Silicon 上接入 Apple ANE 后端 — Apple Neural Engine 后端为 Apple Silicon 上的 llama.cpp 带来更高性能。来源-reddit
llama.cpp 斩获 10 万 Star — llama.cpp 在社区采用度上达成重要里程碑。来源-reddit
OpenRouter 上出现 Qwen 3.6 Plus 预览版 — 预览发布预示着即将到来的性能改进。来源-reddit
Sakana AI 就新 LLM 系列 Namazu 命名争议致歉 — 围绕 LLM 产品线命名所产生的一场争议。来源-x
分享一些隐藏但实用的 Claude Code 功能 — 揭示 Claude Code 中一些鲜为人知的功能点。来源-x
Hermes Agent v0.6 新增 HLS 播放支持 — Hermes Agent 新增对 HTTP Live Streaming 播放的支持。来源-x
Boaz Barak 博文：用四张虚构图表审视 AI 安全现状 — 以批判视角审视主流 AI 安全叙事。来源-x
通过实践而非阅读来学习 Claude Code — 一种以实作驱动的 Claude Code 学习方法。来源-rss
AI 重写工程师职级晋升阶梯 — 探讨 AI 如何重塑工程师的职业发展路径。来源-rss
AI 泡沫将如何破裂 — 分析 AI 市场动态与过度乐观可能带来的后果。来源-rss
GitHub 上的 Claude Code 可视化指南 — 一份讲解 Claude Code 用法的图文可视化指南。来源-github
AI 时代的数学方法与人类思维 — 一篇 arXiv 预印本，探讨数学方法与认知在 AI 时代的关系。来源-arxiv
Claude Code 每 10 分钟自动执行 git reset —hard origin/main 重置仓库 — 仓库会定期重置到远程 origin 状态。来源-github
Miasma 让 AI 网络爬虫困在无尽“毒坑”中 — 该项目演示了数据抓取可能遭遇的种种陷阱。来源-github
如果 AI 不需要更多内存，而是需要更好的数学？ — 围绕效率与以数学为中心的 AI 改进展开讨论。来源-rss
AI 时代的前 40 个月：一份回顾 — 对迄今为止 AI 时代的回顾性梳理。来源-rss
关于 TurboQuant 与 RaBitQ 讨论的技术澄清 — 针对模型量化工具的若干技术澄清。来源-reddit
提醒：Claude Code 会破坏本地 KV 缓存；可通过设置修复 — 提供一个修复 Claude Code 缓存问题的实用设置方案。来源-reddit
llamafile v0.10.0 采用新构建系统以兼容 llama.cpp — 为兼容 llama.cpp 而更新构建系统。来源-reddit
首个语言模型可追溯至 1913 年的 Markov — 一则关于语言建模起源的历史小注。来源-x
Claude 的“秘制配方”是什么，为何难以复制？ — 关于 Claude 设计特性的讨论。来源-reddit

由 AI News Agent 生成 | 2026-03-30