AI 日报 — 2026-04-20

Kimi K2.6 以 Agent Swarms 推进开源编程能力 · Anthropic 将 Claude 在 Amazon 的算力合作扩展至 5 GW · Qwen3.6-Max-Previ...

涵盖 24 条 AI 新闻

🔥 今日焦点

1. Kimi K2.6 以 Agent Swarms 推进开源编程能力

Kimi 宣布推出 K2.6，这是一款在长周期任务上达到先进水平的开源编程 AI，单次运行可在 12 小时以上完成 4,000+ 次工具调用，并支持 300 个并行子 Agent。它通过 OpenClaw 和 Hermes 支持 24/7 全自动运行，并引入用于协同控制的 Claw Groups，同时在对话和 Agent 模式中都提供可用于生产环境的 Kimi Code。这有望重塑开源 AI 工具链和复杂编程工作流，拓展自动化软件生成的可行边界。来源-x

2. Anthropic 将 Claude 在 Amazon 的算力合作扩展至 5 GW

Anthropic 扩大与 AWS 的合作，为 Claude 的训练与部署锁定最高 5 吉瓦（gigawatts）的算力容量，部分算力将在本季度上线，预计到 2026 年底将接近 1 吉瓦。该协议凸显 Claude 在云端的大规模部署需求，并加深 AWS 在企业级 AI 负载中的角色，可能在成本、能耗以及云端 AI 竞争格局上产生重要影响。来源-x

3. Qwen3.6-Max-Preview：下一代旗舰 AI 的早期预览

阿里巴巴的 Qwen 团队发布了即将到来的旗舰模型 Qwen3.6-Max-Preview 的早期预览版。亮点包括相比 Qwen3.6-Plus 更强的 Agent 式编程能力、更扎实的世界知识与指令遵循能力，以及在真实场景中更可靠的 Agent 表现，同时更多 Qwen3.6 系列模型也即将推出。这为旗舰级大模型设定了更高门槛，并释放出更重视工具集成与可靠性的强烈信号。来源-x

📰 重点报道

AI Safety

Gemma-4-E2B 的安全过滤限制紧急场景使用 — 一则 Reddit 帖子称，Gemma-4-E2B 的离线安全过滤会阻止关键的应急指导信息，从而在无法上网时削弱其实用的生存信息获取能力。来源-reddit
Yann LeCun 被警告：生成式 AI 可能是一条死路 — 讨论围绕 JEPA 和表征坍塌（representation collapse）的风险，主张应探索超越单纯扩大 LLM 规模的新架构。来源-x

Open Source & Community

Hugging Face 在东京开设办公室以推动日本开源 AI 发展 — 东京办公室旨在促进本地协作，并扩大对开源 AI 工具的可及性。来源-x

Research & Tools

Chronicle in Codex 利用屏幕上下文扩展记忆能力 — OpenAI 预览了 Chronicle in Codex，可基于用户日常电脑操作构建记忆，以辅助未来任务；目前向 PRO 订阅用户开放，仍处于早期阶段且消耗大量 token。来源-x
在 MacBook Air M5 上对 21 个本地 LLM 进行代码与速度评测 — 一项独立评测在 MacBook Air M5 上比较了 21 个本地 LLM 的代码质量与推理速度，并给出包含分数和显存占用的完整表格。来源-reddit

Industry & Benchmarks

Opus 4.7 在文本与图像上使用的 tokens 多于 4.6 — 在文本和图像两种模态下，Opus 4.7 的 token 使用量都更高，这意味着在分词器谱系相似的情况下，每个 token 的总体成本可能更高。来源-x
Arun Maini：Claude 碾压 Gemini 和 ChatGPT — 一则社交媒体观点称 Claude 领先于 Gemini 和 ChatGPT，进一步加剧了围绕各家模型评测结果的争议。来源-x

⚡ 快讯速览

Data-Free Bit-Flip Attacks Disrupt Neural Networks Across Domains — 展示了无需数据的 bit-flip 攻击在不同模型家族中的通用脆弱性。来源-huggingface
PersonaVLM Enables Long-Term Personalized Multimodal LLMs — 支持在多模态交互中实现长期持久的用户个性化能力。来源-huggingface
Teacher-Student Framework Improves SFT for Reasoning Models — 通过教师–学生框架提升推理类模型在监督微调（SFT）中的效果。来源-huggingface
RuView Enables Real-Time Human Pose Estimation from WiFi — 利用无源无线信号实现实时人体姿态估计。来源-github
Autonomous 7900XTX AI builds Android app with Qwen 3.6 — 使用本地 LLM 搭建的环境，基于 Qwen 3.6 自主构建 Android 应用。来源-reddit
Qwen MoEs Struggle to Follow Strict Rules on 4x RTX 3090 — 在 4 张 RTX 3090 的有限硬件条件下，Qwen MoE 变体在严格规则遵循方面表现吃力。来源-reddit
Anthropic launches STEM Fellows Program to accelerate science and engineering — Anthropic 启动 STEM Fellows 项目，以拓宽科学与工程人才进入前沿 AI 领域的路径。来源-x
Unraveling SNR-t Bias in Diffusion Probabilistic Models — 分析扩散概率模型中的信噪比（SNR-t）偏差问题。来源-huggingface
Qwen3-Reranker Drives Semantic Combat in Entropedia — 探索在 Entropedia 中使用 Qwen3-Reranker 进行语义比较与战斗机制设计。来源-reddit
JAX Team Urges Focus on Math and Hardware Over Tools — 倡导把重心放在数学与硬件基础上，而非流行工具链。来源-x
AI Outcodes Humans in Coding, Morning Bathrobe Rant — 一则“穿着晨袍”式的个人长文感慨：AI 在编程上已逐渐超越人类。来源-x
Sonnet costs more than GPT-5.4, pricing quip — 简短调侃，提到 Sonnet 的价格高于 GPT-5.4。来源-x
OSS tools overlook llama.cpp as first-class provider — 讨论当前开源工具链中没有将 llama.cpp 视作一等公民提供方的问题。来源-reddit
Dialing in Bot Personalities: Efficiency, Sycophancy, Friendship — 围绕如何在效率、谄媚程度与“陪伴感”之间调整机器人性格进行讨论。来源-reddit

由 AI News Agent 生成 | 2026-04-20