AI 日报 — 2026-03-13

Meta 将 DeepSeek 扩展到 5 万亿参数的设想，引发批评 · Morgan Stanley：2026 年初或将迎来 AI 巨幅突破 · Anthropic 在 Claude 4.6 ...

共收录 42 条 AI 新闻

🔥 今日焦点

1. Meta 将 DeepSeek 扩展到 5 万亿参数的设想，引发批评

一篇有影响力的、聚焦 Meta 的帖子认为，Meta 本应遵循 DeepSeek 的路线：把模型规模扩展到 5 万亿参数，配合海量算力和数据训练，然后再蒸馏为更小的模型。帖子描述了“把强化学习训练到极限”的方案，并推演出通过蒸馏出 30B、100B 和 500B 不同规模变体来实现盈利，同时批评 Meta 的 Avocado 模型推出缓慢且表现不佳。来源-x

2. Morgan Stanley：2026 年初或将迎来 AI 巨幅突破

Morgan Stanley 警示称，由美国实验室前所未有的算力扩张推动，一次巨大的 AI 能力跃迁可能在 2026 年初到来。该发展一方面可能带来快速的生产力提升，另一方面也会在“智能”成为关键经济资源的过程中，引发就业被取代和电力短缺等问题。来源-x

3. Anthropic 在 Claude 4.6 开放 100 万 Token 上下文且不再额外收费

Anthropic 宣布，更长的上下文窗口将不再额外收费，模型现在最多可处理 1,000,000 token 的上下文。这个 100 万上下文能力现已在 Claude Opus 4.6 和 Claude Sonnet 4.6 中全面开放，让大规模长文处理能力在不增加成本的情况下得到扩展。来源-x

📰 重点报道

开源与代码

RTX-5090 上 QWEN 3.5-27B 实测约 2000 TPS — 有基准测试报告称，在 RTX-5090 上运行 QWEN 3.5-27B 时，吞吐量可达每秒约 2000 次事务，同时指出性能高度依赖具体负载，且在无缓存测试下结果可能有较大波动。来源-reddit
14B 模型在 Ada 代码生成上击败 Claude Opus 4.6 — 通过 QLoRA 微调 Qwen2.5-Coder-14B-Instruct，在 Ada 代码生成任务上的表现据称超过 Claude Opus 4.6，标志着开源模型在代码生成任务上的新进展。来源-reddit

行业与硬件

加入 SpaceX 与 xAI，与 Elon Musk 共建超级智能 — 一位开发者宣布加入 SpaceX 和 xAI，将与 Elon Musk 紧密合作，参与前沿规模 AI 研发，强调硬件与数字智能的协同，以及高自主性（high-agency）的组织文化。来源-x
AI 算力的三大瓶颈：逻辑、存储与能耗 — 一篇深度分析文章指出了扩展 AI 算力面临的三大核心瓶颈，并从经济与供应链角度，讨论了实验室、大型云厂商、代工厂和半导体设备商在其中的角色与约束。来源-x
Lemonade v10 新增 Linux NPU 支持与多模态能力 — Lemonade v10 扩展支持到 Linux 平台，引入 NPU 支持，并将多模态工具整合到统一的基础 URL 下，强调跨平台可移植性与本地 AI 应用生态。来源-reddit
Perplexity Computer 推出移动端与跨设备同步 — Perplexity 现已支持移动端使用并具备跨设备同步功能；iOS 已上线，Android 即将推出，使用户能在多设备间无缝管理任务。来源-x

工具与平台

用手机在笔记本上启动 Claude Code 会话 — Claude Code 现在支持通过移动端应用的远程控制功能，在本地笔记本上发起会话；该功能已支持 Team/Enterprise（版本 ≥ 2.1.74），目标是显著加快会话启动速度。来源-x
Claude Code：本地笔记本会话与移动优先工作流增强 — 更新除了加速会话启动外，还预告了即将到来的 GitHub 集成，用于在移动端编排开发工作流。来源-x
Anthropic 在 Claude 4.6 开放 100 万 Token 上下文 — 不额外收费的上下文窗口扩展，显著提升了 Claude Opus 4.6 和 Sonnet 4.6 在长文任务中的能力与性价比。来源-x
Grok Imagine 将 7 张图片转换为视频 — Grok Imagine 新增将一组图片转化为视频的能力，拓展了多模态叙事与创作的场景与形式。来源-x

⚡ 快讯速览

首家云厂商部署 NVIDIA Vera Rubin NVL72 做验证 — 云端部署开始对 Vera Rubin NVL72 在 AI 工作负载上的表现进行验证测试。来源-x
Spatial-TTT 利用测试时训练推动流式视觉空间智能 — 探索在流式视觉-空间 AI 任务中使用测试时自适应（test-time training）的新方法。来源-huggingface
MADQA 基准测试多模态文档智能体的战略推理能力 — MADQA 用于评估多模态文档智能体在战略性推理任务上的表现。来源-huggingface
IndexCache 通过跨层索引复用加速稀疏注意力 — IndexCache 通过在网络不同层之间复用索引，优化稀疏注意力工作负载的效率。来源-huggingface
基于视频的奖励建模，用于电脑操作类智能体 — 利用视频信号进行奖励建模，用于训练能操作电脑界面的智能体。来源-huggingface
DreamVideo-Omni 支持多主体、全局运动的视频定制化 — DreamVideo-Omni 实现多主体视频内容的全局运动定制生成。来源-huggingface
Context Gateway 在 LLM 推理前压缩智能体上下文 — 通过对上下文进行压缩，减少输入规模、加速大模型推理。来源-github
Spine Swarm：AI 智能体在共享画布上协作 — 多个 AI 智能体在同一可视化画布上协同完成任务。来源-rss
《Can I Run AI Locally?》本地推理实践指南 — 面向用户的本地 AI 推理实践与部署指南。来源-rss
OpenRAG 发布面向文档的 AI 驱动 RAG 平台 — OpenRAG 提供以文档检索增强生成（RAG）为核心的新平台。来源-github
Microsoft BitNet：1-bit LLM 推理框架加速 CPU — BitNet 通过 1-bit 推理框架提升基于 CPU 的大模型推理速度。来源-github
美国田纳西州祖母因 AI 人脸识别错误被拘留 — 报道一起由 AI 人脸识别误判导致的身份错误匹配，将一位祖母与诈骗案错误关联。来源-rss
无辜女性因 AI 人脸识别误判被关押数月 — 详述一名无辜女性因 AI 人脸识别错误匹配，在北达科他州诈骗案中被错关数月的案例。来源-rss
命令行是 AI 智能体的关键接口（第二部分） — 讨论命令行（CLI）是否应成为 AI 智能体的主要交互界面。来源-reddit
Claude 的交互式图表 UI 因易用性获赞 — Claude 新增的交互式图表界面因用户友好、易于操作而受到好评。来源-x
Prompt 缓存自动插入 Anthropic 断点，可节省 90% Token — Prompt 缓存技术显著减少 Token 使用量，据称可节省约 90%。来源-rss
亚马逊员工称 AI 反而加重工作量，研究予以证实 — 一项研究印证了亚马逊员工的担忧：AI 的引入并未减轻负担，反而增加了工作量。来源-rss
OneCLI：用 Rust 编写的 AI 智能体“保险库”工具 — 基于 Rust 的工具，用于管理 AI 智能体的密钥、配置和相关资源。来源-github
Claude 现可创建交互式图表、流程图和可视化内容 — Claude 新增可生成交互式图表、示意图和其他可视化内容的能力。来源-rss
Atlassian CEO：AI 不会取代员工，但裁员仍在继续 — CEO 在谈及 AI 采用时声称不会用 AI 取代员工，但公司仍在推进裁员，引发外界关注。来源-rss
盲人用户寻求可与 Claude Code、Codex 媲美的本地 LLM — 无障碍场景下，对高质量本地大模型替代方案的需求日益迫切。来源-reddit
为什么我们还没有小型 SOTA 级别的代码模型？ — 社区讨论为何难以出现参数规模较小却能媲美 SOTA 的代码模型。来源-reddit
非中文大模型中目前有哪些仍具竞争力？Reddit 讨论 — Reddit 上关于当前仍具相关性的非中文 LLM 的讨论。来源-reddit
用 OpenAPI 将一万条 API 端点统一到一个 CLI 工具中 — 利用 OpenAPI，将 10,000 个 API 端点统一封装为一个命令行工具的实践分享。来源-reddit
Chipotle 的免费客服机器人与 Claude Code 成本分析 — 探讨基于 Claude 搭建客服机器人的成本与性能权衡。来源-x
Grok Imagine 将 7 张图片转换为视频 — Grok Imagine 能将七张图片组合生成视频内容，扩展图片到视频的创作能力。来源-x

由 AI News Agent 自动生成 | 2026-03-13