AI 日报 — 2026-03-13
Meta 将 DeepSeek 扩展到 5 万亿参数的设想,引发批评 · Morgan Stanley:2026 年初或将迎来 AI 巨幅突破 · Anthropic 在 Claude 4.6 ...
共收录 42 条 AI 新闻
🔥 今日焦点
1. Meta 将 DeepSeek 扩展到 5 万亿参数的设想,引发批评
一篇有影响力的、聚焦 Meta 的帖子认为,Meta 本应遵循 DeepSeek 的路线:把模型规模扩展到 5 万亿参数,配合海量算力和数据训练,然后再蒸馏为更小的模型。帖子描述了“把强化学习训练到极限”的方案,并推演出通过蒸馏出 30B、100B 和 500B 不同规模变体来实现盈利,同时批评 Meta 的 Avocado 模型推出缓慢且表现不佳。 来源-x
2. Morgan Stanley:2026 年初或将迎来 AI 巨幅突破
Morgan Stanley 警示称,由美国实验室前所未有的算力扩张推动,一次巨大的 AI 能力跃迁可能在 2026 年初到来。该发展一方面可能带来快速的生产力提升,另一方面也会在“智能”成为关键经济资源的过程中,引发就业被取代和电力短缺等问题。 来源-x
3. Anthropic 在 Claude 4.6 开放 100 万 Token 上下文且不再额外收费
Anthropic 宣布,更长的上下文窗口将不再额外收费,模型现在最多可处理 1,000,000 token 的上下文。这个 100 万上下文能力现已在 Claude Opus 4.6 和 Claude Sonnet 4.6 中全面开放,让大规模长文处理能力在不增加成本的情况下得到扩展。 来源-x
📰 重点报道
开源与代码
-
RTX-5090 上 QWEN 3.5-27B 实测约 2000 TPS — 有基准测试报告称,在 RTX-5090 上运行 QWEN 3.5-27B 时,吞吐量可达每秒约 2000 次事务,同时指出性能高度依赖具体负载,且在无缓存测试下结果可能有较大波动。 来源-reddit
-
14B 模型在 Ada 代码生成上击败 Claude Opus 4.6 — 通过 QLoRA 微调 Qwen2.5-Coder-14B-Instruct,在 Ada 代码生成任务上的表现据称超过 Claude Opus 4.6,标志着开源模型在代码生成任务上的新进展。 来源-reddit
行业与硬件
-
加入 SpaceX 与 xAI,与 Elon Musk 共建超级智能 — 一位开发者宣布加入 SpaceX 和 xAI,将与 Elon Musk 紧密合作,参与前沿规模 AI 研发,强调硬件与数字智能的协同,以及高自主性(high-agency)的组织文化。 来源-x
-
AI 算力的三大瓶颈:逻辑、存储与能耗 — 一篇深度分析文章指出了扩展 AI 算力面临的三大核心瓶颈,并从经济与供应链角度,讨论了实验室、大型云厂商、代工厂和半导体设备商在其中的角色与约束。 来源-x
-
Lemonade v10 新增 Linux NPU 支持与多模态能力 — Lemonade v10 扩展支持到 Linux 平台,引入 NPU 支持,并将多模态工具整合到统一的基础 URL 下,强调跨平台可移植性与本地 AI 应用生态。 来源-reddit
-
Perplexity Computer 推出移动端与跨设备同步 — Perplexity 现已支持移动端使用并具备跨设备同步功能;iOS 已上线,Android 即将推出,使用户能在多设备间无缝管理任务。 来源-x
工具与平台
-
用手机在笔记本上启动 Claude Code 会话 — Claude Code 现在支持通过移动端应用的远程控制功能,在本地笔记本上发起会话;该功能已支持 Team/Enterprise(版本 ≥ 2.1.74),目标是显著加快会话启动速度。 来源-x
-
Claude Code:本地笔记本会话与移动优先工作流增强 — 更新除了加速会话启动外,还预告了即将到来的 GitHub 集成,用于在移动端编排开发工作流。 来源-x
-
Anthropic 在 Claude 4.6 开放 100 万 Token 上下文 — 不额外收费的上下文窗口扩展,显著提升了 Claude Opus 4.6 和 Sonnet 4.6 在长文任务中的能力与性价比。 来源-x
-
Grok Imagine 将 7 张图片转换为视频 — Grok Imagine 新增将一组图片转化为视频的能力,拓展了多模态叙事与创作的场景与形式。 来源-x
⚡ 快讯速览
-
首家云厂商部署 NVIDIA Vera Rubin NVL72 做验证 — 云端部署开始对 Vera Rubin NVL72 在 AI 工作负载上的表现进行验证测试。 来源-x
-
Spatial-TTT 利用测试时训练推动流式视觉空间智能 — 探索在流式视觉-空间 AI 任务中使用测试时自适应(test-time training)的新方法。 来源-huggingface
-
MADQA 基准测试多模态文档智能体的战略推理能力 — MADQA 用于评估多模态文档智能体在战略性推理任务上的表现。 来源-huggingface
-
IndexCache 通过跨层索引复用加速稀疏注意力 — IndexCache 通过在网络不同层之间复用索引,优化稀疏注意力工作负载的效率。 来源-huggingface
-
基于视频的奖励建模,用于电脑操作类智能体 — 利用视频信号进行奖励建模,用于训练能操作电脑界面的智能体。 来源-huggingface
-
DreamVideo-Omni 支持多主体、全局运动的视频定制化 — DreamVideo-Omni 实现多主体视频内容的全局运动定制生成。 来源-huggingface
-
Context Gateway 在 LLM 推理前压缩智能体上下文 — 通过对上下文进行压缩,减少输入规模、加速大模型推理。 来源-github
-
Spine Swarm:AI 智能体在共享画布上协作 — 多个 AI 智能体在同一可视化画布上协同完成任务。 来源-rss
-
《Can I Run AI Locally?》本地推理实践指南 — 面向用户的本地 AI 推理实践与部署指南。 来源-rss
-
OpenRAG 发布面向文档的 AI 驱动 RAG 平台 — OpenRAG 提供以文档检索增强生成(RAG)为核心的新平台。 来源-github
-
Microsoft BitNet:1-bit LLM 推理框架加速 CPU — BitNet 通过 1-bit 推理框架提升基于 CPU 的大模型推理速度。 来源-github
-
美国田纳西州祖母因 AI 人脸识别错误被拘留 — 报道一起由 AI 人脸识别误判导致的身份错误匹配,将一位祖母与诈骗案错误关联。 来源-rss
-
无辜女性因 AI 人脸识别误判被关押数月 — 详述一名无辜女性因 AI 人脸识别错误匹配,在北达科他州诈骗案中被错关数月的案例。 来源-rss
-
命令行是 AI 智能体的关键接口(第二部分) — 讨论命令行(CLI)是否应成为 AI 智能体的主要交互界面。 来源-reddit
-
Claude 的交互式图表 UI 因易用性获赞 — Claude 新增的交互式图表界面因用户友好、易于操作而受到好评。 来源-x
-
Prompt 缓存自动插入 Anthropic 断点,可节省 90% Token — Prompt 缓存技术显著减少 Token 使用量,据称可节省约 90%。 来源-rss
-
亚马逊员工称 AI 反而加重工作量,研究予以证实 — 一项研究印证了亚马逊员工的担忧:AI 的引入并未减轻负担,反而增加了工作量。 来源-rss
-
OneCLI:用 Rust 编写的 AI 智能体“保险库”工具 — 基于 Rust 的工具,用于管理 AI 智能体的密钥、配置和相关资源。 来源-github
-
Claude 现可创建交互式图表、流程图和可视化内容 — Claude 新增可生成交互式图表、示意图和其他可视化内容的能力。 来源-rss
-
Atlassian CEO:AI 不会取代员工,但裁员仍在继续 — CEO 在谈及 AI 采用时声称不会用 AI 取代员工,但公司仍在推进裁员,引发外界关注。 来源-rss
-
盲人用户寻求可与 Claude Code、Codex 媲美的本地 LLM — 无障碍场景下,对高质量本地大模型替代方案的需求日益迫切。 来源-reddit
-
为什么我们还没有小型 SOTA 级别的代码模型? — 社区讨论为何难以出现参数规模较小却能媲美 SOTA 的代码模型。 来源-reddit
-
非中文大模型中目前有哪些仍具竞争力?Reddit 讨论 — Reddit 上关于当前仍具相关性的非中文 LLM 的讨论。 来源-reddit
-
用 OpenAPI 将一万条 API 端点统一到一个 CLI 工具中 — 利用 OpenAPI,将 10,000 个 API 端点统一封装为一个命令行工具的实践分享。 来源-reddit
-
Chipotle 的免费客服机器人与 Claude Code 成本分析 — 探讨基于 Claude 搭建客服机器人的成本与性能权衡。 来源-x
-
Grok Imagine 将 7 张图片转换为视频 — Grok Imagine 能将七张图片组合生成视频内容,扩展图片到视频的创作能力。 来源-x
由 AI News Agent 自动生成 | 2026-03-13