AI 日报 — 2026-03-24

Litellm PyPI 供应链攻击窃取机密信息 · OpenAI Foundation 将投入 10 亿美元用于 AI 韧性与安全 · MiniMind：两小时训练 2600 万参数 GPT

覆盖 39 条 AI 新闻

🔥 今日焦点

1. Litellm PyPI 供应链攻击窃取机密信息

一名攻击者向 PyPI 上传了带有恶意代码的 litellm 版本，只需一个简单的 pip install 就能窃取 SSH 密钥、云端凭证、Kubernetes 配置、git 凭证、环境变量以及其他秘密信息。LiteLLM 每月约有 9700 万次下载，大量项目又将 litellm 作为传递依赖（例如 dspy），这意味着潜在暴露面极其巨大。被投毒的包在线时间不足一小时，而一次漏洞意外触发了发现：当 Cursor 中的一个 MCP 插件导致 litellm 安装并耗尽内存时，才暴露问题——否则可能会被延迟发现数天甚至数周。来源-x

2. OpenAI Foundation 将投入 10 亿美元用于 AI 韧性与安全

OpenAI 的 Foundation 计划在未来一年至少投资 10 亿美元，以推动由 AI 驱动的科学进展，并应对 AI 带来的社会风险。该计划将聚焦新型生物威胁、快速的经济变迁，以及高能力模型引发的复杂涌现效应等领域，Wojciech Zaremba 将出任 AI Resilience（AI 韧性）负责人。来源-x

3. MiniMind：两小时训练 2600 万参数 GPT

开源项目 MiniMind 声称，仅用一块 NVIDIA 3090、花费约 3 美元，就能从零开始在两小时内训练出一个 2600 万参数的 GPT 模型。该项目提供大语言模型完整工作流的端到端代码，包括 MoE、数据清洗、预训练、监督微调、LoRA、直接策略优化、强化学习训练（RLAIF：PPO/GRPO）以及模型蒸馏，全部使用 PyTorch 实现且不依赖第三方抽象框架。它还扩展到多模态版本 MiniMind-V，目标是进一步大众化 AI 开发门槛。来源-github

📰 重点报道

LLM / 开源 / 多模态

MolmoWeb-8B 在多模态任务上超越 SoM 开源模型 — 开源多模态模型 MolmoWeb-8B 在多项任务中取得当前最先进效果，性能优于其他开源权重模型，甚至超过基于更大模型构建的 SoM（System of Models）智能体，表明开源架构在多模态方向上正明显追赶。来源-reddit
LongCat-Flash-Prover 推进 Lean4 中的原生形式化推理 — 一个 5600 亿参数的 Mixture-of-Experts（专家混合）模型在 Lean4 中显著推进了原生形式化推理，支持自动形式化、证明草图生成和定理证明，并提出 Hybrid-Experts Iteration Framework，用于在 Lean4 内扩展高质量任务轨迹。来源-huggingface

AI 效率 / LLM 缓存

TurboQuant：将 LLM 缓存压缩 6 倍、速度提升 8 倍且零精度损失 — Google 的 TurboQuant 技术用于压缩 LLM 的键值缓存，可在不损失精度的前提下，实现至少 6 倍内存占用缩减、最高 8 倍推理速度提升，大幅提高模型部署效率。来源-x

具身智能 / 机器人

完全自主机器人从像素推理驱动 30 个电机 — 一个自主机器人可以直接从摄像头像素进行推理，计算控制 30 多个电机的力矩，展示了具身 AI 领域的显著进展以及产业界对这一方向的浓厚兴趣。来源-x

基准 / 世界模型

Omni-WorldBench 以 4D 评估重新定义世界模型 — 该论文主张对基于视频的世界模型进行“四维”评估，即同时建模空间结构与时间演化，并提出 Omni-WorldBench 基准，用于评估模型在动态、多模态场景下的整体性能。来源-huggingface

设计工具 / AI 智能体

Figma 发布 use_figma MCP，让 AI 智能体在画布上直接设计 — Figma 开放 use_figma MCP 的公测，支持 AI 智能体直接在画布上进行设计，并通过交互学习设计技能，以构建 AI 辅助设计工作流。来源-x

AI 安全 / 多智能体 / 工具

Anthropic 为 Claude 提供多智能体框架以增强前端设计能力 — Anthropic 详细介绍了一个多智能体框架，用于增强 Claude 在前端设计以及长时间自主软件工程任务中的能力，强调提高系统的可靠性与可控性。来源-x

⚡ 快讯速览

Moda 融资 750 万美元，用于打造具备“品味”的设计智能体 — 一款 AI 辅助设计智能体完成种子轮融资。来源-x
Claude 在 Minecraft 中因“砍木头任务”溺水身亡 — 一名 AI 助手在完成简单游戏任务时仍然表现不佳，凸显现实世界能力的局限性。来源-x
daVinci-MagiHuman：单流式音视频生成模型 — 发布新的单流式音频-视频生成模型。来源-huggingface
利用高分辨率裁剪提升视觉-语言模型效率 — 通过高分辨率图像裁剪来提升视觉-语言模型的效率。来源-huggingface
OpenResearcher：面向长周期研究轨迹的全开源流水线 — 发布用于构建长周期 AI 研究轨迹的开源流水线。来源-huggingface
Hypura：面向 Apple Silicon 的存储层感知型 LLM 推理调度器 — 探索在 Apple Silicon 上进行节能型 LLM 调度。来源-github
Gemini Embedding 2 实现亚秒级视频搜索 — 借助 Gemini 向量嵌入实现更快速的视频检索。来源-github
Hermes Agent：内置自学习循环的自改进 AI — 一个带有内置学习闭环的自改进 AI 框架。来源-github
ProofShot 让 AI 编码智能体可实时验证 UI — 为 AI 驱动的编码智能体提供 UI 实时验证工具。来源-github
Reka AI 举办关于边缘模型与研究方向的 AMA — 围绕边缘模型和未来研究路线的在线问答活动。来源-reddit
GigaChat-3.1 Ultra 702B 与 Lightning 10B 开放权重发布 — 发布大规模聊天模型的开放权重版本。来源-reddit
Omnicoder v2 发布，早期性能已有提升 — Omnicoder v2 在早期版本中即展现出性能改进。来源-reddit
征集从零构建 AI 智能体的深度学习资料 — 社区呼吁整理系统化、深入的 AI 智能体构建资源。来源-reddit
Hark：新 AI 实验室致力于打造“最先进的个人智能” — 一家新成立的 AI 实验室专注于个人智能领域。来源-x
Anthropic Index：Claude 使用效果会随用户资历提升 — 数据显示，Claude 的使用效果与用户使用时长呈正相关。来源-x
Claude Code 自动模式在权限处理上内置安全保护 — Claude 的自动编码模式在处理权限操作时加入了多重安全机制。来源-x
Sakana Chat 在日本免费公测上线 — Sakana Chat 在日本面向公众开放。来源-x
Cursor AI 发布 Composer 2 训练技术报告 — 官方公开 Composer 2 的训练技术细节报告。来源-x
Disney 在 OpenAI 关闭 Sora 后退出合作协议 — OpenAI 停止 Sora 视频应用后，Disney 终止双方合作。来源-rss
tinygrad：介于 PyTorch 和 Micrograd 之间的微型深度学习栈 — 引入一个轻量级 TinyDL 技术栈。来源-github
LLM Neuroanatomy II：现代 LLM 攻防与“通用语言”线索 — 探索现代大模型的攻击/分析方法及其是否存在某种“通用语言”的证据。来源-rss
CQ 立志成为 AI 编码智能体的 Stack Overflow — CQ 旨在为 AI 智能体提供类似 Stack Overflow 的知识问答平台。来源-rss
SillyTavern 扩展让任何游戏中的 NPC“活”起来 — 相关扩展为游戏中的 NPC 带来更拟人的行为与对话。来源-reddit
首个 AI 辅助的 Pull Request 已被创建 — 一篇示例展示了自己完成首个 AI 辅助 PR 的经历。来源-rss
Chat GPT 5.2 无法解释德语单词“Geschniegelt” — 该语言模型在解释一个德语词汇时表现欠佳。来源-reddit
Microslops 证实 LM Studio 恶意软件警报为误报 — 围绕 LM Studio 的恶意软件告警被确认只是误报。来源-reddit
寻找能在 32MB 显存上击败 Claude Opus 的 AI 模型 — 有用户发起“在超低显存环境中超越 Claude Opus”的模型征集讨论。来源-reddit
LM Studio 需多步手动操作，用户希望实现本地自动化运行 — 用户寻求将 LM Studio 工作流自动化，以减少手动步骤。来源-reddit
黄仁勋称 Meek Mill 将用 AI 抢走工作 — 一则关于 AI 对就业影响的行业言论引发关注。来源-x

由 AI News Agent 生成 | 2026-03-24