daily
Mar 24, 2026

AI 日报 — 2026-03-24

中文 English

Litellm PyPI 供应链攻击窃取机密信息 · OpenAI Foundation 将投入 10 亿美元用于 AI 韧性与安全 · MiniMind:两小时训练 2600 万参数 GPT


覆盖 39 条 AI 新闻

🔥 今日焦点

1. Litellm PyPI 供应链攻击窃取机密信息

一名攻击者向 PyPI 上传了带有恶意代码的 litellm 版本,只需一个简单的 pip install 就能窃取 SSH 密钥、云端凭证、Kubernetes 配置、git 凭证、环境变量以及其他秘密信息。LiteLLM 每月约有 9700 万次下载,大量项目又将 litellm 作为传递依赖(例如 dspy),这意味着潜在暴露面极其巨大。被投毒的包在线时间不足一小时,而一次漏洞意外触发了发现:当 Cursor 中的一个 MCP 插件导致 litellm 安装并耗尽内存时,才暴露问题——否则可能会被延迟发现数天甚至数周。来源-x

2. OpenAI Foundation 将投入 10 亿美元用于 AI 韧性与安全

OpenAI 的 Foundation 计划在未来一年至少投资 10 亿美元,以推动由 AI 驱动的科学进展,并应对 AI 带来的社会风险。该计划将聚焦新型生物威胁、快速的经济变迁,以及高能力模型引发的复杂涌现效应等领域,Wojciech Zaremba 将出任 AI Resilience(AI 韧性)负责人。来源-x

3. MiniMind:两小时训练 2600 万参数 GPT

开源项目 MiniMind 声称,仅用一块 NVIDIA 3090、花费约 3 美元,就能从零开始在两小时内训练出一个 2600 万参数的 GPT 模型。该项目提供大语言模型完整工作流的端到端代码,包括 MoE、数据清洗、预训练、监督微调、LoRA、直接策略优化、强化学习训练(RLAIF:PPO/GRPO)以及模型蒸馏,全部使用 PyTorch 实现且不依赖第三方抽象框架。它还扩展到多模态版本 MiniMind-V,目标是进一步大众化 AI 开发门槛。来源-github


📰 重点报道

LLM / 开源 / 多模态

  • MolmoWeb-8B 在多模态任务上超越 SoM 开源模型 — 开源多模态模型 MolmoWeb-8B 在多项任务中取得当前最先进效果,性能优于其他开源权重模型,甚至超过基于更大模型构建的 SoM(System of Models)智能体,表明开源架构在多模态方向上正明显追赶。 来源-reddit

  • LongCat-Flash-Prover 推进 Lean4 中的原生形式化推理 — 一个 5600 亿参数的 Mixture-of-Experts(专家混合)模型在 Lean4 中显著推进了原生形式化推理,支持自动形式化、证明草图生成和定理证明,并提出 Hybrid-Experts Iteration Framework,用于在 Lean4 内扩展高质量任务轨迹。 来源-huggingface

AI 效率 / LLM 缓存

  • TurboQuant:将 LLM 缓存压缩 6 倍、速度提升 8 倍且零精度损失 — Google 的 TurboQuant 技术用于压缩 LLM 的键值缓存,可在不损失精度的前提下,实现至少 6 倍内存占用缩减、最高 8 倍推理速度提升,大幅提高模型部署效率。 来源-x

具身智能 / 机器人

  • 完全自主机器人从像素推理驱动 30 个电机 — 一个自主机器人可以直接从摄像头像素进行推理,计算控制 30 多个电机的力矩,展示了具身 AI 领域的显著进展以及产业界对这一方向的浓厚兴趣。 来源-x

基准 / 世界模型

  • Omni-WorldBench 以 4D 评估重新定义世界模型 — 该论文主张对基于视频的世界模型进行“四维”评估,即同时建模空间结构与时间演化,并提出 Omni-WorldBench 基准,用于评估模型在动态、多模态场景下的整体性能。 来源-huggingface

设计工具 / AI 智能体

  • Figma 发布 use_figma MCP,让 AI 智能体在画布上直接设计 — Figma 开放 use_figma MCP 的公测,支持 AI 智能体直接在画布上进行设计,并通过交互学习设计技能,以构建 AI 辅助设计工作流。 来源-x

AI 安全 / 多智能体 / 工具

  • Anthropic 为 Claude 提供多智能体框架以增强前端设计能力 — Anthropic 详细介绍了一个多智能体框架,用于增强 Claude 在前端设计以及长时间自主软件工程任务中的能力,强调提高系统的可靠性与可控性。 来源-x

⚡ 快讯速览

  • Moda 融资 750 万美元,用于打造具备“品味”的设计智能体 — 一款 AI 辅助设计智能体完成种子轮融资。 来源-x

  • Claude 在 Minecraft 中因“砍木头任务”溺水身亡 — 一名 AI 助手在完成简单游戏任务时仍然表现不佳,凸显现实世界能力的局限性。 来源-x

  • daVinci-MagiHuman:单流式音视频生成模型 — 发布新的单流式音频-视频生成模型。 来源-huggingface

  • 利用高分辨率裁剪提升视觉-语言模型效率 — 通过高分辨率图像裁剪来提升视觉-语言模型的效率。 来源-huggingface

  • OpenResearcher:面向长周期研究轨迹的全开源流水线 — 发布用于构建长周期 AI 研究轨迹的开源流水线。 来源-huggingface

  • Hypura:面向 Apple Silicon 的存储层感知型 LLM 推理调度器 — 探索在 Apple Silicon 上进行节能型 LLM 调度。 来源-github

  • Gemini Embedding 2 实现亚秒级视频搜索 — 借助 Gemini 向量嵌入实现更快速的视频检索。 来源-github

  • Hermes Agent:内置自学习循环的自改进 AI — 一个带有内置学习闭环的自改进 AI 框架。 来源-github

  • ProofShot 让 AI 编码智能体可实时验证 UI — 为 AI 驱动的编码智能体提供 UI 实时验证工具。 来源-github

  • Reka AI 举办关于边缘模型与研究方向的 AMA — 围绕边缘模型和未来研究路线的在线问答活动。 来源-reddit

  • GigaChat-3.1 Ultra 702B 与 Lightning 10B 开放权重发布 — 发布大规模聊天模型的开放权重版本。 来源-reddit

  • Omnicoder v2 发布,早期性能已有提升 — Omnicoder v2 在早期版本中即展现出性能改进。 来源-reddit

  • 征集从零构建 AI 智能体的深度学习资料 — 社区呼吁整理系统化、深入的 AI 智能体构建资源。 来源-reddit

  • Hark:新 AI 实验室致力于打造“最先进的个人智能” — 一家新成立的 AI 实验室专注于个人智能领域。 来源-x

  • Anthropic Index:Claude 使用效果会随用户资历提升 — 数据显示,Claude 的使用效果与用户使用时长呈正相关。 来源-x

  • Claude Code 自动模式在权限处理上内置安全保护 — Claude 的自动编码模式在处理权限操作时加入了多重安全机制。 来源-x

  • Sakana Chat 在日本免费公测上线 — Sakana Chat 在日本面向公众开放。 来源-x

  • Cursor AI 发布 Composer 2 训练技术报告 — 官方公开 Composer 2 的训练技术细节报告。 来源-x

  • Disney 在 OpenAI 关闭 Sora 后退出合作协议 — OpenAI 停止 Sora 视频应用后,Disney 终止双方合作。 来源-rss

  • tinygrad:介于 PyTorch 和 Micrograd 之间的微型深度学习栈 — 引入一个轻量级 TinyDL 技术栈。 来源-github

  • LLM Neuroanatomy II:现代 LLM 攻防与“通用语言”线索 — 探索现代大模型的攻击/分析方法及其是否存在某种“通用语言”的证据。 来源-rss

  • CQ 立志成为 AI 编码智能体的 Stack Overflow — CQ 旨在为 AI 智能体提供类似 Stack Overflow 的知识问答平台。 来源-rss

  • SillyTavern 扩展让任何游戏中的 NPC“活”起来 — 相关扩展为游戏中的 NPC 带来更拟人的行为与对话。 来源-reddit

  • 首个 AI 辅助的 Pull Request 已被创建 — 一篇示例展示了自己完成首个 AI 辅助 PR 的经历。 来源-rss

  • Chat GPT 5.2 无法解释德语单词“Geschniegelt” — 该语言模型在解释一个德语词汇时表现欠佳。 来源-reddit

  • Microslops 证实 LM Studio 恶意软件警报为误报 — 围绕 LM Studio 的恶意软件告警被确认只是误报。 来源-reddit

  • 寻找能在 32MB 显存上击败 Claude Opus 的 AI 模型 — 有用户发起“在超低显存环境中超越 Claude Opus”的模型征集讨论。 来源-reddit

  • LM Studio 需多步手动操作,用户希望实现本地自动化运行 — 用户寻求将 LM Studio 工作流自动化,以减少手动步骤。 来源-reddit

  • 黄仁勋称 Meek Mill 将用 AI 抢走工作 — 一则关于 AI 对就业影响的行业言论引发关注。 来源-x


由 AI News Agent 生成 | 2026-03-24