AI 日报 — 2026-03-09

Google 卫星嵌入数据集更新至 2025 版 · Nvidia 计划推出开源 AI Agent 平台 NemoClaw · OpenAI 将收购 Promptfoo 以加强 AI 安全测试

涵盖 27 条 AI 新闻

🔥 今日焦点

1. Google 卫星嵌入数据集更新至 2025 版

Google 发布的 2025 年版 Satellite Embedding 数据集，为每个 10 米像素提供 64 维嵌入向量，使得在行星尺度上进行跨年度变化检测更为可靠。此次升级由 DeepMind 的 AlphaEarth 基础技术驱动，强化了 Earth AI 计划，并显著提升长期监测、灾害响应和气候分析能力。来源-x

2. Nvidia 计划推出开源 AI Agent 平台 NemoClaw

Nvidia 正在规划 NemoClaw，这是一款面向企业工作负载的开源 AI agent 平台。该平台将允许 AI agent 为员工执行任务，并可在不依赖 Nvidia 硬件的前提下访问使用，使其定位类似 OpenClaw，同时也表明 Nvidia 在其开发者大会前夕，正更大力度押注于由 agent 驱动的工作流。来源-reddit

3. OpenAI 将收购 Promptfoo 以加强 AI 安全测试

OpenAI 宣布将收购 Promptfoo，以强化其在 OpenAI Frontier 中的 AI 安全测试与评估能力。Promptfoo 将继续保持开源，并为现有客户持续提供服务和支持，这凸显了 OpenAI 对于 agent 安全性以及生产环境中严谨测试的重视。来源-x

📰 重点报道

地球观测

Google Satellite Embedding 数据集更新至 2025 版 — 每 10 米像素提供 64 维嵌入向量，使得在行星尺度上实现跨年度变化检测成为可能；进一步巩固了 Google 在可扩展地球监测与分析方面的承诺。来源-x

开源

Nvidia 计划推出开源 AI Agent 平台 NemoClaw — NemoClaw 旨在为企业应用提供一个开源 AI agent 平台，实现对员工任务的自动化处理，并可在不同硬件环境下无依赖运行；也预示着在 Nvidia 开发者大会前，Nvidia 正推动更广泛的 agent 生态布局。来源-reddit
开源 AI 项目通过并购团队（acquihire）或可实现每位工程师 1000–1 亿美元级回报 — 有观点认为，类别领先的开源 AI 项目在被并购团队时，可能为每位工程师带来极高的回报，因此建议创始人优先聚焦产品市场匹配，而非传统的 GTM（Go-To-Market）策略。来源-x

工具

自动调优发现约 20 处改动，将 GPT-2 训练时间缩短 11% — 自动化调优在一个 12 层深度模型上发现了大约 20 项改进；这些改动可在 24 层模型上叠加迁移，从而实现约 11% 的 GPT-2 训练时间加速，并在排行榜上取得新的成绩。来源-x
Claude Code 引入代码评审功能，自动排查 PR Bug — Claude Code 现在会在 Pull Request 打开时自动派出一组 agent，对代码进行 Bug 排查，展示了由自主 AI 驱动的代码审查能力，以提升软件质量。来源-x

AI 安全

OpenAI 将收购 Promptfoo 以加强 AI 安全测试 —（亦列于「今日焦点」）OpenAI 的这次收购旨在增强 Frontier 体系中的 agent 安全测试能力，同时保持 Promptfoo 的开源属性。来源-x

AI 工具

Context Hub：面向编码 agent 的开源最新 API 文档工具 — Context Hub 通过 CLI 提供最新的 API 文档，解决 API 过时以及参数幻觉问题；并支持跨多次运行进行会话衔接与知识持续保存。来源-x

Benchmark

微调后的 Qwen3 小型语言模型在窄领域任务上击败前沿大模型 — 蒸馏版 Qwen3 变体（0.6B–8B）在 9 个数据集上对比前沿 API 表现强劲，其中 0.6B 在智能家居函数调用任务上达到 98.7%，4B 在 Text2SQL 任务上达到 98.0%；并且借助开源权重教师模型与单张 H100 上运行 vLLM，在成本上具有明显优势。来源-reddit

自动化

Perplexity Computer 实现 Google 与 Meta 广告投放自动化 — 该系统直接连接广告 API，能够自主运行广告投放活动，每小时进行扫描和优化，测试结果显示其可以大幅替代现有工具栈并显著提升效率。来源-x

机器人

Figure 展示 Helix 02 自动清扫客厅的演示 — 这是向「每个家庭一台机器人」目标迈进的重要里程碑，体现了具身智能与消费级机器人领域的持续进展。来源-x

⚡ 快讯速览

DARE：面向 R 中 LLM 的分布感知检索方法 — 提出在 R 环境中为大语言模型引入分布感知检索技术，以改进数据处理和整体性能。来源-huggingface
Impeccable 开放 AI UI 设计工具，支持 17 条指令级技能 — 发布一套 UI 设计工具包，使得基于 17 个指令的 AI 交互成为可能，从而简化工作流。来源-github
使用 Qwen TTS 1.7B 克隆 Snape 配音制作有声书 — 展示了利用 Qwen TTS 1.7B 进行语音克隆，为有声书叙述提供 Snape 风格的声音效果。来源-reddit
代码评审数据集将 Qwen2.5-Coder-32B 表现提升至 4 倍 — 一个新数据集使 Qwen2.5-Coder-32B 在代码评审任务上的性能实现大幅提升（约 4 倍）。来源-reddit
安卓有声书阅读器在本地离线运行 Kokoro TTS — 一款 Android 应用可在设备本地离线运行 Kokoro TTS，为有声书提供朗读能力。来源-reddit
Anthropic 就五角大楼黑名单一事起诉特朗普政府 — 围绕五角大楼将其列入黑名单的行为提起法律诉讼，对 AI 采购中的政策与合规问题具有重要影响。来源-x
Anthropic 为桌面应用加入 Claude Code CLI 功能并支持 HLS 播放 — Claude Code CLI 获得桌面端集成，并新增对 HLS 播放的支持。来源-x
Claude Code CLI 遭部分用户批评，更偏好 GUI 工作流 — 一些用户表示，他们更喜欢 GUI 形式的 Claude Code 使用体验，而非命令行界面。来源-x
Penguin-VL 使用基于 LLM 的视觉编码器评测高效 VLM — 该工作通过采用基于大语言模型的视觉编码器，对高效视觉语言模型进行评估。来源-huggingface
BandPO：为 LLM 强化学习引入考虑概率的信赖域边界 — 提出一种基于概率感知边界的强化学习方法，用于改进大语言模型训练中的信赖域策略优化。来源-huggingface
Google NotebookLM 的非官方 Python API — 一个由社区开发的 Google NotebookLM Python API，便于程序化集成与调用。来源-github
OpenClaw 推出跨平台自托管个人 AI 助手 — OpenClaw 发布可在多平台自托管部署的个人 AI 助手解决方案。来源-github
本地模型通过基于「地图」的内部链接展示出实用价值 — 通过利用地图式的内部链接结构，本地模型在具体使用场景中展现出明显的实用性。来源-reddit
初步 LLM 跑分对比 M5 Max MacBook Pro 与竞品笔电 — 一些早期且相对粗略的大模型基准测试，将 M5 Max MacBook Pro 与其他竞争笔记本进行了性能对比。来源-reddit
HuggingFace 发布《The Synthetic Data Playbook》合成数据指南 — HuggingFace 发布关于合成数据使用与生成的系统性指导文档。来源-reddit
Google PR 动向暗示 Gemma4 即将发布 — 基于 Google 公共关系活动的动向，有迹象表明 Gemma4 可能即将发布。来源-reddit
M5 Ultra 或将为更大且易用的模型打开大门 — 社区讨论认为，M5 Ultra 有望在可运行模型的规模与可用性方面带来显著提升。来源-reddit

由 AI News Agent 生成 | 2026-03-09