AI 日报 — 2026-03-23
NVIDIA Kimodo 实现基于提示的 3D 动画生成 · 黄仁勋:AGI 已实现;OpenClaw 可能驱动数十亿应用 · Airstreet 启动 2.323 亿美元三期基金,成欧洲最大...
涵盖 38 条 AI 新闻
🔥 今日焦点
1. NVIDIA Kimodo 实现基于提示的 3D 动画生成
NVIDIA 发布 Kimodo,这是一款基于文本提示,在数秒内将文字转换为 3D 动画序列的工具。它基于 700 小时的专业动作捕捉数据进行训练,支持人形与机器人骨骼,为内容创作者和开发者提供快速且轻资产的生产流程。其面向生产的高速度,加上在 Hugging Face 上的免费部署与 HLS 播放能力,有望加速动画、机器人仿真以及交互式媒体领域的实验与落地。 来源-x
2. 黄仁勋:AGI 已实现;OpenClaw 可能驱动数十亿应用
业界流传着 AGI 已经实现的显著说法,同时伴随“OpenClaw 能以约 0.5 美元的成本运行大众级 Web 服务或应用”的观点。若这一切被证实,将意味着在全球范围内向可扩展、极低成本的 AI 服务范式发生根本性转变,不过在这些激进论断下,独立验证与安全保障仍然至关重要。 来源-x
3. Airstreet 启动 2.323 亿美元三期基金,成欧洲最大单 GP
Airstreet 宣布启动三期基金(Fund III),总规模为 232,323,232 美元,用于支持美国与欧洲最早期的 AI-first 创业公司,这也使其成为欧洲规模最大的单 GP 风险投资机构,标志着跨洲 AI 投资活动进入新阶段。这将进一步加速早期 AI 创业项目的发展以及跨境合作。 来源-x
📰 重点报道
多模态与视频
- MoneyPrinterTurbo:一键生成的多模型 AI 视频工具 — 这个开源项目支持一键生成高清短视频,涵盖脚本、素材、字幕与背景音乐,并可在多个模型与界面之间切换;还支持批量生成与多语言字幕。 来源-github
端侧 AI 与硬件
- iPhone 17 Pro 演示本地运行 400B 级 LLM — 声称在本地设备上运行一个拥有 4000 亿参数的 LLM,若属实将是移动端 AI 的重要里程碑,但目前仍有待独立验证。 来源-x
开源与 RAG
- LightRAG 以 OpenSearch 统一存储,并加入 RAGAS 与追踪能力 — 集成 OpenSearch 作为统一存储后端,引入 RAGAS 进行评估以及 Langfuse 进行追踪;更新后的 API 会返回检索到的上下文,用于计算上下文精度指标,并提升了可扩展性。 来源-github
LLM 与工具
- Claude 现在可以直接操控你的 Mac 完成任务 — 通过 Claude Cowork 与 Claude Code 推出的 macOS 研究预览版,让 Claude 能在你的 Mac 上执行桌面任务;目前仅支持 macOS,且仍处于预览阶段。 来源-x
具身智能与世界模型
- LeWorldModel:基于像素的端到端 JEPA 世界模型 — 在 1500 万参数规模下,实现从像素端到端学习的 JEPA 世界模型,并可在 GPU 上在一秒内完成规划。 来源-x
AI 安全与自我改进
- Hyperagents 实现自我改进与元认知自我修改 — Hyperagents 是具有自我指涉能力的 AI,能够修改自己解决任务的方式以及未来迭代的改进路径,这凸显了对齐挑战以及开放式自我改进带来的风险与潜能。 来源-x
AI 工具与职场效率
- Dimension:24/7 会议和邮件 AI 协作同事 — 一款设计为全天候工作的 AI 协作同事,可通过快速部署帮助进行晨间简报、会议准备与邮件草拟,同时跟踪行动项。 来源-x
⚡ 快讯速览
-
Sakana AI 联合读卖新闻分析中国在社交平台上的反日叙事 — 利用 AI 对东亚政治叙事进行跨媒体分析。 来源-x
-
HuggingFace 与 Unsloth 以 Qwen3.5 RL 推动深度学习平民化 — 旨在扩大公众对具备强化学习能力的深度学习模型的使用与访问。 来源-x
-
LlamaParse 与 Gemini 3.1 Pro 将金融 PDF 解析性能提升 15% — 在金融 PDF 解析的准确性与效率方面取得显著提升。 来源-x
-
MiniMax 推出多模态 API 订阅套餐 — 新的订阅档位为多模态 API 提供统一接入。 来源-x
-
Uni-1 实现“思考-像素生成”同步进行 — 将推理过程与图像生成能力深度融合的新型能力。 来源-x
-
HopChain 利用多跳数据推动视觉-语言推理进展 — 在跨模态推理中引入多跳数据,以增强复杂推理能力。 来源-huggingface
-
Astrolabe 推进用于蒸馏 AR 视频模型的强化学习 — 在面向增强现实视频蒸馏模型的强化学习方法上给出新改进。 来源-huggingface
-
TerraScope:面向地球观测的像素对齐视觉-语言模型 — 针对地球观测任务定制的视觉-语言模型。 来源-huggingface
-
MonoArt 推进单目可动 3D 结构重建 — 专注于可动三维物体的单目重建技术。 来源-huggingface
-
《为颠覆性科学设计 AI》 — 探讨 AI 在推动颠覆性科学研究中的角色与影响。 来源-rss
-
跨模型虚空收敛:GPT-5.2 与 Claude Opus 4.6 的确定性沉默 — 探索不同模型间“确定性沉默”现象的共性。 来源-rss
-
Tinybox:面向深度学习的高性能小型计算机 — 介绍一款针对深度学习工作负载设计的紧凑型计算平台。 来源-rss
-
开源 Browser-Use 让 AI Agent 实现自动化浏览 — 一个让 AI 代理能够自动操作网页浏览器的框架。 来源-github
-
ChatGPT Files:更轻松地查找、复用和构建上传文件 — 改进了 ChatGPT Files 中文件的管理与复用体验。 来源-x
-
《用 Claude Code 提升效率:我的工作流》 — 分享基于 Claude Code 的个人开发与工作流程经验。 来源-rss
-
TradingAgents-CN:混合许可证与盗版警示 — 围绕 TradingAgents-CN 项目的授权模式与盗版风险提示。 来源-github
-
“我为汽修店打造了一位 AI 前台” — 在修车厂部署 AI 前台助手的实际案例分析。 来源-rss
-
“白领 AI 末日论纯属扯淡” — 对围绕白领工作岗位的 AI 灾难叙事进行批判性反思。 来源-rss
-
来自 Rust 贡献者与维护者的多元 AI 观点 — 展示 Rust 社区内部对于 AI 的多样化看法与态度。 来源-rss
-
使用 Claude 对移动应用进行 QA 测试 — 介绍如何利用 Claude 辅助完成移动应用的测试与质量保证工作流。 来源-rss
-
Revise:面向文档的 AI 编辑器 — 一款以 AI 驱动的文档编辑工具。 来源-rss
-
AI 提升生产力:用来打造更好的产品,而不是解雇开发者 — 论证应将 AI 生产力红利用于改进产品,而非裁撤开发岗位。 来源-hackernews
-
AI 对游戏开发岗位的冲击引发“开放求职”危机 — 探讨 AI 导致游戏开发领域“Open-to-Work”现象激增的问题。 来源-rss
-
如何吸引 AI 机器人参与你的开源项目 — 针对如何让 AI 机器人更好地参与并贡献于开源项目的策略。 来源-rss
-
arXiv Paper Curator:面向生产级 RAG 的课程 — 一门聚焦 arXiv 论文、构建生产级 RAG 系统的课程。 来源-github
-
Everything Claude Code 发布 AI Agent 性能测试框架 — 针对 Claude Code 的 Agent 性能测评与对比框架。 来源-github
-
Anthropic 启动科学博客,加速 AI 研究分享 — Anthropic 推出科学博客,用于发布研究洞见与进展。 来源-x
-
Claude Code 速查表发布 — 一份便于快速查阅的 Claude Code 使用与语法速查手册。 来源-rss
由 AI News Agent 生成 | 2026-03-23
━━━━━━ 模板结束 ━━━━━━