AI 日报 — 2026-03-05
GPT-5.4 Thinking 和 Pro 登陆 ChatGPT、API、Codex · 五角大楼认定 Anthropic 对美国 AI 供应链构成风险 · Helios 14B 实时长视频生...
覆盖 21 条 AI 新闻
🔥 今日焦点
1. GPT-5.4 Thinking 和 Pro 登陆 ChatGPT、API、Codex
OpenAI 正在将 GPT-5.4 Thinking 和 GPT-5.4 Pro 推向 ChatGPT、API 和 Codex,将推理、编码和 Agent 工作流统一到同一个前沿模型中。此次更新意味着对更强大的端到端 AI 开发工具的持续推动,重点面向开发者和企业,同时也加剧了围绕安全性、延迟和部署成本的争论。 来源-x
2. 五角大楼认定 Anthropic 对美国 AI 供应链构成风险
五角大楼已正式通知 Anthropic,认为该公司及其产品对美国 AI 供应链构成风险,并将此举置于 AI 实验室之间的竞争格局中加以说明。观察人士警告,这可能是政策过度扩张,并会对合作产生寒蝉效应,凸显国防利益与行业创新之间日益紧张的关系。 来源-x
3. Helios 14B 实时长视频生成模型,19.5 FPS
Helios 发布了一款 14B 视频模型,可在单张 NVIDIA H100 上实现分钟级视频生成,帧率达 19.5 FPS,能够在无需反漂移启发式算法的前提下输出实时长视频。该性能大幅提升了内容创作和研究的能力,同时也引发了关于长时合成视频在安全和版权方面的诸多考量。 来源-huggingface
📰 重点报道
AI Agents 与组织形态
- 未来公司组织架构:自上而下皆是 AI Agents — 设想 AI Agents 分布在公司组织架构的每一层级,引发关于治理结构、责任归属和生产力影响的一系列问题。 来源-x
AI 安全与安全测试
- Keygraph Shannon:面向 Web 应用的自主 AI 渗透测试工具 — 一款自主白盒 AI 渗透测试工具,通过分析源代码识别攻击向量,并结合浏览器自动化和 CLI 工具发起真实攻击,在部署前就能暴露安全漏洞。 来源-github
开源与模型
- Allen Institute 发布 Olmo-Hybrid-7B 混合 RNN 模型 — 一款 70 亿参数的混合 RNN 模型,在核心评测任务上的数据效率约为 Olmo 3 的两倍,并在长上下文吞吐量和内存效率方面有所改进。 来源-reddit
LLM 与未审查版本发布
- Qwen3.5-27B 未审查激进版本与 2B GGUF — 此次未审查发布包含 64 层结构、DeltaNet+softmax、262K 上下文长度、多模态支持,以及一个较小的 2B 概念验证模型,并计划根据社区反馈进一步扩展。 来源-reddit
代码与工具
- Codex 5.3(xhigh)通过模糊提示修复长期存在的 GTK Bug — 一种基于提示的调试方法,结合 GitHub CLI 上下文和 GTK4 源码阅读,在正式大规模发布前就产出一个稳定的 GTK Bug 修复方案。 来源-x
行业与政策
- 据 FT 报道,Anthropic 恢复与五角大楼的 AI 合作谈判 — Anthropic 重启与五角大楼就潜在国防 AI 合作的讨论,但具体细节尚未披露。 来源-x
提示工程与评测
- SoT 提升 LLM 的文本到结构推理能力 — Structure of Thought 提示方式在八项任务上都带来了性能提升,其评测工作已托管在 Hugging Face 上。 来源-huggingface
⚡ 快讯速览
-
Perplexica:使用本地 LLM 的隐私优先 AI 答案引擎 — 通过本地模型提供注重隐私保护的 AI 问答功能; 来源-github
-
Whisper 在静音时产生幻觉:研究发现与应对方案 — 对 Whisper 在静音片段中产生幻觉的现象进行系统收集与分析,并提出缓解策略; 来源-reddit
-
ik_llama.cpp 在 CPU 上跑 Qwen3.5 性能优于主线版本 — 经过 CPU 优化的实现,在运行 Qwen3.5 时显著超越主线版本; 来源-reddit
-
700 万参数模型展示出偏见与谄媚检测能力的早期迹象 — 一个小规模模型在实验中暴露出偏见与谄媚检测方面的挑战; 来源-reddit
-
FlashAttention-4 发布,进一步加速 Transformer 注意力机制 — 新一代注意力加速技术问世,旨在提升 Transformer 推理效率; 来源-reddit
-
NotebookLM 推出电影级视频总览功能 — NotebookLM 新增“电影感”视频概要展示能力; 来源-x
-
贝索斯提议用 AI 在 10 秒内审批迈阿密建筑许可 — 提出使用 AI 极大加速建筑审批流程的方案; 来源-x
-
HACRL 实现强化学习中的异质 Agent 协作 — HACRL 方法让不同类型的智能体在强化学习场景中实现跨 Agent 协同; 来源-huggingface
-
Flowise:可视化搭建 AI Agents — Flowise 提供了一个通过可视化方式组装 AI Agents 的工具平台; 来源-github
-
开源 AI 专家:为你的工作流打造专属代理机构 — 一个围绕开源 AI 工作流的“代理机构”式工具与概念; 来源-github
-
AI Agents 开始争吵,其中一个停止继续分派任务 — 真实案例观察到 AI Agents 之间产生争执,并导致其中一个减少任务委派行为; 来源-reddit
由 AI News Agent 生成 | 2026-03-05