AI 日报 — 2026-04-25

AI 招聘工具更偏好 AI 写的简历而非真人简历 · Qwen-Image-2.0-Pro 发布；在 Arena 排名第 9 · Qwen3.6-27B 在 RTX 5090 上以 218k 上...

覆盖 19 条 AI 新闻

🔥 今日焦点

1. AI 招聘工具更偏好 AI 写的简历而非真人简历

在多种模型的成对评估中，AI 生成的简历更受偏爱，这表明 AI 驱动的招聘流程中存在潜在偏见，并引发了关于如何区分真人与 AI 生成简历质量的担忧。该研究强调，AI 介入的招聘流程可能会扭曲结果，因此迫切需要对这类系统进行严格验证。来源-x

2. Qwen-Image-2.0-Pro 发布；在 Arena 排名第 9

Qwen-Image-2.0-Pro 提供更高的图像质量、多语言文本渲染能力，以及在多种风格下更强的指令遵从能力，其在 Arena 榜单中的排名凸显了多模态技术日益成熟。阿里巴巴 Qwen 的多模态布局正通过 ModelScope API 接入和更广泛的基准测试快速推进。来源-x

3. Qwen3.6-27B 在 RTX 5090 上以 218k 上下文实现约 80 TPS

据称，Qwen3.6-27B 在单张 RTX 5090 上配合 vLLM 0.19，可在 218k 上下文窗口下实现约 80 TPS，显示出良好的可扩展推理能力；同时 NVFP4-MTP 变体似乎已从 Hugging Face 下架。这类吞吐数据对于大模型在实时场景中的部署具有重要意义。来源-reddit

📰 重点报道

将剩余重点新闻按主题分组，每组作为一个 ### 标题，条目用项目列表表示：

LLM

AI 招聘工具更偏好 AI 写的简历而非真人简历 — 在模型成对评估中，AI 生成的简历更受青睐，显示出 AI 辅助招聘中的潜在偏见，以及在人类与 AI 简历质量区分上的挑战。来源-x
GPT-5.5（xhigh）在 Artificial Analysis Index 上比 Sonnet 更便宜 — 定价格局使得高成本模型处于激烈竞争中，而 5.5 在成本效率上优于部分替代方案，同时性能接近小型模型的水准。来源-x

Multimodal

Qwen-Image-2.0-Pro 发布；在 Arena 排名第 9 — 提供更高图像质量、多语言渲染，以及扎实的指令遵从能力，体现出成熟的多模态能力。来源-x
类 Gemini 的多模态预训练停滞；DeepSeek 仍未达到该水平 — 受限于数据和基准测试，被认为是 DeepSeek 无法实现 Gemini 级多模态预训练的主要障碍，相关讨论还提及受 NSA 启发的方法以及对口型同步的更新。来源-x

AI Policy

AI 数据中心暂停建设法案预计今年通过（概率 85%） — 市场与政策制定者围绕 AI 基础设施政策展开争论，在全国范围内就地方/州/联邦层面的暂停建设范围进行讨论，当前预计有 85% 的通过概率。来源-x

Hardware / GPUs

DeepSeek V4 和 Rubin Ultra 显示出 NVIDIA 的前瞻性 — 分析人士认为，NVIDIA 的设计选择与未来 LLM 工作负载和加速器需求高度契合，这为其带来战略优势，并释放潜在合作信号。来源-x

Open Source / Tools

Qwen3.6-27B 在 RTX 5090 上以 218k 上下文实现约 80 TPS — 来自 Reddit 帖子的吞吐量数据展示了在大上下文窗口下的高速推理能力；据称 HF 上的 NVFP4-MTP 变体被下架，为该模型现状增添了更多背景信息。来源-reddit
DeepEP：用于 MoE 的高效 Expert-Parallel 通信库 — 开源的 MoE 通信库，提供高吞吐、低延迟的算子，支持 FP8，并对 RDMA/NVLink 做了优化，以加速训练和对延迟敏感的推理场景。来源-github
2h Codex App 走红，被称为超快代码生成工具 — 各类演示对其极速代码生成能力赞不绝口，突出其在效率和生产力上的潜在提升，同时也引发了对代码质量的审视。来源-x

Platform / Model Zoo

Dell-Hugging Face 承载广泛 AI 模型阵列 — Michael Dell 推介 dell.huggingface.co，展示了来自多家实验室和厂商（如 Kimi K2.5、Mistral、Cohere、Arcee AI Trinity Large、Google Gemma 等）的多样模型，表明企业可以便捷接入多元模型生态。来源-x

⚡ 快讯速览

MiMo V2.5 Pro 权重发布，在 AI Index 中位列第 54 名 — MiMo 新版本发布，在 AI Index 中取得中游水平的表现。来源-reddit
Darwin-36B-Opus：36B MoE LLM 登顶 GPQA Diamond 榜 — 基于 MoE 的 Darwin-36B-Opus 在 GPQA Diamond 上取得第一，展示了强劲的 MoE 扩展能力。来源-reddit
GLM 5.1 在本地 RTX 6000 Pro 上实现 40 tps — 本地推理在 RTX 6000 Pro 上达到 40 tps，体现了工作站级部署在效率方面的提升。来源-reddit
Qwen3.6-35B-A3B：INT/NVFP KLD 基准测试 — 关于 Qwen3.6-35B-A3B 的基准数据为模型对齐和性能评估提供了参考指标。来源-reddit
对一位 14 岁少年来说，AI 与 Disney 的差距只剩“品味” — 讨论 AI 驱动媒体在可及性和文化影响方面的意义，认为当下障碍更多在审美和品味层面而非技术门槛。来源-x
Ubuntu 26.04 简化 AMD XDNA2 NPU 上手流程 — Ubuntu 26.04 改善了 AMD XDNA2 NPU 的初始化与环境搭建流程，使开发者更容易上手。来源-reddit
Claude 使用限制被逆向推断；Codex 会步其后尘？ — 有传闻称 Claude 的使用上限已被逆向解析，同时外界也在猜测 Codex 的下一步动作。来源-x
OpenAI Team Ships — OpenAI 团队宣布推出一款新产品或更新，具体细节尚未公布。来源-x
Codex 也不是一辆车 — 对 Codex 品牌与其实际能力的讽刺性评论，用幽默方式质疑其定位与现实表现。来源-x

由 AI News Agent 生成 | 2026-04-25