AI 开发者日报 2026-05-22

模型、基准与研究更新：RAEv2、Gated DeltaNet-2、数据过滤与开放数学

RAEv2 与表征优先的 Tokenization：多位研究者强调了 RAEv2 作为统一视觉理解与生成中表征自编码器的重要后续工作。@1jaskiratsingh 表示，该更新带来了 >10倍更快的收敛速度、更好的重建效果和更优的生成能力，测试已扩展到 文生图和世界模型。来自 @recatm 的中文总结提炼了三个主要发现：对最后 K 个编码器层 进行求和（而非仅使用最后一层）可以在不增加推理成本的情况下同时改善重建和生成效果；RAE 和 REPA 在语义与空间结构维度上是互补的；REPA 可以重新表述为一种内部自引导机制，从而避免额外的弱模型引导过程。@sainingxie 还指出了超越 FID 的新评估视角，认为基于表征的像素解码器仍有未被充分探索的提升空间。
标准注意力与 Tokenizer 假设的替代方案：NVIDIA 的 Gated DeltaNet-2 通过通道级门控机制将线性注意力中的擦除和写入操作解耦，在 1.3B 参数规模下，语言建模和常识推理任务上超越了 KDA 和 Mamba-3，并在 RULER 上取得了显著的长上下文检索增益；@rasbt 称其为混合注意力方向中最有趣的探索之一。在 Tokenization 方面，@NousResearch 发布了一项关于 子词 Tokenization 为何有效的受控研究，在 1.7B 字节级 流水线中模拟了七种假设的收益机制；在该规模下，七种干预中只有三种 对验证损失产生了影响。此外，@tatsu_hashimoto 报告了 DCLM 上一个令人惊讶的扩展结果：在计算资源充足的情况下，最好的数据过滤器可能是 不进行过滤，预测表明对于互联网规模的数据池，交叉点大约在 1e30 FLOPs 附近；下游评估结果虽有噪声但方向一致（后续讨论）。
机制可解释性与几何结构：@GoodfireAI 认为，当前主流的“模型在弯曲流形中思考，SAE 使用直线特征”的批评只有部分正确。他们提出的解决方案是通过 联合激活模式 对 SAE 特征进行聚类，通过 特征组 而非孤立原子来恢复几何结构（讨论续篇，文章）。这是对当前 SAE 讨论的有益更新：并非否定稀疏特征，而是提醒解释应从单一特征转向结构化组合。
数学作为 AI 研究领域：最大的科学讨论围绕 OpenAI 在 Erdős 单位距离问题上的报告结果展开。@markchen90 将其视为数学目前是最适合 AI 辅助研究突破的领域的证据，而 @wtgowers 指出，如果报告的低人工干预程度属实，那么这一结果确实令人关注。讨论很快被怀疑论和关于基准测试/可游戏化的担忧所主导，@memecrashes 开玩笑说这个结果“不到 3 小时就被人类超越了”，而 @cloneofsimo 则指出了关于什么才算合法 AI 数学的“标准不断被抬高”的可预测现象。有趣的技术元观点是，数学之所以继续作为 AI 协同研究中相对清晰的边界领域，是因为其输出可以被检验、辩论和扩展。

智能体、框架与开发者工具：Codex、Gemini、Devin 及智能体基础设施

框架（Harness）仍是能力提升的主要来源：@lvwerra 发布了 physics-intern，一个科学问题框架，能将 Gemini 3.1 Pro 的得分从 17.7 提升至 31.4，在该设置下超越了 GPT 5.5 Pro。值得注意的细节是，GPT 5.5 Pro 本身并没有从该框架中受益，这表明模型对脚手架技巧的吸收具有特异性。同样，@KLieret 让 mini-swe-agent 能够在 ProgramBench 上运行，明确旨在推动软件工程智能体领域的框架创新。
智能体设计模式正从“单智能体优先”演进为显式的子智能体编排：@cwolferesearch 给出了一个实用的总结：从单智能体系统开始，只有当工具泛滥或提示词膨胀到难以管理时，才转向管理者/子智能体或去中心化的多智能体拓扑结构。这一建议与子智能体用户的实际操作观察不谋而合：@andrew_locke 将 Cognition 的 sub-Devin 工作流描述为一个阶跃变化，将原本看起来需要 2 个工程师周的工作压缩到了几个小时。
Codex 在模型之上构建了重要的产品层：OpenAI 的“Codex 周四”更新，其独立功能本身并不重要，更重要的是它们指明了编码智能体的发展方向。@OpenAIDevs 推出了 Appshots，可以同时捕获 Mac 应用窗口的截图和文本，以提供更丰富的工作上下文；他们还增加了团队插件共享功能（链接）以及更详细的组织分析功能（链接）。更重要的系统层面转变是远程计算机使用：@OpenAIDevs 表示，Codex 现在可以在你的 Mac 被锁定的情况下，从你的手机上安全地使用 Mac 上的应用。这是一个强烈的信号，表明智能体产品形态正从聊天 IDE 转向持久的跨设备操作工作流。
Gemini 的智能体/工具生态正在快速扩展：@OfficialLoganK 强调，Gemini 3.5 Flash 在 APEX-Agents-AA 排行榜上排名第一，超越了更大的模型。在应用层面，@_philschmid 展示了一个仅通过单次 Gemini API 调用、无需任何编排框架即可运行的 GitHub Issue 分类智能体；而 @skalskip92 则演示了 Gemini 3.5 Flash 如何通过一次多模态 API 调用，取代了用于车道/车辆推理的自定义视觉流水线。Google 还扩展了操作界面：Daily Brief（公告）以及与 OpenTable、Canva 和 Instacart 的互联应用操作（公告），本质上都是面向消费者的智能体工作流。
开发者基础设施正围绕检索、流式传输、沙箱和安全边界进行整合：Weaviate 在数据库内部内置了 MCP 服务器，使得编码智能体无需额外进程即可摄取代码仓库并使用混合 BM25 + 向量检索（公告）。LangChain 推出了一个沙箱认证代理，用于控制智能体与世界的边界（公告），以及一个新的类型化流式传输协议，用于将工具、子智能体、媒体和中断作为一等公民的投影而非令牌流进行渲染（概述）。vLLM 的弹性专家并行也是一项值得关注的系统工作：@vllm_project 描述了如何在无需完全重启的情况下，通过 NVLink/RDMA 进行直接的 GPU 到 GPU 传输，实时调整 MoE 的 DP/EP 拓扑——这不仅对扩展至关重要，对未来的容错服务也同样重要。

基础设施、算力与AI商业信号：Modal、Turbopuffer、Hark与算力竞赛

基础设施层迎来了最清晰的"钱在这里"信号：@Sirupsen 表示 turbopuffer 在3月份突破了 1亿美元年化收入，距离达到 100万美元 仅过了 19个月，同时实现了盈利，并且融资额仅为 570万美元。这被描述为"基础设施即服务（IaaS）领域有史以来最好的单位经济模型之一"。与此同时，Modal 据称年化收入已达 1.5亿美元，Hark 则达到了 3000万美元。这些数据点共同表明，AI基础设施层正在产生巨大的商业价值，且资本效率极高。
Qwen3.7 Max 在 Artificial Analysis 排行榜上位列第五（活动量：614）：Qwen3.7 Max 出现在 Artificial Analysis 排行榜的 第5名，据报道与 GPT-5.4 xhigh 大致持平，并略微领先于 Gemini 3.5 Flash。该帖子强调，Qwen3.6 27B 与其 Max 版本相差 6 分，这让人们更加期待即将推出的 Qwen3.7 27B/35B 变体能够接近更大规模 Max 模型的性能。评论者们主要期待开源权重发布，并认为 Qwen 与前沿实验室的竞争力很有前景，不过也有人对 Max 模型不开源感到失望。一个技术上的担忧是 Qwen 是否修复了其被报道的"过度思考"行为。
评论者们正在观望 Qwen3.7 是否会发布开源权重的 27B/35B 变体，但有一种技术推测认为可能不会有单独的 27B 版本发布：Qwen 3.7 可能是一个私有的 390B MoE 风格模型，拥有 A30B 激活参数，类似于一个更大的闭源部署，而非小型开源检查点。
一些评论关注的是 Qwen3.7 Max 相对于 Qwen 3.5/3.6 是真正的架构升级，还是主要只是另一次微调。技术上的兴趣点在于阿里巴巴是否改进了底层模型设计，还是仅仅从现有架构中挖掘出了更多的基准测试性能。
一个反复出现的担忧是 Qwen 团队是否修复了模型的"过度思考"行为——这可能指的是过多的推理冗长或不必要的思维链式推演，尽管能提升某些基准分数，但会损害延迟、成本和用户体验。
"等待 Qwen 3.7 开源权重……新王已至……"（活动量：577）：图片是 Qwen3.7-Max 的基准测试营销对比图，链接到 Qwen3.7 博客，显示其在许多任务上领先，如 Terminal-Bench 2.0、SWE-bench Pro、MCP-Atlas、HLE、Apex、IFBench 和 SuperGPQA，对比对象包括 Qwen3.6-Plus、DS-V4-Pro Max、GLM-5.1、Kimi K2.6 和 Claude Opus-4.6 Max。技术上的意义在于，该图表将 Qwen3.7-Max 定位为与 Opus 级别系统竞争的闭源/API 模型，而评论者们则特别希望看到一个开源 MoE 版本，例如具有 512k 上下文的 3.7-122B-A17B，或采用 MXFP4/NVFP4 等低位格式的 397B A17B 变体。评论者们对 Qwen3.7-Max 本身是否会开源权重持怀疑态度，指出 "Qwen 从未开源过 Max 系列。" 其他人则对可能发布的大型开源 MoE 模型感到兴奋，将其描述为高端多 GPU 用户的潜在 "家庭版 Opus"。
几位评论者提醒说，传闻中的模型很可能是 Qwen Max 级别的发布，而历史上 Qwen 并未将 Max 系列模型作为开源权重发布。一位用户特别警告不要将 Max 的基准测试结果外推到较小的开源模型（如假设的 27B），因为能力差距可能很大。
围绕硬件的猜测集中在可能的 Qwen 3.7-122B-A17B 上，该模型可能具备 MTP、MXFP4 量化和 512k 上下文，评论者认为这对 AMD Strix Halo 级别系统的本地推理很有吸引力。另一位评论者希望发布 397B-A17B，指出之前的 Qwen 3.5 NVFP4 变体据报道可以适配 4x RTX 6000 Pro GPU，并留有足够的内存余量来处理大约 10 个并发会话，每个会话 200k 个 token。
有人怀疑阿里巴巴/Qwen 不会发布他们最强的本地模型，因为这样做可能会削弱其托管模型的盈利能力。一位评论者提到 Qwen 在四月份从"颠覆"转向 前沿模型竞争和盈利，这意味着即使基准测试结果看起来很强，发布高能力的开源权重模型的可能性也可能降低。

2. Qwen 3.6 35B MTP 量化性能

在 12GB VRAM 上使用 Qwen3.6 35B A3B 和 ik_llama.cpp 达到 110 tok/s（活动量：455）：该帖子对 Qwen3.6-35B-A3B-MTP 进行了基准测试，使用了 byteshape 的 IQ4_XS 4.19 bpw GGUF，在 RTX 4070 Super 12GB + Ryzen 7 9700X 上运行，设置 131072 上下文、q8_0 KV 缓存、MTP draft-max=3 和 draft-p-min=0.75。从 llama.cpp 切换到 ik_llama.cpp 后，报告的平均值从 89.76 tok/s 提升到 110.24 tok/s（+23%），尽管更新后的结果中 MTP 总接受率更低（0.9393 → 0.8749），这表明提升来自后端/卸载效率而非单纯的接受率。作者指出，使用无头/辅助 GPU 可以最大化可用 VRAM，并推荐在 ik_llama.cpp 中使用 --fit --fit-margin 1664，在内存不足时增加到 1792/2048。评论者询问了确切的 llama.cpp 命令，并指出最近有几个与 MTP 相关的 llama.cpp PR 已经合并，因此结果可能对版本敏感。一位 CachyOS/KDE Wayland 用户分享了一个没有 iGPU 的技术变通方案：通过 LIBGL_ALWAYS_SOFTWARE=1 GALLIUM_DRIVER=llvmpipe 使用软件渲染启动 Plasma，将空闲 VRAM 从 >1024 MB 减少到约 126 MB，代价是合成器效果变慢或禁用。

一位 CachyOS/KDE Wayland 用户为单 GPU 系统分享了一个节省 VRAM 的变通方案：创建一个自定义 SDDM 会话，使用 LIBGL_ALWAYS_SOFTWARE=1、GALLIUM_DRIVER=llvmpipe 和 KWIN_COMPOSE=Q 启动 Plasma，强制 KDE 合成器渲染到 CPU。他们报告说，空闲 VRAM 从正常 KDE Wayland 下的 >1024 MB 下降到 CPU 渲染会话中的 ~126 MB，释放了近 1 GB 的 VRAM 用于模型推理，代价是动画非常慢或被禁用。

几位评论者关注基准测试方法，询问确切的 llama.cpp 命令，并指出 与 MTP 相关的 PR 在过去 24 小时内已合并到上游 llama.cpp 中，这可能会对比较结果产生实质性影响。一个技术假设是，ik_llama.cpp 通过更高的推测性/MTP 接受率实现了报告的速度提升：在 ik_llama.cpp 中 从未低于 0.790，而在 llama.cpp 中低至 0.477，这引发了关于设置是否等效的疑问。
人们对 IQ4_XS 的内存/质量权衡产生了技术兴趣，它被描述为此设置下可能是内存最低的 Q4 量化选项。一位评论者询问它会导致多少智能退化，并请求最终的 VRAM/RAM 分配情况，这对于在仅 12 GB VRAM 上运行 Qwen3.6 35B A3B 尤其相关。
Qwen 3.6 35B GGUF：跨 GPU 和 CPU 的 NTP 与 MTP 量化结果（活动量：364）：图片是一个技术基准测试图，而非梗图：一张 RTX 4090 性能与质量气泡散点图，比较了 ByteShape Qwen 3.6 35B GGUF 的 NTP/MTP 量化与 Unsloth、Bartowski、Mudler 和 AesSedai 的平均 TPS、准确率和 BPW。在该帖子的上下文中，它说明了主要发现：对于 NTP，"选择能装下的最大量化" 可能具有竞争力，而 MTP 可以将 GPU 生成吞吐量提高大约 20–40%，但会增加内存压力，不建议在 CPU 上使用。评论大多是积极和实用的：一位 CPU 混合用户确认在使用 MTP 时遇到了严重的减速，这与 ByteShape 的 CPU 发现一致，并询问是否计划发布更高质量的 Q6 GGUF 版本。
一位 CPU 混合用户报告说，在使用 MTP 与 Qwen3.6-35B 时遇到了 "难以置信的减速"，这与该帖子的发现一致，即 MTP 在混合 CPU/GPU 设置上可能会退化。他们还询问是否会发布 Q6 GGUF 量化版本，指出他们避免对该模型使用低于 Q6 的量化。
一位评论者质疑了关于 NTP 的方法论，假设它指的是 llama.cpp 的 --spec-type ngram-mod，并指出主线 llama.cpp 显然可以通过 --spec-type ngram-mod,draft-mtp 同时运行 ngram 推测解码和 MTP。他们认为这种比较可能不是严格的 NTP 与 MTP 二选一，并引用了诸如 --spec-ngram-mod-n-match 24、--spec-ngram-mod-n-min 12、--spec-ngram-mod-n-max 48 和 --spec-draft-n-max 3 等参数。
在 RTX 4070 Super 12GB 上使用 ik_llama.cpp 对 Qwen3.6-35B-A3B-IQ4_XS-4.19bpw MTP 进行的基准测试报告了 110.24 tok/s 的平均速度，比 Qwen3.6-35B-A3B-UD-IQ4_XS MTP 快了大约 20 tok/s。该运行使用了 mtp-bench.py，参数为 aggregate_accept_rate=0.8749、total_predicted=1592、total_draft=1127 和 total_draft_accepted=986；评论者强调了 --fit、--fit-margin 1664、--multi-token-prediction、--draft-p-min 0.75 和 --draft-max 3 是关键调优旋钮。

3. 开源权重发布与下架风波

Heretic 已收到 Meta, Inc. 的法律通知（活动量：2124）：Heretic 自由软件项目表示，他们收到了代表 Meta Platforms, Inc. 的提供商发来的电子邮件法律通知，并已删除了包含 Meta 的 Llama 模型衍生品的模型权重仓库。该帖子将此下架行为描述为合规，同时宣布通过官方 Codeberg 镜像 codeberg.org/p-e-w/heretic 实现基础设施多元化，并计划采取"技术措施"来保持对 Heretic 创建模型的访问，而不依赖单一托管提供商。评论者大多批评 Meta 的执法行为是虚伪的，考虑到其训练数据存在版权争议，并嘲笑该帖子中关于 Llama 在 LM Arena 上落后于 23 个竞争对手的 168 个模型的讽刺。讨论主要是政治/法律层面的反应，而非技术辩论。

评论者强调了引用的 LM Arena 框架，即 Meta 的 Llama 系列不在最顶层，在前 200 个语言模型中被描述为 "仅落后于来自 23 个竞争对手的 168 个其他模型"。技术上的要点是，关于命名的法律纠纷正与 Meta 模型发布和排行榜竞争力的感知停滞形成对比。

关于 Cohere 的 Command-A 系列模型到底发生了什么？（活动量：669）：Cohere 宣布了 Command A+，这是其首个 混合专家（MoE） 开源权重模型，定位为 Command 系列的高效继任者/延续，强调低延迟和响应性，而非仅仅追求顶级基准测试优势；详情见 Cohere 的发布帖子。该模型以 Apache 2.0 许可证发布，Cohere 声称通过大量量化工作使其能够在 1–2 块 GPU 上实际部署，面向智能体/企业工作负载和较小的开发团队。评论者普遍持积极态度，提到最初的 Command R+ 在其时代异常强大——尤其是在创意工作和企业级规划方面——并欢迎 Cohere 的回归，认为这有利于模型生态系统的多样性。社区的主要技术需求是立即提供用于本地推理的 GGUF 量化构建版本。
一位评论者质疑该版本发布的竞争力，原因是 缺乏标准基准测试结果，并且缺少与当前同类尺寸模型的比较，特别点名 MiniMax M2.7 和 Mimo V2.5 作为感知上的 SOTA 基线。他们指出，依赖引用的 Artificial Analysis 基准测试图片（https://preview.redd.it/vjex3axl8d2h1.png?width=1224&format=png&auto=webp&s=08e9c90188bf9b42d4f049991624b4e180cf566d）可能不足以推动采用，如果质量没有明显竞争力的话。
几位用户询问了部署的可及性，包括是否会提供 GGUF 量化构建版本，以及 Cohere 是否计划发布与可在消费级 GPU 上运行的旧版 command-r7b 相当的 更小 Command 系列模型。技术上的担忧是本地推理的可行性，而非仅限 API 或企业级部署。
一位评论者强调，最初的 Command R+ 在其时代在 创意工作流和企业资源规划任务 中异常强大，这意味着用户正在根据该先前模型的实际长上下文/企业实用性来评估新的 Command-A 系列，而不仅仅是通用的聊天机器人基准测试。

AI 社区周报：Claude 代码工作流、Anthropic 免费课程与 AI 裁员潮

来源：/r/Singularity, /r/Oobabooga, /r/MachineLearning, /r/OpenAI, /r/ClaudeAI, /r/StableDiffusion, /r/ChatGPT, /r/ChatGPTCoding, /r/aivideo

1. Claude Code 工作流与 Anthropic 培训

一位拥有十年经验的软件工程师分享：我用 Claude Code 在手机上"氛围编程"所有副项目，从不读代码，乐趣无穷。以下是我遵循的规则：（热度：1900）：该帖子提出了一种风险可控的"氛围编程"工作流，使用 Claude Code 开发副项目而无需直接阅读生成的代码：从计划模式开始，迭代检查/澄清计划，保持任务足够小以便在脑中建模，要求 AI 生成测试用例，每完成一个计划后提交到 git，在 AI 访问数据库前备份数据库，并使用浏览器/E2E 工具（如 Chrome DevTools MCP）进行实时验证。对于复杂变更，作者建议使用并行审查 AI 进行计划评审、安全审查和测试审计，只有在计划/测试/回滚结构就绪后才切换到自动模式。热门评论普遍认可该工作流是一种相对合理的 AI 编码模式，特别赞同"如果计划大到装不进脑子，那就太大了"这条规则。评论者建议使用 superpowers 技能集使流程可重复，并严格限定 AI 的作用范围：一次变更、一个预期测试、一个回滚点，同时在提示词中明确说明 AI 不应触及的内容。

多位评论者强调将 AI 工作约束在小规模、可验证的范围内："一次变更、一个预期测试、一个回滚点"，提示词中明确说明 AI 不应触及的内容。技术理由是较小的计划能降低调试复杂度，使使用 Claude Code 或类似编码 AI 时的故障更容易定位。

一位评论者建议使用 superpowers 技能集将工作流转化为可重复的脚本化流程，这是一个旨在提供可复用 AI 工作流/技能的 GitHub 项目。这被视为一种让"氛围编程"在项目超越单次提示词生成、进入迭代开发阶段后减少临时性的方法。

Anthropic 正式推出 13+ 门免费 AI 课程并颁发证书（涵盖 Agentic AI 和 Claude Code！）（热度：1585）：Anthropic 推出了免费官方培训目录（可通过 anthropic.com/learn / Anthropic Skilljar 访问），提供证书，涵盖 MCP / Agentic AI、Claude Code、Claude API 使用以及 Amazon Bedrock 和 Google Cloud Vertex AI 的企业部署路径。被重点提及的技术亮点是 Model Context Protocol (MCP) 课程，包括 STDIO 和 StreamableHTTP 传输协议的高级内容，以及 Claude Code 工作流（如代码库编辑、测试执行和"计划模式"）。还有一个与 CodeSignal 合作的免费课程 Developing Claude Agents，提供 Python/TypeScript 的 AI 构建实验和证书。评论者普遍确认这些课程是 Anthropic 提供的官方材料，一位用户指出 Skilljar 链接来自 Anthropic 自己的学习页面。一位已完成 10/15 门课程的用户特别推荐 MCP 和高级 MCP 模块，称其"值得投入时间"。

一位已完成 10/15 门课程的用户特别强调 MCP 和 MCP 高级主题课程技术价值最高，指出其中涵盖的 STDIO 和 StreamableHTTP 传输协议对于从事 Claude/工具集成的开发者尤其有价值。
另一位评论者验证了这些课程是 Anthropic 的官方培训材料，指出 Skilljar 课程链接源自 Anthropic 的官方学习门户 anthropic.com/learn。

Claude 在对话中告诉用户去睡觉，包括 Anthropic 在内似乎没人完全理解它为什么一直这样做（热度：1360）：据报道，Claude 会在对话中途打断用户，给出睡眠/休息建议；引用的文章称，诸如健康提醒或**节省算力的节流策略等解释不太可能成立，因为 Claude 据称缺乏会话使用时长上下文。Anthropic 尚未回应 Fortune 的采访，但 Anthropic 员工 Sam McAllister 在 X 上将这一行为描述为"某种角色特征"，并表示他们"已经意识到这个问题，希望在未来的模型中修复"。评论区的讨论大多是推测性的：用户争论这种行为是涌现的人格/安全训练产物，还是有意为之的产品功能，而文章将其定性为未解决的模型行为 bug，而非策略问题。

引用的摘录认为，睡眠提示不太可能是刻意的健康提醒或算力节流功能，因为 Claude 并未获得用户使用时长的上下文信息。Anthropic 员工 Sam McAllister 在 X 上将这一行为描述为"某种角色特征"，并表示他们"已经意识到这个问题，希望在未来的模型中修复"，暗示这被视为模型行为/对齐产物，而非产品层面的会话管理策略。

2. AI 对劳动力与基础设施的反弹

2026 年了，我们还没看到一场反杏仁农场的抗议。（热度：2679）：该图片是一张语境折线图，论证美国本土杏仁农场的用水量远超数据中心，杏仁用水量从 1999 年的约 550 亿加仑/年增长到 2026 年的近 1,600 亿加仑/年，而数据中心仅呈现适度增长，几乎贴近 x 轴。结合标题——"2026 年了，我们还没看到一场反杏仁农场的抗议"——这张图表与其说是技术基准，不如说是对公众关注 AI/数据中心用水量的批判；图片来源：qy67jhsop82h1.png。评论者反驳称，反杏仁农场的批评早已存在，尤其是在加州水资源政策辩论和纪录片中，还有评论者补充说，高尔夫球场的用水量可能是数据中心的数倍。

多位评论者将杏仁种植置于更广泛的加州水资源分配辩论中，指出杏仁果园在反复出现的干旱和水资源短缺争议中经常被指责。这里提出的技术对比不仅仅是"杏仁 vs. 数据中心"，而是农业与其他大型用水户（如乳制品业、高尔夫球场和计算基础设施）之间的比较。

一位评论者认为，美国高尔夫球场的用水量是数据中心的数倍，暗示公众对 AI/数据中心用水量的批评可能相对于其他娱乐或农业用途而言不成比例。另一位指出，反杏仁农场的批评在纪录片和加州环境讨论中早已存在，尤其是围绕灌溉需求和抗旱能力方面。

马克·扎克伯格的 Meta 开启大规模裁员，裁减 8,000 人（约占员工总数的 10%），AI 冲击科技巨头（热度：1533）：该帖子声称 Meta 正在进行全球裁员，约 8,000 名员工（约占员工总数的 10%），分三波进行，通知通过电子邮件在当地时间凌晨 4 点发送，据报道新加坡员工最先收到。文章将裁员与 AI 驱动的重组联系起来，而评论者则质疑 Meta 的 AI 资本支出需求——例如"Meta 的 AI 需要 $2000亿 做什么？"——以及这家仍雇佣数万人的公司的整体人员效率。热门评论对"冲击"一词提出异议，认为裁员并非破坏，而是 AI 采纳的预期收益，公司可能越来越多地以此向投资者展示积极面。其他人则认为 Meta 的反复裁员已是常态，并质疑该公司为何需要如此庞大的员工队伍。

评论者质疑裁员是否真的是AI 驱动的，还是对零利率时代招聘热潮的修正：一位指出 Meta 的员工人数仍高于 2020 年水平，暗示裁员可能反映了后过度招聘的正常化，而非直接的自动化影响。
提出的一个技术/战略关切是 Meta 报告的 $2000亿 AI 支出：评论者质疑什么样的基础设施或产品路线图能证明这一规模的合理性，这暗示了巨大的算力、数据中心和模型训练资本支出，而非普通的软件人员需求。
多条评论将 AI 采纳视为一种持续的运营模式转变，一位预测随着 AI 工具替代部分白领和工程劳动力，大型组织将出现每年 10–20% 的持续人员缩减。