AI 快讯 · 第 4 页
-
Loguru Python日志库实战教程:构建健壮、结构化、并发安全的日志管道
本文通过完整代码示例,演示如何使用Loguru库在Python中构建生产级日志系统。涵盖结构化日志、上下文绑定、自定义级别、异步日志、多进程安全、文件轮转压缩等核心功能,并附有中文用户视角的实用建议。
-
AI搜索代理被曝“假搜索”:用网络验证记忆而非真正研究,新基准揭穿GPT-5.4和Kimi K2.6
哈尔滨工业大学研究团队通过新基准LiveBrowseComp发现,GPT-5.4、Kimi K2.6等顶级AI搜索代理在测试中主要依赖训练记忆而非实时搜索。一旦问题涉及近90天内的新事件,性能大幅下降。这对依赖AI搜索获取最新信息的用户意味着什么?
-
微软Agent治理工具包实战教程:用策略、审批、审计日志和安全控制保障AI Agent工具调用安全
本文基于微软Agent Governance Toolkit,手把手教你构建一个带治理层的AI Agent工作流:通过YAML策略控制数据库操作、邮件发送、Shell执行等敏感行为,实现审批、沙箱、审计日志和紧急终止。适合关注AI Agent安全落地的开发者。
-
Anthropic面试禁用AI工具,五轮考核考察真实思考能力,最高年薪85万美元
Anthropic在面试中全面禁止使用AI工具,通过最多五轮考核评估候选人的技能、价值观和伦理思维。最高年薪达85万美元,部分应聘者甚至花费4600美元参加由现任员工匿名提供的面试辅导。了解这一独特招聘策略对AI行业人才竞争的影响。
-
Anthropic研究:社会科学领域男性使用AI编程代理频率是女性两倍以上
Anthropic最新研究发现,在社会科学研究中,男性研究者使用AI编程代理(coding agents)的频率是女性的两倍以上,且这一性别差距远超通用AI工具。经济学领域使用率最高达39%,教育研究仅4%。本文解读该发现对中文科研圈的影响与启示。
-
Epicure 模型:AI 推荐鸡肉配菜,基于食谱还是分子化学?伦敦初创 Kaikaku.AI 发布三款风味嵌入模型
伦敦初创公司 Kaikaku.AI 推出 Epicure 系列 AI 模型,基于 414 万份食谱和 FlavorDB 风味数据库训练,能区分食材的食谱搭配与化学关联。纯化学模型在口味和营养分类上表现更优,为 AI 在美食推荐和食品科学领域开辟新路径。
-
SkillNet 教程:构建技能增强型 AI Agent,支持搜索、评估、图分析与任务规划
本文通过 SkillNet 框架演示如何发现、安装、评估和组织可复用的 AI 技能,并构建一个技能增强型 Agent 规划器。涵盖关键词/语义搜索、质量门控、技能关系可视化等实操步骤,适合 AI 开发者快速上手。
-
Anthropic 营收计算方式曝光:按消耗量乘以13加订阅费乘以12,AI 收入指标存疑
路透社评论文章揭露 Anthropic 的“年化营收”计算方式:将过去28天按消耗量计费的客户销售额乘以13,再加上月度订阅费乘以12。这种算法可能夸大实际收入,对 AI 行业的财务透明度提出质疑。中文圈用户需警惕类似营收指标,关注国产 AI 厂商的财务披露方式。
-
软银计划在法国投资750亿欧元建设AI数据中心,总容量达5吉瓦
软银宣布在法国建设AI数据中心,投资高达750亿欧元,总容量5吉瓦,是其在欧洲最大的AI基础设施投资。计划到2031年完成450亿欧元设施,但此前多个大型项目尚未兑现。本文分析对中文圈用户的影响及与国内数据中心的对比。
-
AI 订阅该不该取消?一位开发者用 Claude 快速生成 16 个项目后陷入反思
开发者 David Wilson 用 AI 工具快速生成了 16 多个项目,却发现大部分被废弃。他反思 AI 是“热核级 ADHD 放大器”,并考虑取消订阅。本文编译分析这一现象,探讨对中文圈开发者的启示:AI 带来的注意力碎片化与项目维护困境。
-
Trajectory 发布并发多 LoRA 训练栈,持续学习实验吞吐量提升 2.81 倍
Trajectory 联合 UC Berkeley Sky Lab 和 Anyscale 推出并发多 LoRA 训练栈 C-LoRA,在持续学习场景下实现 2.81 倍端到端实验吞吐量提升,无奖励回归。代码已在 NovaSky-AI/SkyRL 开源,为中文开发者提供高效 RL 训练新思路。
-
攻击者利用ChatGPT和Claude共享聊天功能传播恶意软件,伪装错误信息绕过安全检测
攻击者滥用ChatGPT和Claude的共享聊天链接,将恶意软件伪装成错误提示或安装指南,利用受信任域名绕过安全工具。了解这种新型攻击手法、对中文用户的风险及防范建议。
-
2026年最佳TTS模型对比:基于基准测试的评测
本文对比了2026年主流TTS模型,包括Inworld TTS-1.5、Google Gemini 3.1 Flash TTS、ElevenLabs v3等,从质量、延迟、成本、语言覆盖等维度分析,帮助工程师选择适合生产环境的模型。
-
Amazon SageMaker AI LLM推理全面可观测性:从GPU利用率到模型质量监控方案
AWS发布基于Managed Grafana的LLM推理可观测性方案,覆盖GPU利用率、延迟、成本等基础设施指标与模型输出质量、安全评分。对中文用户,该方案可对比国内云厂商类似能力,适用于需要精细监控LLM推理成本与质量的团队。
-
Genesis AI 发布 Genesis World 1.0 物理平台:四组件加速机器人基础模型评估,仿真与真实相关性达 0.8996
Genesis AI 于 2026 年 5 月 27 日推出 Genesis World 1.0,包含物理引擎、实时路径追踪渲染器 Nyx、Python-to-GPU 编译器 Quadrants 及仿真接口。该系统将策略评估时间从 200 多小时缩短至 0.5 小时以内,仿真与真实机器人 Pearson 相关系数达 0.8996。对中文机器人开发者而言,这意味着更快的模型迭代和更低成本的…
-
Hermes Agent 引入 Tool Search 解决 MCP 上下文膨胀,Anthropic 评测显示 Opus 4 准确率从 49% 提升至 74
Nous Research 的开源 Hermes Agent 新增 Tool Search 功能,通过 BM25 渐进式披露解决 MCP 工具上下文膨胀问题。Anthropic 内部评测显示,Claude Opus 4 准确率从 49% 提升至 74%,Opus 4.5 从 79.5% 提升至 88.1%,同时工具定义 token 使用量减少 85%。了解这一技术如何降低成本和提升模型决…
-
AgentTrove 教程:用 Python 流式处理 170 万条 Agent 交互轨迹并构建 SFT 数据集
本文介绍如何流式加载 AgentTrove 数据集(170 万条 agent 交互轨迹),无需完整下载即可分析对话结构、提取命令、可视化轨迹分布,并导出为 ShareGPT 格式用于监督微调。适合需要构建 agent 训练数据的中文开发者。
-
Anthropic 公开 Claude 沙箱技术细节:gVisor、Seatbelt 与 VM 隔离方案
Anthropic 发布技术博客详解 Claude.ai、Claude Code 和 Cowork 的沙箱隔离机制,包括 gVisor、Seatbelt、Bubblewrap 和完整 VM 方案,并披露了 api.anthropic.com/v1/files 数据泄露漏洞。对中文用户而言,了解这些安全设计有助于评估 AI 工具的风险,并对比国内同类产品的隔离水平。
-
资深开发者 Chad Whitacre 因 AI 宣布退出科技行业,选择离线生活
Chad Whitacre 因 AI 成为压垮骆驼的最后一根稻草,宣布退出科技行业,包括开源社区。他计划成为“AI 阿米什人”,回归 1980 年代的生活方式。本文分析这一决定背后的原因,并探讨对中文圈开发者的启示。
-
大规模研究发现:AI聊天机器人越“有用”,越难模拟人类行为
一项涵盖20.8万参与者和2600万回复的大规模研究表明,将语言模型训练成有用聊天机器人的过程,反而削弱了它们模拟人类行为的能力。这一效应随着模型迭代而加剧,甚至流行的“角色扮演”技巧也收效甚微。了解这一发现对AI行为模拟和中文应用场景的影响。