AI 快讯
-
LFM2 模型微调教程:用 QLoRA 和 DPO 在 Google Colab 上完整实现
本文提供一份完整的 LFM2 模型微调教程,涵盖 QLoRA、监督微调(SFT)和直接偏好优化(DPO),所有步骤均在 Google Colab 上运行,使用 TRL 和 PEFT 等开源工具。适合希望低成本微调大模型的开发者。
-
NVIDIA 开源 Cosmos 3:双塔 MoT 架构统一物理推理、世界生成与动作生成
NVIDIA 发布 Cosmos 3 系列开源世界模型,采用双塔 Mixture-of-Transformers 架构,将物理推理、视频生成和机器人动作生成统一在一个模型中。提供 16B/64B 两种规模,支持文本、图像、视频和动作输入,输出物理感知视频与同步音效。本文详解架构、性能与中文用户实际应用场景。
-
微软Majorana 2量子芯片发布:可靠性提升1000倍,Agentic AI加速研发周期
微软发布Majorana 2量子芯片,量子比特可靠性提升1000倍,平均寿命达20秒。背后Agentic AI平台Microsoft Discovery同步GA,可压缩实验周期,已用于材料科学等领域。本文解读技术细节及对中文圈研发团队的启示。
-
Nous Research 发布 Hermes Desktop:开源 AI Agent 的跨平台桌面端,支持流式工具输出
Nous Research 推出 Hermes Desktop 公开预览版,为开源 Hermes Agent 提供原生 macOS/Windows/Linux 图形界面。无需终端即可使用,支持流式工具输出、跨会话记忆、自改进技能,并与 CLI 共享核心和配置。本文详解功能、中文用户适用性及国产替代对比。
-
沃尔玛限制员工AI助手使用量:大模型成本压力从企业预算表传导到每个工位
沃尔玛开始给员工分配固定AI token额度,限制内部AI助手Code Puppy的使用。背后是LLM从固定订阅转向按量计费,企业面临生产力提升与成本飙升的两难。本文分析事件细节、token maxxing现象,并探讨对国内企业和AI厂商的启示。
-
Nous Research 发布 Hermes Desktop:跨平台开源 AI 智能体应用,MIT 许可
Nous Research 推出 Hermes Desktop,一款 MIT 许可的开源 AI 智能体应用,支持多平台运行。本文介绍其核心功能、对中文用户的意义及与国产同类产品的对比。
-
AI音乐初创公司Suno估值翻倍至54亿美元,同时与唱片公司打官司
Suno完成4亿美元融资,估值达54亿美元,较此前翻倍。这家AI音乐生成公司正面临环球、索尼等唱片公司的版权诉讼。本文分析融资细节、法律争议,以及对中文用户使用AI音乐工具的影响。
-
阿里千问发布 Qwen3.7-Plus:多模态智能体模型,支持视觉理解、深度推理与自主迭代,已在百炼平台上线
阿里 Qwen 团队推出 Qwen3.7-Plus,这是 Qwen3.7 系列的多模态版本,支持图像和视频理解,并具备深度推理、自编程、工具调用、验证测试和自主迭代等智能体能力。模型通过阿里云百炼平台(国际版 Model Studio)提供 API 服务。在 Vision Arena 排行榜中,预览版位列第 16,阿里成为视觉领域第五大实验室。本文详解其能力、基准表现及对中文开发者的实际…
-
Anthropic 提交 IPO 申请:生成式 AI 从研发驱动走向企业级公用事业
Anthropic 提交 IPO 申请,标志着生成式 AI 从研发密集型创业阶段走向稳定的企业级公用事业。本文分析 IPO 对定价、API 策略、企业合同的影响,以及中文圈用户如何应对即将到来的变化。
-
Anthropic 扩展 Project Glasswing:150 家合作伙伴在 15 国用 Claude 扫描关键软件漏洞
Anthropic 将 Project Glasswing 扩展至 15 国 150 家合作伙伴,使用 Claude Mythos Preview 扫描关键基础设施漏洞,已发现超 1 万个严重漏洞。同时推出 Claude Security 商业修复方案。本文分析对中文圈安全从业者的启示与替代方案。
-
微软与NVIDIA联手:在Windows PC上构建个人AI Agent的新工具发布
微软和NVIDIA合作推出新工具,让开发者在Windows PC上轻松构建本地AI Agent,支持离线运行、增强安全性和性能优化。本文详解工具功能、对中文开发者的意义及与国产方案的对比。
-
AWS AgentCore Gateway 为 MCP 服务器配置 OAuth 授权码流程,保障 AI 助手安全访问
本文介绍如何使用 Amazon Bedrock AgentCore Gateway 为 MCP 服务器配置 OAuth 授权码流程,实现 AI 助手(如 Kiro IDE)请求的认证与授权。涵盖 IdP 配置、Gateway 设置、客户端集成等步骤,适合企业级安全部署。
-
NVIDIA JetPack 7.2 发布:边缘端部署 Agentic AI,内存效率大幅提升,中文开发者如何受益?
NVIDIA 发布 JetPack 7.2,支持一键部署 NemoClaw 开源栈,为边缘 AI Agent 提供隐私安全控制。本文解读其技术亮点、对中文开发者的实际意义,以及与国产边缘 AI 方案的对比。
-
Hermes Agent 结合 NVIDIA NemoClaw 部署自进化 AI Agent,加速安全研究
NVIDIA 发布开源方案,将 Hermes Agent 与 NemoClaw 结合,实现跨 Outlook、Slack、GitHub 的自进化 AI Agent,在保证数据安全的前提下加速研究。本文详解其架构、安全机制及对中文开发者的实用价值。
-
告别Ai2:Open Language Model(Olmo)团队核心成员离职,反思开放研究路径
Nathan Lambert宣布离开艾伦人工智能研究所(Ai2),回顾参与Olmo模型、Tülu 3等项目的经历,分享开放研究对AI安全与扩散的价值,并探讨学术与工业之间的独特定位。
-
GitHub Copilot 改用 Token 计费后用户成本飙升:开发者社区炸锅
GitHub Copilot 于 2026 年 6 月 1 日起从固定月费转为基于 Token 的按量计费,大量用户反映 Credits 消耗远超预期,单次代码审查或小修改成本高达数美元。本文详解新定价机制、用户真实反馈,并分析对中文开发者的影响及替代方案。
-
黑客仅通过向Meta AI聊天机器人发指令就劫持了Instagram高知名度账号,包括奥巴马白宫页面
黑客利用Meta AI客服聊天机器人漏洞,仅通过对话请求就更改了Instagram账号的绑定邮箱,绕过双重认证,成功劫持包括奥巴马白宫在内的多个高知名度账号。Meta已修复漏洞,但安全研究人员称新漏洞已在Telegram传播。本文分析事件详情及对中文用户的启示。
-
Baz 借助 Amazon Bedrock AgentCore 提升 AI 代码审查准确率,自动验证产品需求与设计一致性
Baz 利用 Amazon Bedrock 和 AgentCore 构建 Spec Review 智能体,自动对比代码实现与 Figma 设计稿及 Jira 需求,将 bug 减少 50%,合并时间缩短 30-70%。本文详解架构设计与实现细节,对中文开发团队有重要参考价值。
-
NVIDIA Apex 加速 Transformer 训练实战:FusedAdam、FusedLayerNorm 与 torch.amp 对比评测
本文从源码编译 NVIDIA Apex,实测 FusedAdam、FusedLayerNorm 等融合内核在 Transformer 训练中的加速效果,并与原生 PyTorch 及 torch.amp 对比。适合需要优化 GPU 训练效率的深度学习开发者。
-
JetBrains 开源 Mellum2:12B MoE 编程模型,专为多模型 AI 流水线中的快速任务设计
JetBrains 发布 Mellum2,一个 12B 参数的 MoE 模型,激活参数仅 2.5B,擅长代码生成、调试、工具调用等软件工程任务。Apache 2.0 许可,支持本地部署。本文详解架构、性能、适用场景,并分析对中文开发者的意义。