AI 快讯

marktechpost #模型微调#QLoRA#DPO

LFM2 模型微调教程：用 QLoRA 和 DPO 在 Google Colab 上完整实现

本文提供一份完整的 LFM2 模型微调教程，涵盖 QLoRA、监督微调（SFT）和直接偏好优化（DPO），所有步骤均在 Google Colab 上运行，使用 TRL 和 PEFT 等开源工具。适合希望低成本微调大模型的开发者。

2026/06/03
marktechpost #模型发布#NVIDIA#物理AI#世界模型#开源

NVIDIA 开源 Cosmos 3：双塔 MoT 架构统一物理推理、世界生成与动作生成

NVIDIA 发布 Cosmos 3 系列开源世界模型，采用双塔 Mixture-of-Transformers 架构，将物理推理、视频生成和机器人动作生成统一在一个模型中。提供 16B/64B 两种规模，支持文本、图像、视频和动作输入，输出物理感知视频与同步音效。本文详解架构、性能与中文用户实际应用场景。

2026/06/03
ai_news #量子计算#Agentic AI#微软

微软Majorana 2量子芯片发布：可靠性提升1000倍，Agentic AI加速研发周期

微软发布Majorana 2量子芯片，量子比特可靠性提升1000倍，平均寿命达20秒。背后Agentic AI平台Microsoft Discovery同步GA，可压缩实验周期，已用于材料科学等领域。本文解读技术细节及对中文圈研发团队的启示。

2026/06/03
marktechpost #模型发布#工具评测#开源

Nous Research 发布 Hermes Desktop：开源 AI Agent 的跨平台桌面端，支持流式工具输出

Nous Research 推出 Hermes Desktop 公开预览版，为开源 Hermes Agent 提供原生 macOS/Windows/Linux 图形界面。无需终端即可使用，支持流式工具输出、跨会话记忆、自改进技能，并与 CLI 共享核心和配置。本文详解功能、中文用户适用性及国产替代对比。

2026/06/03
ai_news #行业分析#成本控制#企业AI应用

沃尔玛限制员工AI助手使用量：大模型成本压力从企业预算表传导到每个工位

沃尔玛开始给员工分配固定AI token额度，限制内部AI助手Code Puppy的使用。背后是LLM从固定订阅转向按量计费，企业面临生产力提升与成本飙升的两难。本文分析事件细节、token maxxing现象，并探讨对国内企业和AI厂商的启示。

2026/06/03
the_decoder #模型发布#开源#AI 智能体

Nous Research 发布 Hermes Desktop：跨平台开源 AI 智能体应用，MIT 许可

Nous Research 推出 Hermes Desktop，一款 MIT 许可的开源 AI 智能体应用，支持多平台运行。本文介绍其核心功能、对中文用户的意义及与国产同类产品的对比。

2026/06/03
the_decoder #融资#AI音乐#版权诉讼

AI音乐初创公司Suno估值翻倍至54亿美元，同时与唱片公司打官司

Suno完成4亿美元融资，估值达54亿美元，较此前翻倍。这家AI音乐生成公司正面临环球、索尼等唱片公司的版权诉讼。本文分析融资细节、法律争议，以及对中文用户使用AI音乐工具的影响。

2026/06/03
marktechpost #模型发布#多模态#智能体

阿里千问发布 Qwen3.7-Plus：多模态智能体模型，支持视觉理解、深度推理与自主迭代，已在百炼平台上线

阿里 Qwen 团队推出 Qwen3.7-Plus，这是 Qwen3.7 系列的多模态版本，支持图像和视频理解，并具备深度推理、自编程、工具调用、验证测试和自主迭代等智能体能力。模型通过阿里云百炼平台（国际版 Model Studio）提供 API 服务。在 Vision Arena 排行榜中，预览版位列第 16，阿里成为视觉领域第五大实验室。本文详解其能力、基准表现及对中文开发者的实际…

2026/06/02
ai_news #行业分析#IPO#企业应用

Anthropic 提交 IPO 申请：生成式 AI 从研发驱动走向企业级公用事业

Anthropic 提交 IPO 申请，标志着生成式 AI 从研发密集型创业阶段走向稳定的企业级公用事业。本文分析 IPO 对定价、API 策略、企业合同的影响，以及中文圈用户如何应对即将到来的变化。

2026/06/02
the_decoder #安全#模型发布#行业分析

Anthropic 扩展 Project Glasswing：150 家合作伙伴在 15 国用 Claude 扫描关键软件漏洞

Anthropic 将 Project Glasswing 扩展至 15 国 150 家合作伙伴，使用 Claude Mythos Preview 扫描关键基础设施漏洞，已发现超 1 万个严重漏洞。同时推出 Claude Security 商业修复方案。本文分析对中文圈安全从业者的启示与替代方案。

2026/06/02
nvidia_developer #AI Agent#Windows#NVIDIA#微软#本地AI

微软与NVIDIA联手：在Windows PC上构建个人AI Agent的新工具发布

微软和NVIDIA合作推出新工具，让开发者在Windows PC上轻松构建本地AI Agent，支持离线运行、增强安全性和性能优化。本文详解工具功能、对中文开发者的意义及与国产方案的对比。

2026/06/02
aws_ml_blog #AWS#MCP#OAuth#安全

AWS AgentCore Gateway 为 MCP 服务器配置 OAuth 授权码流程，保障 AI 助手安全访问

本文介绍如何使用 Amazon Bedrock AgentCore Gateway 为 MCP 服务器配置 OAuth 授权码流程，实现 AI 助手（如 Kiro IDE）请求的认证与授权。涵盖 IdP 配置、Gateway 设置、客户端集成等步骤，适合企业级安全部署。

2026/06/02
nvidia_developer #边缘计算#AI Agent#NVIDIA Jetson

NVIDIA JetPack 7.2 发布：边缘端部署 Agentic AI，内存效率大幅提升，中文开发者如何受益？

NVIDIA 发布 JetPack 7.2，支持一键部署 NemoClaw 开源栈，为边缘 AI Agent 提供隐私安全控制。本文解读其技术亮点、对中文开发者的实际意义，以及与国产边缘 AI 方案的对比。

2026/06/02
nvidia_developer #AI Agent#NVIDIA#开源方案

Hermes Agent 结合 NVIDIA NemoClaw 部署自进化 AI Agent，加速安全研究

NVIDIA 发布开源方案，将 Hermes Agent 与 NemoClaw 结合，实现跨 Outlook、Slack、GitHub 的自进化 AI Agent，在保证数据安全的前提下加速研究。本文详解其架构、安全机制及对中文开发者的实用价值。

2026/06/02
interconnects #行业分析#模型发布#开放研究

告别Ai2：Open Language Model（Olmo）团队核心成员离职，反思开放研究路径

Nathan Lambert宣布离开艾伦人工智能研究所（Ai2），回顾参与Olmo模型、Tülu 3等项目的经历，分享开放研究对AI安全与扩散的价值，并探讨学术与工业之间的独特定位。

2026/06/02
ai_news #GitHub Copilot#Token 计费#开发者工具

GitHub Copilot 改用 Token 计费后用户成本飙升：开发者社区炸锅

GitHub Copilot 于 2026 年 6 月 1 日起从固定月费转为基于 Token 的按量计费，大量用户反映 Credits 消耗远超预期，单次代码审查或小修改成本高达数美元。本文详解新定价机制、用户真实反馈，并分析对中文开发者的影响及替代方案。

2026/06/02
the_decoder #安全漏洞#AI聊天机器人#账号劫持

黑客仅通过向Meta AI聊天机器人发指令就劫持了Instagram高知名度账号，包括奥巴马白宫页面

黑客利用Meta AI客服聊天机器人漏洞，仅通过对话请求就更改了Instagram账号的绑定邮箱，绕过双重认证，成功劫持包括奥巴马白宫在内的多个高知名度账号。Meta已修复漏洞，但安全研究人员称新漏洞已在Telegram传播。本文分析事件详情及对中文用户的启示。

2026/06/02
aws_ml_blog #AI代码审查#Amazon Bedrock#AgentCore

Baz 借助 Amazon Bedrock AgentCore 提升 AI 代码审查准确率，自动验证产品需求与设计一致性

Baz 利用 Amazon Bedrock 和 AgentCore 构建 Spec Review 智能体，自动对比代码实现与 Figma 设计稿及 Jira 需求，将 bug 减少 50%，合并时间缩短 30-70%。本文详解架构设计与实现细节，对中文开发团队有重要参考价值。

2026/06/02
marktechpost #模型训练#性能优化#工具评测

NVIDIA Apex 加速 Transformer 训练实战：FusedAdam、FusedLayerNorm 与 torch.amp 对比评测

本文从源码编译 NVIDIA Apex，实测 FusedAdam、FusedLayerNorm 等融合内核在 Transformer 训练中的加速效果，并与原生 PyTorch 及 torch.amp 对比。适合需要优化 GPU 训练效率的深度学习开发者。

2026/06/02
marktechpost #模型发布#开源#编程工具

JetBrains 开源 Mellum2：12B MoE 编程模型，专为多模型 AI 流水线中的快速任务设计

JetBrains 发布 Mellum2，一个 12B 参数的 MoE 模型，激活参数仅 2.5B，擅长代码生成、调试、工具调用等软件工程任务。Apache 2.0 许可，支持本地部署。本文详解架构、性能、适用场景，并分析对中文开发者的意义。

2026/06/02