AI 快讯 · 第 6 页

the_decoder #模型发布#生命科学#大流行病防范

OpenAI免费开放生命科学模型GPT-Rosalind，助力全球政府应对下一场大流行病

OpenAI推出Rosalind Biodefense计划，免费提供生命科学AI模型GPT-Rosalind，用于大流行病防范和生物防御。早期合作伙伴包括劳伦斯利弗莫尔国家实验室、约翰霍普金斯大学和疫苗倡议CEPI，全球机构均可申请。

2026/05/29
nvidia_developer #模型发布#多模态AI#企业部署

Step 3.7 Flash 登陆 NVIDIA GPU：198B 参数多模态模型企业级部署指南

StepFun 发布 Step 3.7 Flash 多模态 AI 模型，198B 参数，支持图像、文档、视频实时推理，现已可在 NVIDIA GPU 上部署。本文解读模型能力、企业级特性及对中文开发者的实用价值。

2026/05/29
ai_news #模型安全#企业合规#AI治理

OpenAI 发布前沿治理框架，为企业安全部署AI提供合规蓝图

OpenAI 发布 Frontier Governance Framework (FGF)，系统性地定义了AI风险分级、安全监控和合规流程，直接对标欧盟AI法案和加州TFAIA。本文解读该框架的核心内容，并分析对中国企业出海AI应用、国产大模型合规建设的参考价值。

2026/05/29
marktechpost #模型发布#编码 Agent#视觉语言模型

阶跃星辰发布 Step 3.7 Flash：198B MoE 视觉语言模型，专为编码 Agent 和搜索工作流设计

阶跃星辰推出 Step 3.7 Flash，一个 198B 参数的 MoE 视觉语言模型，支持原生视觉、256k 上下文和 Advisor 模式。在 SWE-Bench Pro 上得分 56.26%，编码性能接近 Claude Opus 4.6 的 97%，成本仅为其九分之一。本文详解其架构、性能、定价及对中文开发者的意义。

2026/05/29
techcrunch_ai #行业分析#裁员#AI替代

公司过度迷信AI导致裁员潮：Box创始人称这是“AI精神病”

Box创始人Aaron Levie指出，决定用AI替代你工作的人往往最不了解你的工作内容，称这种现象为“AI精神病”。ClickUp因AI代理裁员22%，2026年科技裁员数已接近2025年全年。本文分析企业过度AI化对中文圈用户的影响及应对建议。

2026/05/29
marktechpost #模型训练#扩散模型#内存优化

Sakana AI 提出 DiffusionBlocks：将残差网络转为独立可训练去噪模块的块训练框架，训练内存降至 1/B

Sakana AI 与东京大学提出 DiffusionBlocks，将残差网络视为扩散模型去噪步骤，实现块级独立训练。训练内存降至 1/B，在 ViT、DiT、MDM、AR Transformer 等架构上性能持平甚至优于端到端训练。本文详解原理、实验与中文用户视角。

2026/05/28
marktechpost #pgvector#向量搜索#PostgreSQL

pgvector 实战教程：在 PostgreSQL 中实现语义、混合、稀疏与量化向量搜索

本文通过 Google Colab 上的完整代码示例，教你如何用 pgvector 扩展将 PostgreSQL 变成强大的向量数据库，涵盖 HNSW 索引、语义搜索、过滤搜索、半精度存储、二进制量化、稀疏向量检索和混合搜索，适合构建 RAG、推荐系统等 AI 应用。

2026/05/28
the_decoder #AI影视#亚马逊#动画制作

亚马逊推出GenAI创作者基金和Project Nara平台，三部AI动画剧集获准制作

亚马逊MGM工作室与AWS联合启动GenAI创作者基金，提供资金和内部AI平台Project Nara访问权限。三部AI动画剧集已投入制作，团队仅用五周完成试播集。亚马逊声称拥有业界唯一端到端AI内容生态系统。

2026/05/28
marktechpost #模型发布#功能更新#工具评测

Anthropic 发布 Claude Opus 4.8：动态工作流与更便宜的快速模式，支持最多 1000 个子代理

Anthropic 推出 Claude Opus 4.8，同步带来 Claude Code 的两项更新：动态工作流可并行运行多达 1000 个子代理，快速模式速度提升 2.5 倍且价格降低三分之二。本文详解功能原理、Bun 重写案例及对中文开发者的实际影响。

2026/05/28
the_decoder #模型发布#基准测试#编码工具

Anthropic 发布 Claude Opus 4.8：多项基准超越 GPT-5.5，自纠错能力提升 4 倍

Anthropic 推出 Claude Opus 4.8，在多数基准测试中击败 GPT-5.5 和 Gemini 3.1 Pro，自称“适度但切实的改进”。新模型自检编码错误的能力是前代 4 倍，同时推出动态工作流功能，可并行调度数百个子代理完成代码迁移等复杂任务。了解其性能提升、定价及对中文开发者的实际价值。

2026/05/28
aws_ml_blog #反洗钱#AWS#Snowflake#自动化工作流

AWS Quick与Snowflake Cortex AI集成：反洗钱警报调查从90分钟缩短到5分钟

AWS Quick Flows与Snowflake Cortex AI通过MCP协议集成，自动化反洗钱警报分类流程，将调查时间从30-90分钟降至5分钟以内。本文详解架构实现与对国内金融合规场景的启示。

2026/05/28
aws_ml_blog #AWS#MLflow#SageMaker#门户集成#反向代理

用React+Flask搭建自定义门户：嵌入Amazon SageMaker AI MLflow Apps的完整方案

本文介绍如何通过React前端和Flask反向代理构建自定义门户，将Amazon SageMaker AI MLflow Apps嵌入iframe，实现SigV4认证、SSO集成和持久化URL。包含架构解析、CDK部署步骤和中文用户视角的实用建议。

2026/05/28
aws_ml_blog #工具评测#模型评估#AWS

Amazon Bedrock AgentCore 数据集管理：构建随 Agent 演进的测试套件

AWS 推出 Bedrock AgentCore 数据集管理功能，支持版本化测试用例和用户模拟，帮助开发者通过稳定离线基线评估 Agent 改进。本文详解工作流程与两种测试场景类型。

2026/05/28
aws_ml_blog #模型发布#Anthropic#AWS

Anthropic 最强模型 Claude Opus 4.8 登陆 AWS，强化长周期自主任务与编码能力

Anthropic 最新旗舰模型 Claude Opus 4.8 已在 Amazon Bedrock 上线，带来编码、代理任务和专业工作的显著提升，支持数小时独立运行的自主工作流。本文详解其能力升级、行业用例及 AWS 集成方式，帮助 AI 工程师快速上手。

2026/05/28
aws_ml_blog #Agent评估#LangSmith#AWS

LangSmith on AWS 评估深度 AI Agent 实践指南：五种模式与生产监控

本文结合 LangChain 与 Anthropic 的评估经验，教你用 LangSmith on AWS 对深度 Agent（如文本转 SQL）进行离线测试与生产监控。涵盖五种评估模式、pytest 集成及 LLM-as-judge 校准，助你提升 Agent 可靠性。

2026/05/28
the_decoder #安全#AI#Google Cloud

Google Cloud 发布 AI Threat Defense 平台，数分钟内自动发现并修复企业安全漏洞

Google Cloud 推出 AI Threat Defense 平台，利用 AI 自动检测、评估和修补企业系统安全漏洞，旨在应对 AI 加速的网络攻击。该平台整合了收购的技术，可在数分钟内缩小安全缺口。了解其功能、对中文用户的影响及与国内安全产品的对比。

2026/05/28
the_decoder #硬件发布#本地AI#单板计算机

Google发布Coral Board单板计算机，可本地运行Gemma 3模型

Google在I/O大会上推出Coral Board，一款专为本地AI推理设计的单板计算机，可直接运行Gemma 3模型。本文解析其硬件规格、应用场景，并探讨对中文开发者和物联网领域的意义。

2026/05/28
ai_news #支付#AI代理#Google Pay

Google Pay 推出通用商业协议，为 AI 代理支付铺路

Google Pay 发布 Universal Commerce Protocol 和新的服务器架构，旨在让 AI 代理能通过 API 直接完成交易，无需模拟人类操作。本文解读该协议的技术细节、对中文用户的影响，以及国内支付生态的应对策略。

2026/05/28
marktechpost #模型发布#端侧AI#MoE

Liquid AI 发布 LFM2.5-8B-A1B：1.5B 活跃参数的端侧 MoE 模型，支持 128K 上下文和工具调用

Liquid AI 推出 LFM2.5-8B-A1B，一款专为端侧部署设计的稀疏 MoE 模型，总参数量 8.3B 但每 token 仅激活 1.5B，可在消费级硬件上运行。支持 128K 上下文窗口、推理链和工具调用，开源权重。本文详解其架构、性能提升及对中文用户的实际意义。

2026/05/28
the_decoder #订阅服务#AI功能#Meta

Meta One订阅上线：扎克伯格为AI投入定价，Instagram/Facebook/WhatsApp推出付费附加功能

Meta在全球推出Meta One订阅服务，为Instagram、Facebook和WhatsApp提供AI附加功能，同时开发独立AI产品。本文详解定价、功能及对中文用户的影响，包括国内替代方案和合规考量。

2026/05/28