AI 快讯 · 第 6 页
-
OpenAI免费开放生命科学模型GPT-Rosalind,助力全球政府应对下一场大流行病
OpenAI推出Rosalind Biodefense计划,免费提供生命科学AI模型GPT-Rosalind,用于大流行病防范和生物防御。早期合作伙伴包括劳伦斯利弗莫尔国家实验室、约翰霍普金斯大学和疫苗倡议CEPI,全球机构均可申请。
-
Step 3.7 Flash 登陆 NVIDIA GPU:198B 参数多模态模型企业级部署指南
StepFun 发布 Step 3.7 Flash 多模态 AI 模型,198B 参数,支持图像、文档、视频实时推理,现已可在 NVIDIA GPU 上部署。本文解读模型能力、企业级特性及对中文开发者的实用价值。
-
OpenAI 发布前沿治理框架,为企业安全部署AI提供合规蓝图
OpenAI 发布 Frontier Governance Framework (FGF),系统性地定义了AI风险分级、安全监控和合规流程,直接对标欧盟AI法案和加州TFAIA。本文解读该框架的核心内容,并分析对中国企业出海AI应用、国产大模型合规建设的参考价值。
-
阶跃星辰发布 Step 3.7 Flash:198B MoE 视觉语言模型,专为编码 Agent 和搜索工作流设计
阶跃星辰推出 Step 3.7 Flash,一个 198B 参数的 MoE 视觉语言模型,支持原生视觉、256k 上下文和 Advisor 模式。在 SWE-Bench Pro 上得分 56.26%,编码性能接近 Claude Opus 4.6 的 97%,成本仅为其九分之一。本文详解其架构、性能、定价及对中文开发者的意义。
-
公司过度迷信AI导致裁员潮:Box创始人称这是“AI精神病”
Box创始人Aaron Levie指出,决定用AI替代你工作的人往往最不了解你的工作内容,称这种现象为“AI精神病”。ClickUp因AI代理裁员22%,2026年科技裁员数已接近2025年全年。本文分析企业过度AI化对中文圈用户的影响及应对建议。
-
Sakana AI 提出 DiffusionBlocks:将残差网络转为独立可训练去噪模块的块训练框架,训练内存降至 1/B
Sakana AI 与东京大学提出 DiffusionBlocks,将残差网络视为扩散模型去噪步骤,实现块级独立训练。训练内存降至 1/B,在 ViT、DiT、MDM、AR Transformer 等架构上性能持平甚至优于端到端训练。本文详解原理、实验与中文用户视角。
-
pgvector 实战教程:在 PostgreSQL 中实现语义、混合、稀疏与量化向量搜索
本文通过 Google Colab 上的完整代码示例,教你如何用 pgvector 扩展将 PostgreSQL 变成强大的向量数据库,涵盖 HNSW 索引、语义搜索、过滤搜索、半精度存储、二进制量化、稀疏向量检索和混合搜索,适合构建 RAG、推荐系统等 AI 应用。
-
亚马逊推出GenAI创作者基金和Project Nara平台,三部AI动画剧集获准制作
亚马逊MGM工作室与AWS联合启动GenAI创作者基金,提供资金和内部AI平台Project Nara访问权限。三部AI动画剧集已投入制作,团队仅用五周完成试播集。亚马逊声称拥有业界唯一端到端AI内容生态系统。
-
Anthropic 发布 Claude Opus 4.8:动态工作流与更便宜的快速模式,支持最多 1000 个子代理
Anthropic 推出 Claude Opus 4.8,同步带来 Claude Code 的两项更新:动态工作流可并行运行多达 1000 个子代理,快速模式速度提升 2.5 倍且价格降低三分之二。本文详解功能原理、Bun 重写案例及对中文开发者的实际影响。
-
Anthropic 发布 Claude Opus 4.8:多项基准超越 GPT-5.5,自纠错能力提升 4 倍
Anthropic 推出 Claude Opus 4.8,在多数基准测试中击败 GPT-5.5 和 Gemini 3.1 Pro,自称“适度但切实的改进”。新模型自检编码错误的能力是前代 4 倍,同时推出动态工作流功能,可并行调度数百个子代理完成代码迁移等复杂任务。了解其性能提升、定价及对中文开发者的实际价值。
-
AWS Quick与Snowflake Cortex AI集成:反洗钱警报调查从90分钟缩短到5分钟
AWS Quick Flows与Snowflake Cortex AI通过MCP协议集成,自动化反洗钱警报分类流程,将调查时间从30-90分钟降至5分钟以内。本文详解架构实现与对国内金融合规场景的启示。
-
用React+Flask搭建自定义门户:嵌入Amazon SageMaker AI MLflow Apps的完整方案
本文介绍如何通过React前端和Flask反向代理构建自定义门户,将Amazon SageMaker AI MLflow Apps嵌入iframe,实现SigV4认证、SSO集成和持久化URL。包含架构解析、CDK部署步骤和中文用户视角的实用建议。
-
Amazon Bedrock AgentCore 数据集管理:构建随 Agent 演进的测试套件
AWS 推出 Bedrock AgentCore 数据集管理功能,支持版本化测试用例和用户模拟,帮助开发者通过稳定离线基线评估 Agent 改进。本文详解工作流程与两种测试场景类型。
-
Anthropic 最强模型 Claude Opus 4.8 登陆 AWS,强化长周期自主任务与编码能力
Anthropic 最新旗舰模型 Claude Opus 4.8 已在 Amazon Bedrock 上线,带来编码、代理任务和专业工作的显著提升,支持数小时独立运行的自主工作流。本文详解其能力升级、行业用例及 AWS 集成方式,帮助 AI 工程师快速上手。
-
LangSmith on AWS 评估深度 AI Agent 实践指南:五种模式与生产监控
本文结合 LangChain 与 Anthropic 的评估经验,教你用 LangSmith on AWS 对深度 Agent(如文本转 SQL)进行离线测试与生产监控。涵盖五种评估模式、pytest 集成及 LLM-as-judge 校准,助你提升 Agent 可靠性。
-
Google Cloud 发布 AI Threat Defense 平台,数分钟内自动发现并修复企业安全漏洞
Google Cloud 推出 AI Threat Defense 平台,利用 AI 自动检测、评估和修补企业系统安全漏洞,旨在应对 AI 加速的网络攻击。该平台整合了收购的技术,可在数分钟内缩小安全缺口。了解其功能、对中文用户的影响及与国内安全产品的对比。
-
Google发布Coral Board单板计算机,可本地运行Gemma 3模型
Google在I/O大会上推出Coral Board,一款专为本地AI推理设计的单板计算机,可直接运行Gemma 3模型。本文解析其硬件规格、应用场景,并探讨对中文开发者和物联网领域的意义。
-
Google Pay 推出通用商业协议,为 AI 代理支付铺路
Google Pay 发布 Universal Commerce Protocol 和新的服务器架构,旨在让 AI 代理能通过 API 直接完成交易,无需模拟人类操作。本文解读该协议的技术细节、对中文用户的影响,以及国内支付生态的应对策略。
-
Liquid AI 发布 LFM2.5-8B-A1B:1.5B 活跃参数的端侧 MoE 模型,支持 128K 上下文和工具调用
Liquid AI 推出 LFM2.5-8B-A1B,一款专为端侧部署设计的稀疏 MoE 模型,总参数量 8.3B 但每 token 仅激活 1.5B,可在消费级硬件上运行。支持 128K 上下文窗口、推理链和工具调用,开源权重。本文详解其架构、性能提升及对中文用户的实际意义。
-
Meta One订阅上线:扎克伯格为AI投入定价,Instagram/Facebook/WhatsApp推出付费附加功能
Meta在全球推出Meta One订阅服务,为Instagram、Facebook和WhatsApp提供AI附加功能,同时开发独立AI产品。本文详解定价、功能及对中文用户的影响,包括国内替代方案和合规考量。