AI 快讯 · 第 2 页
-
JetBrains 开源 Mellum2:12B MoE 编程模型,专为多模型 AI 流水线中的快速任务设计
JetBrains 发布 Mellum2,一个 12B 参数的 MoE 模型,激活参数仅 2.5B,擅长代码生成、调试、工具调用等软件工程任务。Apache 2.0 许可,支持本地部署。本文详解架构、性能、适用场景,并分析对中文开发者的意义。
-
Amazon Nova 2 Lite 物体检测:用自然语言描述物体,无需训练即可获得精确边界框
AWS 推出 Amazon Nova 2 Lite 物体检测方案,通过自然语言提示即可识别物体并返回 JSON 格式边界框,无需模型训练或 ML 专家。本文详解部署步骤、提示工程技巧及成本估算,并探讨在制造、农业、物流等场景的应用。
-
OpenAI 为 Codex 推出数据分析、销售等角色插件,非开发者用户增速是开发者三倍
OpenAI 为 Codex 新增数据分析、销售和投行专用插件,周活用户达 500 万,其中非开发者占比 20% 且增速是开发者的三倍。本文解读 Codex 向通用工作应用转型的细节、对中文用户的可用性及国产替代方案。
-
OpenAI 发布 Codex 新工具,瞄准白领工作场景,企业自动化再升级
OpenAI 于 6 月 2 日推出 Codex 新功能,扩展其在知识工作中的应用,并发布内部报告揭示使用模式。本文解读新工具对企业用户的意义,并分析中文圈用户如何利用或替代。
-
OpenAI 模型登陆 AWS Bedrock:GPT-5.5 和 Codex 现可通过亚马逊云服务使用
OpenAI 的 GPT-5.5、GPT-5.4 和 Codex 模型现已通过 Amazon Bedrock 提供,价格与 OpenAI 自有平台一致,支持商业和政府区域,目前仅限美国。使用量可计入现有 AWS 合同,为企业用户提供更便捷的部署方式。
-
Pasted File Editor:一个将大段文本自动转为文件附件的开源工具
受 Claude 大段粘贴自动转文件功能启发,开发者 Simon Willison 用 Codex 构建了 Pasted File Editor 原型。支持粘贴文本、打开图片缩略图、拖拽文件,纯前端 JavaScript 实现,无需上传服务器。对中文用户而言,这是一个可本地运行的轻量工具,适合处理长文本或临时文件管理。
-
Amazon Nova Forge 超参数调优指南:如何在领域微调中平衡专业能力与通用性能
AWS 发布 Amazon Nova Forge 超参数调优实战指南,详解学习率、数据混合比、checkpoint 选择等关键参数对领域微调的影响。本文编译核心内容并补充中文用户视角,帮助开发者避免灾难性遗忘和训练失败,提升模型定制效率。
-
TinyFish 发布 BigSet:开源多智能体系统,用一句话描述自动生成结构化实时数据集
TinyFish 推出 BigSet,一个开源多智能体系统,只需用自然语言描述需求,即可自动从网络搜索、提取、去重并生成结构化数据集(CSV/XLSX)。支持定时刷新,自托管部署,适合数据采集、市场调研等场景。本文详解架构、技术栈与部署步骤。
-
巴菲特旗下伯克希尔·哈撒韦投资100亿美元支持Alphabet AI基础设施建设
Alphabet计划筹集800亿美元扩建AI基础设施,巴菲特旗下伯克希尔·哈撒韦私人投资100亿美元。2026年资本支出预计达1900亿美元,且将持续增长。了解这对AI行业和中文用户的影响。
-
微软发布 MAI-Thinking-1 和 MAI-Code-1-Flash 两款小参数模型,强调合规数据训练
微软发布两款新文本 LLM:MAI-Thinking-1(35B 参数推理模型)和 MAI-Code-1-Flash(5B 参数代码模型),后者专为 GitHub Copilot 和 VS Code 设计。微软声称 MAI-Thinking-1 在盲测中优于 Sonnet 4.6,且两款模型均使用清洁、合规的商业许可数据训练,未蒸馏第三方模型。本文解读这两款模型的技术亮点、对中文开发者的…
-
AWS FSx for Lustre + GPUDirect 加速 LLM 模型加载,TurboQuant 扩展上下文窗口
AWS 发布新方案,通过 FSx for Lustre 与 NVIDIA GPUDirect Storage 结合,将 LLM 模型冷启动加载时间从 10-20 分钟缩短至秒级。同时 TurboQuant KV cache 技术显著增大上下文窗口。本文详解技术原理、性能数据及对中文用户的实际影响。
-
NVIDIA DOCA 芯片级安全:为 Agentic AI 基础设施提供硬件防护
NVIDIA 发布 DOCA In-Silicon Security,在 DPU 芯片中嵌入安全功能,为 AI 工厂和 Agentic AI 提供硬件级防护。本文解读该技术如何应对 AI 基础设施的新攻击面,并分析对国内 AI 基础设施安全建设的启示。
-
AgentOps实践:用Amazon Bedrock AgentCore规模化运营智能体AI
AWS发布AgentOps框架,基于Amazon Bedrock AgentCore解决智能体AI在生产中的治理、成本、调试难题。本文详解四大支柱(治理安全、构建运维、评估、可观测性)及CI/CD流水线,为中文用户提供可落地的AgentOps参考架构。
-
AI重塑游戏开发:90%开发者已用AI,Steam 2025年AI游戏激增681%
Google Cloud调查显示90%游戏开发者已整合AI,Steam 2025年有7818款游戏披露使用AI,同比增长681%。本文详解AI在NPC、资产创建、QA测试、程序化生成等环节的具体应用,并分析对中文游戏开发者、独立创作者及国内游戏行业的影响。
-
Amazon Quick 集成 KDB-X 时间序列数据库,用自然语言查询市场数据
Amazon Quick 通过 MCP 协议集成 KDB-X 时间序列数据库,让金融分析师用自然语言查询高频交易数据,无需编写 SQL。本文详解部署步骤,并分析对中文金融用户的实用价值与替代方案。
-
Anthropic 秘密提交 IPO 申请,Claude 母公司估值逼近 1 万亿美元
Anthropic 已向 SEC 秘密提交 IPO 注册草案,最新融资后估值近 1 万亿美元。竞争对手 OpenAI 也在筹备上市。本文分析对中文圈用户的影响:国内能否使用 Claude?国产模型如何应对?
-
NVIDIA Cosmos 3发布:物理AI推理、世界与动作模型开发平台
NVIDIA推出Cosmos 3,一个前沿物理AI基础模型,整合物理推理、世界建模与动作生成,助力机器人、自动驾驶等系统理解并交互真实世界。本文详解其核心能力、技术突破及对中文开发者与产业的影响。
-
Amazon Bedrock AgentCore 支付功能预览:为 AI Agent 提供安全内置护栏,防止失控消费
AWS 推出 AgentCore 支付预览版,与 Coinbase 和 Stripe 合作,让 AI Agent 能代表用户安全支付。文章详解了防止失控消费、用户授权、密钥保护等内置护栏机制,对构建支付型 Agent 的开发者有重要参考价值。
-
Amazon Bedrock AgentCore Gateway 扩展 MCP 支持:企业级工具、提示词与资源统一管理
AWS 为 Bedrock AgentCore Gateway 新增 MCP 工具 schema、提示词、资源、动态列表、流式会话、OAuth 2.0 等功能,实现企业级 MCP 服务器集中治理。了解新特性对中文开发者和企业的实际意义。
-
黑客仅用一句话就让Meta AI交出高知名度Instagram账号控制权
黑客通过简单对话向Meta AI客服机器人请求,成功接管高知名度Instagram账号。本文分析事件经过、安全漏洞本质,并探讨对中文用户的影响及防范建议。