AI 快讯 · 第 3 页
-
Amazon Bedrock AgentCore Gateway 扩展 MCP 支持:企业级工具、提示词与资源统一管理
AWS 为 Bedrock AgentCore Gateway 新增 MCP 工具 schema、提示词、资源、动态列表、流式会话、OAuth 2.0 等功能,实现企业级 MCP 服务器集中治理。了解新特性对中文开发者和企业的实际意义。
-
黑客仅用一句话就让Meta AI交出高知名度Instagram账号控制权
黑客通过简单对话向Meta AI客服机器人请求,成功接管高知名度Instagram账号。本文分析事件经过、安全漏洞本质,并探讨对中文用户的影响及防范建议。
-
Google I/O 2026 幕后:Google 员工如何用 Gemini 全流程筹备大会
Google 官方博客揭秘 I/O 2026 筹备过程,从创意生成、视频制作到活动管理,员工全程使用 Gemini 辅助工作。了解 Gemini 在真实大型活动中的应用场景,以及它对中文用户使用 AI 工具的启发。
-
Memory OS:为Hermes Agent打造6层开源记忆栈,本地持久化存储
Memory OS是一个MIT许可的开源项目,在Hermes Agent基础上构建了6层记忆架构,包括结构化事实、向量数据库和自动知识维基。它完全本地运行,支持多种LLM提供商,通过门控检索和去重机制实现token高效。本文解析其架构、检索流程及对中文开发者的意义。
-
MiniMax M3 开源模型发布:百万 token 上下文窗口,挑战闭源模型性能
中国 AI 公司 MiniMax 发布 M3 开源模型,首次在开放权重模型中实现百万 token 上下文窗口、顶级编程能力和原生多模态。本文解读 M3 的技术亮点、对中文开发者的意义,以及与国产同类模型的对比。
-
MiniMax M3 发布:1M token 上下文、原生多模态与 Agent 编程能力,开源权重即将开放
MiniMax 于 2026 年 6 月 1 日发布 M3 模型,采用自研 MSA 稀疏注意力架构,支持 1M token 上下文窗口、原生图像/视频输入和桌面操作。在 SWE-Bench Pro 上达到 59.0%,超越 GPT-5.5 和 Gemini 3.1 Pro。模型权重和技术报告将在 10 天内开源。本文详解架构创新、基准测试和中文用户视角。
-
Nvidia GTC Taipei发布物理AI三件套:世界模型Cosmos 3、驾驶大脑Alpamayo 2 Super、开源人形机器人平台
Nvidia在GTC Taipei上推出物理AI系列新品:世界模型Cosmos 3、自动驾驶模型Alpamayo 2 Super和开源人形机器人参考平台。本文解读这些技术对中文圈机器人、自动驾驶和AI开发者的实际影响与可用性。
-
NVIDIA DSX OS 发布:开源模块化软件,规模化运营 AI 工厂
NVIDIA 推出 DSX OS,一款开源模块化软件,用于规模化运营 AI 工厂。本文详解其五层堆栈设计、核心功能及对中文圈用户的实际影响,包括国产替代方案与部署建议。
-
Nvidia Nemotron 3 Ultra成美国最强开源模型,但中国仍领先
据基准平台Artificial Analysis,Nvidia新发布的Nemotron 3 Ultra是美国最强大的开源AI模型,但在整体排名上仍落后于中国模型。本文解读该模型的技术亮点、对中文用户的意义及国产替代方案。
-
NVIDIA Vera CPU 发布:为 AI Factory 中的 Agentic 工作负载设立新标准
NVIDIA 发布 Vera CPU,专为 AI Factory 中的 agentic 工作负载设计,提供高吞吐、低延迟的推理和 tool calling 能力。本文解析 Vera 的技术亮点、对中文开发者的实际意义,以及与国产芯片的对比。
-
开源与闭源AI模型走向不同指数曲线:闭源靠智能溢价,开源靠规模扩散
本文分析2026年初AI行业的核心经济分歧:闭源模型(如Anthropic、OpenAI)通过编程Agent等场景收取高额智能溢价,形成类似Apple+Microsoft的寡头格局;开源模型则通过低成本、可定制化覆盖更广泛的企业需求,总市场价值更大。对中文用户意味着:国内开源生态(如DeepSeek、ModelScope)可能更受益于开源扩散路径。
-
OpenAI GPT-5.5、GPT-5.4 和 Codex 在 Amazon Bedrock 上正式可用,定价与官方一致
OpenAI 最新模型 GPT-5.5、GPT-5.4 及编码代理 Codex 已在 Amazon Bedrock 上正式可用。用户可通过 Bedrock 的推理引擎调用这些模型,享受与 OpenAI 官方相同的按 token 定价,且无需额外费用。本文详解功能亮点、中文用户使用门槛及与国产模型的对比。
-
OpenAI重启机器人团队:先做基础设施机器人,终极目标是人人拥有个人机器人
OpenAI在关闭机器人部门五年后重新组建团队,从世界模拟研究项目孵化。CEO Sam Altman的长期愿景是让每个人拥有能做任何事的个人机器人,近期将聚焦基础设施应用。本文解读对中文圈用户的影响与国产替代机会。
-
Parallax:保留 Softmax 注意力并添加学习协方差校正分支,提升 LLM 预训练效率
Parallax 是一种参数化局部线性注意力机制,通过添加可学习的协方差校正分支,在不替换 Softmax 的前提下提升 LLM 预训练性能。在 0.6B 和 1.7B 规模上,配合 Muon 优化器,Perplexity 和下游准确率均优于 Transformer 基线。本文解析其原理、硬件优势及对中文圈用户的潜在影响。
-
Amazon Bedrock AgentCore Identity 支持引用 Secrets Manager 现有密钥,增强凭证安全管控
AWS 宣布 Bedrock AgentCore Identity 可引用 Secrets Manager 中已有的密钥,用户可保留对加密、轮换、标签和资源策略的完全控制。支持跨账户和第三方密钥管理器集成,提升 AI Agent 凭证安全治理能力。
-
NVIDIA DGX Spark 本地运行 AI Agent:更快模型与多节点集群,中文开发者能做什么
NVIDIA 发布 DGX Spark 本地 AI Agent 方案,支持更大上下文窗口、多节点集群和更快推理。本文解读其技术细节,并分析对中文开发者的实际意义:是否需梯子、国产平替、隐私合规等。
-
Amazon Bedrock AgentCore 网关新增 Policy 和 Lambda 拦截器,实现 AI Agent 安全访问控制
AWS 为 Bedrock AgentCore 网关推出 Policy(基于 Cedar 策略语言)和 Lambda 拦截器两种机制,用于 AI Agent 的工具调用安全管控。本文通过湖仓数据 Agent 示例,展示如何实现基于角色的确定性访问控制与动态验证,并组合两者实现地理围栏权限。对构建企业级 Agent 平台的中文开发者具有参考价值。
-
外汇机器人评测:自动化交易未来趋势与AI应用,中文用户如何选择?
本文解读外汇机器人(forex robot)自动化交易的未来趋势,分析AI如何提升交易效率,并提供评测指南。中文用户可了解工具选择要点、国内平替及监管注意事项。
-
亚马逊Quick Research整合生物医学数据库,加速罕见癌症研究突破
亚马逊Quick Research推出新功能,整合PubMed等公开生物医学数据库,通过AI驱动的研究工作流,快速生成带引用的研究报告。本文以儿科肉瘤为例,演示从目标设定到报告导出的完整流程,为罕见病研究提供高效工具。
-
图灵奖得主Richard Sutton:纯生成式AI无法做真正的科学发现
图灵奖得主Richard Sutton指出纯生成式AI的核心缺陷:无法自我评估结果。他认为没有内置评估循环,AI产生的创新转瞬即逝,无法积累。AlphaGo和AlphaProof展示了真正创造性AI需要评估能力。本文分析其对中文AI圈和科研应用的启示。