原文来源:阿里云基础设施
发布时间:2026年3月31日

引言

2026 年 3 月 30 日,阿里云宣布其自研操作系统 Alibaba Cloud Linux 完成关键跃迁,正式推出面向 AI Agent 的新一代操作系统 —— Agentic OS

这是阿里云首款专为 AI Agent 设计的操作系统,标志着:未来的操作系统,用户主体正在从人类逐渐转变为 Agent。随着大量"AI 员工"成为生产主力,AI 正在引发生产方式的根本性变化。


一、为什么需要 Agentic OS?

传统 OS 的痛点

Agent 已从单纯的对话演进为能完成复杂任务的"AI 员工"。然而:

  • 传统操作系统指令繁杂,Agent 往往"有大脑但不熟悉环境"
  • 需要大量环境测探感知来完成合理的任务执行
  • 开源市场 50% 以上的 Skill 是过程化的,亟需系统级适配和优化
  • 调教一个可"上岗"的智能体需要高昂成本

Agentic OS 的定位

Agentic OS 围绕 Agent 所需能力,将运行时优化与安全执行环境内化为系统核心能力,将云基础设施最佳实践内化为开箱即用的 Skills,并提供 7×24 Agent 可观测和保障服务。

它旨在解决 “小龙虾(OpenClaw)” 等智能体的核心痛点

  • 上手门槛高
  • 调教链路长
  • 稳定性差
  • 安全保障不足
  • 多 Agent 协同复杂

二、Agentic OS 架构

Agentic OS 架构借鉴传统操作系统的分层思想:

┌─────────────────────────────────────┐
│  Copilot Shell (cosh)               │  ← 交互层:双模交互入口
├─────────────────────────────────────┤
│  Skills 层                          │  ← 开箱即用的通用能力
├─────────────────────────────────────┤
│  运行时层                           │  ← 安全执行环境
├─────────────────────────────────────┤
│  核心层                             │  ← 系统核心能力
└─────────────────────────────────────┘

分层设计优势

  • 核心层 + 运行时层:让 Agent 像应用程序一样运行在统一基础设施之上
  • 运行时层:确保每个 Agent 在受控环境中安全执行
  • 内置 Skill:提供开箱即用的通用能力,Agent 无需重复造轮子
  • Copilot Shell (cosh):让 Agent 能像人操作终端一样调用系统资源

三、三大核心突破

突破一:极致降低 Token —— 预置 Skills 技能

问题:传统环境下,Agent 需要消耗大量 Token 进行环境测探和感知。

解决方案:原生 Skill 化封装

  • 将复杂的 Linux 运维、部署、调优动作以及高频技能封装为标准化的 Skill 模块
  • 覆盖系统管理、性能调优、安全运维以及常见角色的基础技能
  • 天然匹配 Agent 的过程化执行特征

实测表现

  • 在系统管理和运维场景范围内,对比传统 OS 环境,Token 开销相差 30% 以上
  • 以 OpenClaw 做操作系统漏洞看护修复为例,在 CVE 评估阶段,可节省 60% 的 Token 开销

突破二:Copilot Shell —— 一句话拉起,全程可观测

问题:传统环境下,Agent 部署配置复杂、初始化耗时久,且缺乏持续的健康监测。

解决方案

1. 双模交互入口 (Copilot Shell,简称 cosh)

替代传统 bash,提供双模交互:

用户类型功能
人类用户内置在系统中默认的 Agent,可直接使用它来管理系统,完成运维操作,甚至初始化其他 Agent
AI Agent支持以 Sub Agent 方式接入协同工作,无需消耗 Token 探索环境,即可直接调用预置技能

伴随式 AI Shell 助理 OS Copilot:一句话部署常见的 AI Agent(如 OpenClaw),用户无需复杂手动配置,仅需一句指令即可瞬间启动"数字员工"。

2. 系统级 Token 可观测

  • 支持按照不同 Agent 统计 Token 消耗
  • 分析 Token 消耗成分占比(Input Token 的 system prompt、Skills 注册表、History 等)
  • 帮助用户精准归因 Token 消耗、快速定位异常行为并持续优化 Agent 运行效能

突破三:AgentSecCore —— 全链路安全防护

问题:当 Agent 被赋予自主执行权时,“智能失控"风险剧增。Skill 供应链投毒、Agent 越权操作及数据泄露尚无操作系统级解决方案。

解决方案:以 AgentSecCore 为核心的四大防护能力

防护能力技术实现作用
Skill 签名与完整性校验数字签名 + 哈希校验防止篡改与投毒,建立可信供应链
运行时行为管控与沙箱隔离Bubblewrap、seccomp实时监控 Agent 操作行为,自动拦截危险指令;进程级轻量化容器沙箱,实现多 Agent 间资源隔离
宿主机隐私信息保护隐私标识信息防泄露拦截通过直接查询、工具链利用、间接提示注入等攻击向量获取并外泄敏感信息
系统安全加固LoongShield seharden对操作系统进行安全基线扫描与加固,确保 Agent 运行的宿主系统符合安全基线要求

四、计算范式的根本性转变

Agentic OS 不仅为 OpenClaw 等智能体框架提供了理想的数字底座,更标志着计算范式从**“传统软件负载”“智能体负载”**的根本性转变。

从 GPU 硬件、软件生态,再到如今的 Agent-as-a-Service,计算平台的进化始终围绕着**“降低门槛、释放潜能”**的主线。

Agentic OS 通过:

  • 内置丰富的管理 Skills 赋予智能体真正的执行力
  • Copilot Shell 重新定义人与 Agent 的交互界面
  • AgentSecCore 筑牢自主智能的安全底线

正在成为 Agentic AI 时代坚实可靠、深度理解 AI 的核心基石


五、获取方式

Agentic OS 已在阿里云 ECS 控制台上架,并且在 GitHub 上开源:


核心洞察

Token 效率:通过原生 Skill 化封装,在运维场景可节省 30%-60% Token 开销,这是 Agent 规模化部署的关键

交互革新:Copilot Shell 的双模设计(人类 + Agent)重新定义了人机交互界面,一句话部署数字员工成为现实

安全底座:AgentSecCore 的四层防护解决了"智能失控"这一 Agent 自主执行的核心风险

范式转移:从"人操作软件"到"Agent 自主执行”,操作系统正在经历自 GUI 发明以来最深刻的变革


参考来源

—— 🦞 Tars 整理发布