Playwright CLI:CLI + Skill 搭建 AI 浏览器自动化框架

If You Like Our Meta-Quantum.Today, Please Send us your email.

引言

在 AI 工具高速迭代的今天,如何让 AI 真正替代人工完成繁琐的浏览器操作,同时又不消耗大量 token?视频由”爬爬虾”出品,系统介绍了一套以 Playwright CLI + Skill 为核心、配合 Claude Code 或 Codex 的浏览器自动化框架,不仅大幅降低 token 消耗,甚至能实现零 token 全自动化工作流。

–熟练掌握 Playwright CLI 安装、设置、配置以及如何集成到 Claude:

Playwright CLI 完整中文指南——安装、配置、与 Claude Code 集成

什么是 Playwright CLI?

Playwright CLI 是微软于 2026 年初开源的命令行浏览器自动化工具,专为 AI Agent 场景设计,核心优势是按需加载——不将整个 DOM 塞入上下文,大幅节省 token。

对比 MCP 方案
token 节省倍数
技能沉淀后
10×
效率提升倍数
固定流程脚本化
0
token 消耗

架构对比:MCP vs Playwright CLI

传统 MCP 方案
整个 DOM 结构塞入上下文
截图直接发送给 AI
token 消耗极高
无法控制加载粒度
Playwright CLI 方案
仅返回简洁网页摘要
截图存本地,AI 按需读取
token 消耗节省约 4 倍
快照文件按需加载

适用场景

数据采集

抓取电商评论、价格监控、定期报告生成

内容发布

自动将文章发布到各平台,处理图片上传

自动化测试

对 Web App 进行端到端测试,定时巡检

流程自动化

表单填写、重复操作、数据录入等日常任务

环境准备

1

安装 Node.js

前往 nodejs.org 下载对应操作系统的安装包,推荐使用 LTS 版本(v18+)。

# 验证安装
node –version
npm –version
2

安装 Playwright CLI

# 全局安装 playwright CLI
npm install -g @playwright/mcp@latest

# 或使用 npx 直接运行(无需全局安装)
npx @playwright/mcp@latest –help
3

安装浏览器

推荐使用 Chrome,Edge 也可。确保已安装并可被系统识别。

# 安装 Chromium(如系统无 Chrome)
npx playwright install chromium

验证安装

# 测试:打开谷歌首页(有头模式,可见浏览器窗口)
npx @playwright/mcp@latest “打开 google.com” –headed

# 如成功,控制台输出网页摘要,而非完整 DOM

项目目录初始化

# 创建项目目录
mkdir my-automation && cd my-automation

# 初始化 npm(可选,用于管理脚本依赖)
npm init -y

# 安装 Claude Code Skill(浏览器自动化技能文档)
npx @anthropic-ai/claude-code –skill playwright

核心命令参考

基础导航

# 打开网页(有头浏览器)
npx @playwright/mcp@latest “goto https://example.com” –headed

# 持久化登录状态(Cookie、LocalStorage 等写入磁盘)
npx @playwright/mcp@latest “goto https://x.com” –headed –persistent

# 无头模式(后台静默运行,节省内存)
npx @playwright/mcp@latest “goto https://example.com”

重要参数说明

参数说明使用场景
–headed有头模式,可见浏览器窗口调试、开发阶段
–persistent持久化 Cookie 与登录状态到本地磁盘需要登录的网站,避免重复认证
–screenshot截图保存为本地 PNG,AI 按需读取验证页面状态、调试
–snapshot输出详细 DOM 快照文件路径需要精确元素定位时
–timeout设置操作超时时间(毫秒)网络慢或页面加载慢时

按需加载原理(节省 token 的关键)

执行命令后,Playwright CLI 只返回简洁摘要,并附上快照文件路径。AI 根据任务需要自行决定是否读取完整快照或截图,而不是像 MCP 那样将所有内容强制塞入上下文。

执行命令
返回摘要
AI 判断是否需要详情
按需读取快照/截图

常用操作命令

# 点击元素
playwright_click “button[data-testid=’submit’]”

# 输入文本
playwright_fill “input[name=’search’]” “搜索关键词”

# 截图(存本地,AI 按需读取)
playwright_screenshot –path “/tmp/screenshot.png”

# 执行 JavaScript
playwright_evaluate “document.querySelectorAll(‘.review’).length”

# 等待元素出现
playwright_wait_for_selector “.results-loaded”

接入 Claude Code

1

创建项目目录,安装 Skill

mkdir my-project && cd my-project

# 安装 Playwright CLI 的配套 Skill
npx playwright-skill install –target .claude

# Skill 文件结构:
# .claude/
# skills/
# playwright-cli/
# SKILL.md ← AI 读取的说明文档
2

启动 Claude Code,验证 Skill 加载

# 在项目目录启动 Claude Code
claude

# 在 Claude Code 内验证
> 你有哪些 skills?

# 预期输出:列出 playwright-cli skill
3

适配 Codex(可选)

# 将 .claude 目录改名为 .codex 即可适配 OpenAI Codex
mv .claude .codex

# 在 Codex 内验证
/skills # 应可见 playwright-cli

目录结构总览

my-project/
├── .claude/
│ └── skills/
│ ├── playwright-cli/
│ │ └── SKILL.md ← Playwright CLI 使用说明
│ └── scrape-reviews/ ← 自定义 Skill(后续创建)
│ └── SKILL.md
├── scripts/ ← AI 生成的自动化脚本
│ └── scrape-reviews.ps1
└── outputs/ ← 任务输出结果
└── reviews.csv

CLI + Skill 取代 MCP 的原因

MCP 是将工具能力直接嵌入 AI 上下文的协议,每次调用都携带大量元数据。而 CLI + Skill 模式中,Skill 充当说明文档(AI 读一次即记住),CLI 作为命令执行层,两者配合实现轻量、高效、可沉淀的自动化框架。

Skill 文件结构与编写规范

Skill 是一个 Markdown 文件(SKILL.md),告诉 AI 如何使用特定工具或执行特定流程。

SKILL.md .claude/skills/playwright-cli/SKILL.md

name: playwright-cli
description: 使用 Playwright CLI 进行浏览器自动化
version: 1.0.0


## 工具说明
Playwright CLI 是命令行浏览器自动化工具。
按需加载机制,大幅节省 token 消耗。

## 安装
npm install -g @playwright/mcp@latest

## 常用命令
– goto <url> –headed –persistent
– click <selector>
– fill <selector> <text>
– screenshot –path <file>
– evaluate <js>

## 注意事项
– 始终添加合理延迟确保页面加载
– 优先使用 –persistent 避免重复登录
– 调试时使用 –headed 查看页面状态

自定义业务 Skill 示例

业务 SKILL.md .claude/skills/scrape-reviews/SKILL.md

name: scrape-reviews
description: 抓取电商商品评论并导出 CSV


## 流程
1. 打开商品页面(–headed –persistent)
2. 等待页面加载完成(selector: .product-title)
3. 点击”查看全部评价”按钮
4. 等待评论列表渲染(等待 2 秒)
5. 执行 JS 抓取评论数据
6. 翻页循环直到获取目标数量
7. 保存为 CSV 文件

## 已知问题与解决方案
– 评论懒加载:需滚动到底部触发加载
– 翻页按钮可能被遮挡:先滚动到可见区域
– 反爬限制:每次操作间隔 1-2 秒

## 输出格式
CSV 字段:id, author, rating, content, date

让 AI 自动生成 Skill

# 任务完成后,让 AI 提炼 Skill
> 创建一个新的 skill,把刚才打开网站、
> 查看评论并保存的全过程,包括遇到的坑,
> 都提炼保存到 .claude/skills/scrape-reviews/ 下。
> 以后我只说”保存评论”,你就能调用这个 skill 完成任务。

实战案例

电商评论抓取 → CSV 导出

目标:获取某商品前 100 条评论,导出为 CSV 文件。

第一阶段:AI 探索执行(无 Skill)

> 使用 playwright cli –headed –persistent
> 查看这个商品的前 100 条评论
> 然后保存到 reviews.csv
41% 上下文窗口

AI 自行探索,消耗 41% 上下文才完成任务

第二阶段:沉淀 Skill,重试相同任务

# 1. 让 AI 生成 Skill
> 把刚才的流程提炼成 skill,存到 .claude/skills/scrape-reviews/

# 2. 清空上下文,重试
> 使用 scrape-reviews skill,抓取相同商品的评论
5%

有 Skill 指导后,仅用 5% 上下文完成,效率提升 10 倍

第三阶段:固化脚本,零 token 执行

# 让 AI 生成独立脚本
> 把刚才所有 playwright cli 命令汇总成一个脚本,
> 执行脚本就能获取前 100 条评论并保存为 CSV。
> 注意每一步都要有合理的延时,脚本写完先自行测试。

# 直接运行脚本(零 token,零 AI 参与)
./scrape-reviews.ps1 # Windows PowerShell
bash scrape-reviews.sh # macOS / Linux
0

脚本直接运行,完全不需要 AI,token 消耗归零

Markdown 文章自动发布到 X 平台

痛点:X 不支持 Markdown 直接粘贴,图片需手动一张张替换,极为繁琐。

1

下载图片并转换格式

> 编写 Python 脚本:
> 1. 把文章里的图片下载到 ./images/ 从 001 开始编号
> 2. 转换成只使用本地图片路径的 markdown
> 3. 运行 pandoc 转换成 HTML(每张图独立段落)
2

AI 自动化发布流程

> 使用 playwright cli:
> 1. 打开 X,创建新文章草稿
> 2. 粘贴 HTML 内容
> 3. 找到所有照相机占位符图标
> 4. 逐个删除占位符,从 images/ 按顺序上传真实图片
> 5. 图标数量与图片数量相等,按顺序替换
3

固化成 Skill,一键发布

> 把从头开始的全流程整理成一个 skill
> 放到 .claude/skills/publish-to-x/
> 以后我只要给你一个文章路径,
> 告诉你用这个 skill,你就能自动发布

# 之后每次只需:
> 使用 publish-to-x skill 发布 ./article.md

Web App 自动化测试

场景:对自己开发的简历润色 Web App 进行端到端测试。

1

让 AI 阅读代码,生成测试文档

> 阅读项目代码,把从注册开始的主体流程
> 写一个中文测试文档(每步做什么)
> 然后用 playwright cli 打开网页,
> 根据测试用例完成完整测试流程
2

AI 自动执行测试

自动点击注册按钮,创建测试账号
完成登录验证
创建测试简历并上传
完成主体流程,输出测试结论:通过
3

定时巡检(进阶)

# 配合支持定时任务的 Agent 框架
# 设置每小时/每天自动测试一次
# 一旦出现 Bug 立即通知开发者
> 使用 open-cloud agent,每天凌晨 2 点
> 自动运行完整测试套件,有问题发送通知

完整工作流总结

1

环境准备

安装 Node.js、Playwright CLI、Chrome 浏览器

Node.js
+
Playwright CLI
+
Chrome
2

接入 Agent + 安装 Skill

选择 Claude Code 或 Codex,安装 Playwright CLI Skill 到项目目录

Claude Code / Codex
+
playwright-cli SKILL.md
3

布置任务,AI 自行探索

用自然语言描述任务,让 AI 第一次自行摸索完成,允许试错

4

提炼 Skill,知识沉淀

让 AI 将执行经验(含踩坑解决方案)固化为新 Skill,避免重复试错

探索经验
新 SKILL.md
token -90%
5

Skill 指导下重试

相同任务在 Skill 指导下执行,上下文消耗从 41% 降至 5%,效率提升 10 倍

6

固化脚本,零 token 运行

对完全固定的流程,让 AI 生成独立脚本,此后直接执行,无需 AI 参与

AI 生成脚本
直接执行脚本
token = 0

三种执行模式对比

模式token 消耗灵活性适用场景
AI 探索(无 Skill)~41% 上下文最高首次执行新任务
AI + Skill 指导~5% 上下文重复但可能变化的任务
零 AI 固定脚本0固定完全固定、高频执行任务


视频:关于Playwright CLI + Skill

核心工具:Playwright CLI 是什么?

Playwright CLI 是微软于 2026 年初开源的新一代浏览器自动化命令行工具,与传统 Playwright MCP 方案相比,最核心的优势在于按需加载机制:

  • MCP 方式:将整个网页 DOM 结构塞入 AI 上下文,token 消耗极大。
  • Playwright CLI 方式:只返回简洁的网页摘要,详细结构以快照文件形式存储在本地磁盘,由 AI 按需读取——截图同样如此,以 PNG 文件形式存于本地,而非直接塞入上下文。

根据官方基准测试,Playwright CLI 比 MCP 方案减少约 四倍的 token 消耗

基础安装步骤:

  1. 安装 Node.js
  2. 命令行执行安装 Playwright CLI
  3. 确保本机已安装 Chrome 浏览器(Edge 亦可)

关键参数说明:

  • -headed:使用有头浏览器,方便调试时看到页面
  • -persistent:将 Cookie、登录状态等持久化到本地磁盘,避免每次重新登录

接入 AI Agent:Claude Code 与 Codex

Playwright CLI 是全新工具,AI 并不原生了解其命令语法,因此需要搭配 Skill(技能文档) 一起使用——CLI 作为技术底座,Skill 作为说明手册,两者配合可完全取代传统 MCP 方式。

接入方式:

  • Claude Code:在项目文件夹中安装 Skill,将其放入 .claude 目录,启动 Claude Code 后即可读取 Playwright CLI 技能。
  • Codex:将同一 Skill 目录改名为 .codex 即可适配,通过 /skills 命令确认加载成功。

这也代表了当下一个重要技术趋势:CLI + Skill 取代 MCP 成为更轻量、更高效的 AI Agent 工具集成方式。


实战案例一:电商评论抓取与 Skill 沉淀

任务: 抓取某商品前 100 条评论,导出为 CSV 文件。

第一次执行(无 Skill): AI 自行摸索,尝试多种方案,消耗了 41% 的上下文窗口才完成任务。

优化路径一——将流程沉淀为 Skill: 让 AI 将整个执行过程(包括踩过的坑)提炼为一个新 Skill,下次执行时 AI 充分吸取经验,仅用 5% 的上下文即完成相同任务——效率提升近 十倍

优化路径二——生成零 token 固定脚本: 对于完全固定的流程,可让 AI 将所有 Playwright CLI 命令汇总成一个可独立运行的脚本(如 Windows PowerShell 脚本),此后直接执行脚本,无需 AI 参与,token 消耗归零,效果完全相同。


实战案例二:Markdown 文章自动发布到 X 平台

背景痛点: 将 Markdown 格式文章发布到 X(原 Twitter)时,格式混乱,图片无法直接粘贴,需手动一张张替换,极为繁琐。

自动化方案:

  1. 用 Codex 编写 Python 脚本,将文章中的图片下载到本地并编号;
  2. 使用 Pandoc 将 Markdown 转换为 HTML 格式(每张图独立段落);
  3. 让 AI 使用 Playwright CLI 打开 X 编辑器,粘贴 HTML 内容,自动逐张删除占位符、上传真实图片;
  4. 将整个流程固化为一个 Skill,此后只需提供文章路径,AI 即可一键完成全流程发布

相关 Skill 源代码已上传至作者 GitHub 仓库,供参考移植(Windows 版本,其他系统可让 AI 参考改写)。


实战案例三:Web App 自动化测试

场景: 作者开发了一个简历润色美化网页 APP,希望对其进行自动化测试。

流程:

  1. 让 AI 阅读项目代码,梳理主体功能流程;
  2. AI 编写中文测试文档,列出逐步操作用例;
  3. 使用 Playwright CLI 自动执行:注册账号→登录→上传测试简历→完成主体流程测试;
  4. 测试结论:通过。

进阶用法: 配合支持定时任务的 Agent 框架(如 Open Cloud),可让 AI 定时自动测试系统,一旦出现 Bug 立即告警,大幅节省人工测试成本。


完整工作流程总结

步骤内容
1安装 Node.js、Playwright CLI、Chrome 浏览器
2选择 AI Agent(Claude Code / Codex),安装 Playwright CLI Skill
3给 AI 布置复杂任务,让其自行摸索执行
4让 AI 将执行经验提炼为新 Skill,避免重复踩坑
5重试相同任务,token 消耗降低约十倍
6对固定流程,让 AI 生成独立脚本,实现零 token 全自动执行

结论与核心要点

本视频展示的 CLI + Skill 浏览器自动化框架,是一套兼顾灵活性与经济性的 AI 自动化方案。其核心思想是:将 AI 的探索成本一次性转化为可复用的知识资产,让后续执行越来越高效、越来越廉价。

核心要点:

  • Playwright CLI 通过按需加载机制,比 MCP 节省约四倍 token
  • Skill 是将 AI 试错经验固化的关键机制,可实现十倍效率提升
  • 固定流程脚本化后可完全脱离 AI,实现零 token 自动化
  • 同一框架可应用于数据抓取、内容发布、自动化测试等多种场景
  • CLI + Skill 正在成为替代 MCP 的新一代 AI 工具集成趋势

相关参考资料

Leave a Reply

Your email address will not be published. Required fields are marked *