页面加载中...
通过 CDP 操控 Gemini 网页版,实现 AI 生图、多轮对话、图片上传和提取。标准 MCP 协议接口,可被任何 MCP 客户端调用。Daemon 模式管理浏览器生命周期,支持自动去水印。
快速安装
确保已安装 clawhub CLI
clawhub install gemini-drawing-mcp通过 Chrome DevTools Protocol 操控 Gemini 网页版,实现 AI 生图和对话自动化。
Gemini Skill 是一个 MCP Server,通过 CDP 协议与浏览器中的 Gemini 网页版交互,让任何 MCP 客户端都能调用 Gemini 的生图能力。
核心功能:
架构设计采用 Daemon 模式——浏览器进程由独立 Daemon 管理,MCP 调用结束后浏览器不关闭,30 分钟无活动才自动释放。使用 puppeteer-extra-plugin-stealth 绕过网站检测。
# 前置条件:Node.js >= 18,Chrome/Edge/Chromium,已登录 Google 账号 git clone https://github.com/WJZ-P/gemini-skill.git cd gemini-skill npm install # 配置 .env 文件 cp .env.example .env # 编辑 .env 设置浏览器路径、端口等
在 MCP 客户端配置文件中添加:
{ "mcpServers": { "gemini": { "command": "node", "args": ["/absolute/path/to/gemini-skill/src/mcp-server.js"] } } }
import { createGeminiSession, disconnect } from './src/index.js'; const { ops } = await createGeminiSession(); // 生图 const result = await ops.generateImage('画一只可爱的猫咪', { fullSize: true }); console.log('图片保存至:', result.filePath); disconnect();
# 在 .env 中设置 BROWSER_DEBUG_PORT=18800
⚠️ 注意:OpenClaw 浏览器未集成 Stealth 反爬插件,推荐使用默认端口 40821。
版本
v1.0.0
作者
WJZ-P
平台
发布时间
2026年4月12日