页面加载中...
通过 CDP 操控 Gemini 网页版,实现 AI 生图、多轮对话、图片上传和提取。标准 MCP 协议接口,可被任何 MCP 客户端调用。Daemon 模式管理浏览器生命周期,支持自动去水印。
通过 Chrome DevTools Protocol 操控 Gemini 网页版,实现 AI 生图和对话自动化。
Gemini Skill 是一个 MCP Server,通过 CDP 协议与浏览器中的 Gemini 网页版交互,让任何 MCP 客户端都能调用 Gemini 的生图能力。
核心功能:
架构设计采用 Daemon 模式——浏览器进程由独立 Daemon 管理,MCP 调用结束后浏览器不关闭,30 分钟无活动才自动释放。使用 puppeteer-extra-plugin-stealth 绕过网站检测。
# 前置条件:Node.js >= 18,Chrome/Edge/Chromium,已登录 Google 账号 git clone https://github.com/WJZ-P/gemini-skill.git cd gemini-skill npm install # 配置 .env 文件 cp .env.example .env # 编辑 .env 设置浏览器路径、端口等
在 MCP 客户端配置文件中添加:
{ "mcpServers": { "gemini": { "command": "node", "args": ["/absolute/path/to/gemini-skill/src/mcp-server.js"] } } }
import { createGeminiSession, disconnect } from './src/index.js'; const { ops } = await createGeminiSession(); // 生图 const result = await ops.generateImage('画一只可爱的猫咪', { fullSize: true }); console.log('图片保存至:', result.filePath); disconnect();
# 在 .env 中设置 BROWSER_DEBUG_PORT=18800
⚠️ 注意:OpenClaw 浏览器未集成 Stealth 反爬插件,推荐使用默认端口 40821。
版本
v1.0.0
作者
WJZ-P
平台
发布时间
2026年4月12日