详细介绍
Browser-Use MCP Server 是一款基于 Model Context Protocol(MCP)的 AI 驱动浏览器自动化服务器,能够通过自然语言指令控制浏览器操作,实现页面导航、表单填写、元素交互等功能。该工具适用于需要自动化网页操作、多步网络研究或生成报告的场景,支持多种大模型(如 OpenAI、Anthropic、Azure)和灵活的浏览器连接方式。
核心功能
Browser-Use MCP Server 提供了多种核心功能,使其成为强大的浏览器自动化工具:
- MCP 协议集成:完全实现了 MCP 协议,支持 AI 代理通信。
- 浏览器自动化:通过自然语言指令实现页面导航、表单填充和元素交互。
- 视觉理解:可选截图分析功能,用于支持具备视觉能力的大模型。
- 状态持久化:支持管理浏览器会话或连接用户自有浏览器。
- 多模型支持:支持 OpenAI、Anthropic、Azure 等多种大模型。
- 深度研究工具:专用工具用于多步网络研究和报告生成。
- 环境变量配置:支持通过环境变量进行全面配置。
- CDP 连接:支持连接和控制用户启动的 Chrome/Chromium 实例。
安装方法
安装 Browser-Use MCP Server 需要 Python 3.11 及以上版本,并安装相关依赖。以下是安装和配置的详细步骤:
步骤 1:安装依赖
pip install uv步骤 2:安装 Playwright 浏览器
uv sync && uv run playwright install步骤 3:配置环境变量
在 `.env` 文件或系统环境变量中设置以下内容:
MCP_USE_OWN_BROWSER=true
CHROME_CDP=http://localhost:9222步骤 4:启动 Chrome 浏览器
使用 `--remote-debugging-port` 标志启动 Chrome:
google-chrome --remote-debugging-port=9222步骤 5:运行 MCP 服务器
uv run mcp-server-browser-use使用方法
Browser-Use MCP Server 提供了多种使用方式,用户可以通过客户端发送自然语言指令来执行任务。
浏览器自动化示例
通过自然语言指令控制浏览器,例如:
导航到百度并搜索人工智能深度网络研究示例
生成关于量子计算的研究报告,例如:
关于量子计算的研究常见命令
- run_browser_agent:执行浏览器自动化任务。
- run_deep_search:执行深度网络研究。
使用场景
Browser-Use MCP Server 适用于多种使用场景,包括:
- 自动化网页操作,如页面导航、表单填写。
- 多步网络研究,如信息检索、数据收集。
- 生成研究报告,如技术分析、市场调研。
- 与 AI 模型集成,实现自然语言驱动的浏览器交互。
注意事项
在使用 Browser-Use MCP Server 时,需注意以下事项:
- 确保 Chrome 浏览器保持打开状态。
- 确认 `CHROME_CDP` URL 对 MCP 服务器是可访问的。
- 浏览器窗口大小将使用当前 Chrome 窗口的实际尺寸。
- 如果使用 `MCP_USE_OWN_BROWSER=false`,确保没有其他 Chrome 实例使用相同的用户数据目录。
- 检查相关 API 密钥和配置是否正确。
- 确认 Chrome 浏览器版本支持所需的 DevTools 功能。
故障排除
如果遇到 CDP 连接问题,请检查以下内容:
- Chrome 是否启用了 `--remote-debugging-port` 标志。
- `CHROME_CDP` 端口是否正确。
- 是否有防火墙阻止该端口的访问。
- 浏览器实例是否仍在运行。
开发指南
开发者可以使用以下命令进行开发和调试:
# 安装开发依赖并同步项目依赖
uv sync --dev
# 安装 Playwright 浏览器
uv run playwright install
# 使用调试工具(示例:连接到本地 Chrome)
npx @modelcontextprotocol/inspector@latest \
-e OPENROUTER_API_KEY=$OPENROUTER_API_KEY \
-e MCP_MODEL_PROVIDER=openrouter \
-e MCP_MODEL_NAME=anthropic/claude-3.7-sonnet \
-e MCP_USE_OWN_BROWSER=true \
-e CHROME_CDP=http://localhost:9222 \
uv --directory . run mcp run src/mcp_server_browser_use/server.py注意:根据需要调整超时时间(默认为 10 秒)。
Browser-Use MCP Server 通过自然语言指令实现浏览器自动化,结合 AI 模型的强大能力,为用户提供高效、灵活的网页操作和研究工具。