Browser Use MCP Server

Browser Use MCP Server

Browser-Use MCP Server 是一款基于 MCP 协议的 AI 驱动浏览器自动化服务器,支持通过自然语言指令控制网页操作,适用于自动化任务、深度网络研究和报告生成。

102 浏览
2025-12-15 发布

详细介绍

Browser-Use MCP Server 是一款基于 Model Context Protocol(MCP)的 AI 驱动浏览器自动化服务器,能够通过自然语言指令控制浏览器操作,实现页面导航、表单填写、元素交互等功能。该工具适用于需要自动化网页操作、多步网络研究或生成报告的场景,支持多种大模型(如 OpenAI、Anthropic、Azure)和灵活的浏览器连接方式。

核心功能

Browser-Use MCP Server 提供了多种核心功能,使其成为强大的浏览器自动化工具:

  • MCP 协议集成:完全实现了 MCP 协议,支持 AI 代理通信。
  • 浏览器自动化:通过自然语言指令实现页面导航、表单填充和元素交互。
  • 视觉理解:可选截图分析功能,用于支持具备视觉能力的大模型。
  • 状态持久化:支持管理浏览器会话或连接用户自有浏览器。
  • 多模型支持:支持 OpenAI、Anthropic、Azure 等多种大模型。
  • 深度研究工具:专用工具用于多步网络研究和报告生成。
  • 环境变量配置:支持通过环境变量进行全面配置。
  • CDP 连接:支持连接和控制用户启动的 Chrome/Chromium 实例。

安装方法

安装 Browser-Use MCP Server 需要 Python 3.11 及以上版本,并安装相关依赖。以下是安装和配置的详细步骤:

步骤 1:安装依赖

pip install uv

步骤 2:安装 Playwright 浏览器

uv sync && uv run playwright install

步骤 3:配置环境变量

在 `.env` 文件或系统环境变量中设置以下内容:

MCP_USE_OWN_BROWSER=true
CHROME_CDP=http://localhost:9222

步骤 4:启动 Chrome 浏览器

使用 `--remote-debugging-port` 标志启动 Chrome:

google-chrome --remote-debugging-port=9222

步骤 5:运行 MCP 服务器

uv run mcp-server-browser-use

使用方法

Browser-Use MCP Server 提供了多种使用方式,用户可以通过客户端发送自然语言指令来执行任务。

浏览器自动化示例

通过自然语言指令控制浏览器,例如:

导航到百度并搜索人工智能

深度网络研究示例

生成关于量子计算的研究报告,例如:

关于量子计算的研究

常见命令

  • run_browser_agent:执行浏览器自动化任务。
  • run_deep_search:执行深度网络研究。

使用场景

Browser-Use MCP Server 适用于多种使用场景,包括:

  • 自动化网页操作,如页面导航、表单填写。
  • 多步网络研究,如信息检索、数据收集。
  • 生成研究报告,如技术分析、市场调研。
  • 与 AI 模型集成,实现自然语言驱动的浏览器交互。

注意事项

在使用 Browser-Use MCP Server 时,需注意以下事项:

  • 确保 Chrome 浏览器保持打开状态。
  • 确认 `CHROME_CDP` URL 对 MCP 服务器是可访问的。
  • 浏览器窗口大小将使用当前 Chrome 窗口的实际尺寸。
  • 如果使用 `MCP_USE_OWN_BROWSER=false`,确保没有其他 Chrome 实例使用相同的用户数据目录。
  • 检查相关 API 密钥和配置是否正确。
  • 确认 Chrome 浏览器版本支持所需的 DevTools 功能。

故障排除

如果遇到 CDP 连接问题,请检查以下内容:

  • Chrome 是否启用了 `--remote-debugging-port` 标志。
  • `CHROME_CDP` 端口是否正确。
  • 是否有防火墙阻止该端口的访问。
  • 浏览器实例是否仍在运行。

开发指南

开发者可以使用以下命令进行开发和调试:

# 安装开发依赖并同步项目依赖
uv sync --dev

# 安装 Playwright 浏览器
uv run playwright install

# 使用调试工具(示例:连接到本地 Chrome)
npx @modelcontextprotocol/inspector@latest \
  -e OPENROUTER_API_KEY=$OPENROUTER_API_KEY \
  -e MCP_MODEL_PROVIDER=openrouter \
  -e MCP_MODEL_NAME=anthropic/claude-3.7-sonnet \
  -e MCP_USE_OWN_BROWSER=true \
  -e CHROME_CDP=http://localhost:9222 \
  uv --directory . run mcp run src/mcp_server_browser_use/server.py

注意:根据需要调整超时时间(默认为 10 秒)。

Browser-Use MCP Server 通过自然语言指令实现浏览器自动化,结合 AI 模型的强大能力,为用户提供高效、灵活的网页操作和研究工具。

浏览器自动化 MCP协议 自然语言控制 AI驱动 网络研究

相关服务推荐

查看更多