OpenDia是一款开源浏览器扩展工具,允许AI模型直接控制用户浏览器,利用现有登录状态、书签等数据进行自动化操作,支持多种浏览器和AI模型,注重隐私保护。

109 浏览
2025-12-17 发布

详细介绍

OpenDia是一款开源浏览器扩展工具,允许AI模型直接控制用户浏览器,利用现有登录状态、书签等数据进行自动化操作。它支持Chrome、Firefox及所有基于Chromium的浏览器,并兼容多种AI模型,如Claude、ChatGPT和Cursor。OpenDia的核心价值在于其隐私保护机制,所有操作均在本地运行,数据不会上传云端。通过OpenDia,用户可以让AI自动执行网页操作,如点击按钮、填写表单、浏览页面等,适用于社交媒体管理、内容创作、自动化测试、研究分析等多种场景。

核心功能

OpenDia为AI模型提供了18种强大的浏览器工具,涵盖多个方面:

  • 智能页面理解:AI可以识别网页中的按钮、表单和互动元素,并理解上下文。
  • 自然交互:AI可以模拟人类操作,如点击、填写表单和导航网站。
  • 多标签管理:AI可以同时处理多个浏览器标签,实现复杂的任务流程。
  • 数据访问:AI可以访问用户的书签、历史记录和当前页面内容。
  • 反检测功能:AI能够绕过社交平台的自动化检测机制,确保稳定运行。
  • 页面样式自定义:AI可以修改网页外观,应用主题或视觉效果。

安装方法

OpenDia的安装分为浏览器扩展和MCP服务器两部分。以下是详细步骤:

1. 安装浏览器扩展

根据使用的浏览器类型,下载并加载扩展程序:

  • Chrome/Chromium浏览器
1. 从 [releases](https://github.com/aaronjmars/opendia/releases) 下载 `opendia-chrome-1.0.6.zip` 文件。
2. 解压文件。
3. 访问 `chrome://extensions/`。
4. 启用“开发者模式”。
5. 点击“加载已解压的扩展程序”,并选择解压后的文件夹。
  • Firefox浏览器
1. 从 [releases](https://github.com/aaronjmars/opendia/releases) 下载 `opendia-firefox-1.0.6.zip` 文件。
2. 解压文件。
3. 访问 `about:debugging#/runtime/this-firefox`。
4. 点击“加载临时附加组件...”。
5. 从解压后的文件夹中选择 `manifest.json` 文件。

⚠️ 重要提示:Firefox扩展程序是以临时附加组件的形式加载的,重启Firefox后会被移除,这是Firefox对未签名扩展程序的限制。

2. 配置MCP服务器

在AI工具中添加OpenDia MCP服务器的配置信息,例如在Claude桌面中添加以下配置:

{
  "mcpServers": {
    "opendia": {
      "command": "npx",
      "args": ["opendia"]
    }
  }
}

使用方法

OpenDia的使用方法包括启动MCP服务器、连接AI工具以及执行自动化任务。

1. 启动MCP服务器

运行以下命令启动OpenDia MCP服务器:

npx opendia

默认端口为5555,如果需要自定义端口,可以使用以下命令:

npx opendia --port=6000

或分别指定WebSocket和HTTP端口:

npx opendia --ws-port=5555 --http-port=5556

2. 自动隧道模式

如果需要通过在线AI服务使用OpenDia,可以启用自动隧道模式:

npx opendia --tunnel

该模式会自动创建ngrok隧道,并生成一个URL供在线AI服务使用。

3. 使用示例

以下是几个使用OpenDia的示例:

内容创作
"阅读此页面上的文章,并创建一个Twitter线程总结要点。"
研究与分析
"查看我本周的浏览历史,找出关于机器学习的文章,并总结关键趋势。"
社交媒体管理
"检查我的Twitter书签,并将它们分类。为每个类别创建一个摘要。"
提高生产力
"打开我平时早上阅读的网站的标签页,并给我今天头条新闻的简报。"
开发测试
"用测试数据填写此联系表单,并检查提交是否正常工作。"
个人助理
"找到我昨天查看的关于React组件的GitHub仓库,并将其标记为稍后查看。"
页面样式与趣味
"将此页面应用黑暗黑客主题,使其看起来更有趣。"

使用场景

OpenDia适用于多种场景,包括但不限于:

  • 社交媒体管理:AI自动读取浏览器历史记录,生成适合的社交媒体帖子。
  • 开发测试:AI可以测试Web应用程序,例如填写表单并验证功能。
  • 内容创作:AI可以总结网页内容并生成文章摘要。
  • 自动化测试:AI可以模拟用户操作,测试网站功能。
  • 研究分析:AI可以分析用户浏览历史,提取关键信息。
  • 页面样式定制:AI可以修改网页外观,应用主题或视觉效果。

注意事项

在使用OpenDia时,需要注意以下事项:

  • Firefox扩展程序是以临时附加组件的形式加载的,重启浏览器后会被移除。
  • 如果遇到安装问题,请参考官方文档或联系社区支持。
  • OpenDia是本地运行的,数据不会上传到云端,保障用户隐私。
  • 某些高级功能可能需要额外配置。

总结

OpenDia是一款功能强大的开源浏览器扩展工具,它允许AI模型直接控制用户浏览器,实现自动化操作。通过智能页面理解、自然交互、多标签管理、数据访问、反检测功能和页面样式自定义等特性,OpenDia能够显著提升工作效率。无论是内容创作、社交媒体管理、开发测试还是研究分析,OpenDia都能提供强大的支持。

浏览器自动化 AI集成 本地运行 多标签管理 反检测

相关服务推荐

查看更多