详细介绍
Notte Browser 是一个专为互联网原生智能体系统打造的开源软件套件,集成了浏览器会话管理、结构化数据抓取和先进的人工智能代理技术,提供一站式解决方案,助力开发者构建高效的人机协作系统。
核心功能
Notte Browser 提供了多种核心功能,包括:
- 智能体任务运行:支持在本地或云端启动和管理复杂任务。
- 浏览器会话控制:实现多线程无头浏览器操作,支持会话生命周期管理。
- 结构化数据提取:利用增强的LLM模型进行语义理解,从网页中提取结构化数据。
- 分布式计算:优化资源利用率,提升执行效率。
- 行为观察与干预:实时监控智能体行为,并提供人工介入接口。
此外,Notte Browser 还支持部分不稳定功能,如验证码识别、代理服务器、网络安全性、VPN模式、身份验证与支付、性能优化、人机协作接口、通知机制和Cookie管理。
安装方法
要安装 Notte Browser,可以按照以下步骤进行:
git clone https://github.com/NotteProject/notte.gitcd nottenpm install安装完成后,可以通过以下命令启动服务:
npm run dev启动服务后,您可以通过访问 http://localhost:8080 进入 Notte 提供的图形化控制台,管理和监控任务运行状态。
使用方法
Notte Browser 提供了丰富的 API 接口,开发者可以通过这些接口与浏览器会话、智能体任务进行交互。
以下是一个基础使用示例,展示如何创建一个智能体实例并启动任务:
// 创建一个智能体实例
const agent = new Agent({
name: 'Distracted Cat',
task: 'browse_website'
});
// 启动任务
await agent.startTask('http://example.com');Notte Browser 还提供了多个 API 接口,例如:
/v1/scrape:从指定 URL 抓取数据。/v1/sessions/start:创建新浏览器会话。/v1/sessions/{session_id}/stop:关闭指定会话。/v1/sessions/{session_id}/replay:获取会话回放信息(.webp 格式)。/v1/sessions/{session_id}/debug:获取调试信息。/v1/sessions/{session_id}/page/scrape:提取当前页面结构化数据。/v1/sessions/{session_id}/page/observe:获取页面行为空间(观察结果)。/v1/sessions/{session_id}/page/step:根据文本指令执行页面操作。/v1/agent/start:启动新智能体任务。/v1/agent/{agent_id}:查询指定智能体状态。/v1/agent/{agent_id}/stop:停止运行中的智能体。/v1/agents:管理所有智能体实例。
使用场景
Notte Browser 适用于多种应用场景,包括:
- 自动化网页浏览与数据抓取。
- 构建基于LLM的智能代理系统。
- 实现人机协作的网页操作与任务管理。
- 支持多线程浏览器会话,适用于大规模任务处理。
- 集成身份验证与支付系统,适用于需要用户交互的场景。
注意事项
在使用 Notte Browser 时,需要注意以下事项:
- 部分功能仍处于开发阶段,如验证码识别、代理服务器等。
- 网络环境需保持稳定,以确保任务的正常执行。
- 高级功能可能需要额外的硬件支持。
- 所有截图和占位符图片均为示例用途,实际产品界面可能有所不同。
Notte Browser 致力于打造一个开放、易用且功能强大的智能体开发平台,帮助开发者轻松构建人机协作系统。