Neural Agent
综合介绍
Neural Agent是一款运行在你的个人电脑桌面上的AI智能体,它能像真人一样实际操作你的电脑。它通过模拟鼠标点击、移动、打字、滚动页面等方式,直接与你的操作系统进行交互,从而完成你用自然语言下达的指令。和其他AI助手不同,Neural Agent可以直接在你电脑本地运行,不需要依赖云端服务器或虚拟机,这意味着你的所有操作和数据都保留在自己的电脑上,保证了隐私安全。它能理解并执行例如“帮我找5个GitHub上热门的项目,然后把它们的信息写到记事本里,并保存到桌面”这类复杂的任务。这个工具是开源的,由一个快速、可扩展的开放架构驱动,支持包括Claude、GPT-4、Azure OpenAI在内的多种大型语言模型。
开源地址:https://github.com/withneural/neuralagent
功能列表
- 桌面自动化: 使用
pyautogui
库实现,能控制鼠标和键盘,在前台执行各种桌面任务。 - 后台自动化: 目前仅支持Windows系统,通过WSL(Windows Subsystem for Linux)在后台进行浏览器相关的自动化操作。
- 多模型支持: 支持接入和切换多种业界主流的大型语言模型,包括OpenAI的GPT-4、Anthropic的Claude、微软的Azure OpenAI、亚马逊的Bedrock、谷歌的Gemini以及本地部署的Ollama。
- 模块化智能体: 系统由多个专门的智能体模块构成,如规划器(Planner)、分类器(Classifier)、建议器(Suggestor)、标题生成器(Title)等,分工协作完成复杂任务。
- 多模态能力: 具备处理文本和视觉信息的能力,能够“看到”屏幕上的内容并结合文本指令进行操作。
- 开放的技术架构: 采用FastAPI作为后端,Electron和React构建跨平台的桌面应用,方便开发者进行二次开发和功能扩展。
使用帮助
Neural Agent的核心是让你通过自然语言指令,驱动一个AI智能体来操作你的电脑。下面是详细的安装和使用流程,帮助你快速上手。
安装前的准备
在安装Neural Agent之前,你需要确保电脑上已经安装了以下几个必备的软件和环境:
- Python: 这是Neural Agent后端和本地AI守护进程运行的基础。推荐安装
3.9
或更高的版本。 - PostgreSQL: 一个关系型数据库,用于存储Neural Agent的后端数据。推荐使用
13
或更高的版本。 - Node.js 和 npm: 用于运行Electron和React构建的前端桌面应用。推荐Node.js版本
18
以上,npm版本9
以上。
你可以从它们的官方网站下载并安装:
- Python: python.org/downloads/
- PostgreSQL: www.postgresql.org/download/
- Node.js (内置npm): nodejs.org/en/download
操作系统兼容性说明:Neural Agent可以在Windows、macOS和Linux上运行。但是,它的“后台自动化”功能(通过WSL控制浏览器)目前仅限于Windows系统。
安装与设置流程
整个安装过程需要你打开两个终端窗口,一个用于运行后端服务,另一个用于启动前端桌面应用。
第一步:后端设置
- 下载代码并进入后端目录:首先,从GitHub克隆项目代码,然后进入后端的目录。
git clone https://github.com/withneural/neuralagent.git cd neuralagent/backend
- 创建并激活Python虚拟环境 (推荐):为了避免与其他项目的依赖冲突,建议创建一个虚拟环境。
# 创建虚拟环境 python -m venv venv # 激活虚拟环境 (macOS/Linux) source venv/bin/activate # 激活虚拟环境 (Windows) venv\Scripts\activate
- 安装依赖:安装所有后端需要的Python库。
pip install -r requirements.txt
- 配置环境变量:复制环境变量示例文件
.env.example
为.env
,然后填入必要的配置信息。cp .env.example .env ``` 你需要用文本编辑器打开`.env`文件,并至少填写以下数据库连接信息: * `DB_HOST`: 数据库主机地址 (本地通常是 `localhost`) * `DB_PORT`: 数据库端口 (PostgreSQL默认是 `5432`) * `DB_DATABASE`: 你创建的数据库名称 * `DB_USERNAME`: 数据库用户名 * `DB_PASSWORD`: 数据库密码 * `JWT_SECRET`: 生成一个随机字符串用于JWT加密 此外,你还需要根据你想使用的AI模型,配置相应的API密钥,例如`OPENAI_API_KEY`、`ANTHROPIC_API_KEY`等。你也可以选择使用本地的Ollama模型。
- 运行数据库迁移:这个命令会根据代码模型,自动在你的PostgreSQL数据库中创建所需的数据表。
alembic upgrade head
- 启动后端服务器:
uvicorn main:app --reload --host 0.0.0.0 --port 8000
看到终端输出类似服务已启动的信息,就代表后端已经成功运行了。
第二步:前端(桌面应用)设置
- 安装Electron和React依赖:打开第二个终端窗口,进入
desktop
目录并安装依赖。cd neuralagent/desktop npm install
然后进入React应用的目录,再次安装依赖。
cd neuralagent-app npm install
- 配置前端环境变量:和后端类似,复制
.env.example
为.env
并进行配置。cp .env.example .env
你需要确保
.env
文件里的REACT_APP_DNS
指向你刚才启动的后端服务地址,默认是127.0.0.1:8000
。 - 设置本地AI守护进程:这个守护进程是实际执行鼠标键盘操作的Python服务。
# 回到desktop目录 cd .. # 进入aiagent目录 cd aiagent # 创建并激活虚拟环境 python -m venv venv source venv/bin/activate # Windows: venv\Scripts\activate # 安装依赖 pip install -r requirements.txt # 退出虚拟环境 deactivate
- 启动桌面应用:回到
desktop
根目录,启动应用。cd .. npm start
稍等片刻,你应该能看到Neural Agent的桌面应用窗口弹出,代表安装成功。
如何使用
启动应用后,你会看到一个简洁的界面。核心功能就是通过一个输入框向AI下达指令。
- 下达指令: 在输入框中,用自然语言清晰地描述你想要电脑完成的任务。例如:
- “打开Chrome浏览器,搜索‘今天天气怎么样’。”
- “在我的桌面上创建一个名为‘工作计划’的文件夹。”
- “打开Excel,创建一个新的工作簿,然后在A1单元格输入‘你好世界’。”
- 观察执行: 提交指令后,Neural Agent会开始“思考”,规划出执行步骤。然后你会看到鼠标开始自己移动、点击,键盘开始自动输入,就像有一个无形的人在操作你的电脑一样。
- 任务取消: 在任务执行过程中,你可以随时取消当前正在进行的操作。
- 选择不同的AI模型: 你可以在
.env
配置文件中,为不同的智能体模块(如规划、分类、执行等)指定不同的AI模型。这为你提供了极大的灵活性,可以根据任务的不同,选用最合适的模型来提升效果和节约成本。
应用场景
- 自动化处理重复性工作对于需要反复进行的、有固定流程的电脑操作,例如每日的数据录入、报表生成、文件整理归档等,你可以通过给Neural Agent一个指令来让它自动完成,从而解放你的双手。
- 信息搜集与整理当你需要进行课题研究或市场调查时,可以指令Neural Agent上网搜索相关资料,从多个网页中提取关键信息,然后汇总到指定的文档(如记事本、Word)中。例如,你可以让它“查找关于人工智能最新的5篇新闻,并把标题和链接保存到桌面文档里”。
- 辅助编程与开发开发者可以利用它来自动执行一些开发流程,比如打开代码编辑器、运行测试脚本、在GitHub上创建新的代码仓库等,简化开发环境的准备和日常操作。
- 求职申请自动化你可以让Neural Agent帮你自动填写在线求职申请表,将你的简历信息逐一输入到不同的网页表单中,大大节省申请多个职位时所需的时间。
QA
- Neural Agent支持哪些操作系统?Neural Agent可以在Windows、macOS和Linux上运行。但需要注意的是,它的后台自动化功能(在不干扰用户当前操作的情况下,于后台控制浏览器)目前只支持Windows系统。
- 使用Neural Agent是否安全?我的数据会上传到云端吗?Neural Agent的一个核心设计理念就是本地化运行。它直接在你的电脑上操作,所有的数据和任务处理都在本地完成,不会将你的屏幕内容或操作数据上传到云端服务器,这最大限度地保护了你的个人隐私。
- 我需要有AI模型的API密钥才能使用吗?是的,Neural Agent需要连接大型语言模型(LLM)来理解指令和规划任务。你需要在
.env
配置文件中提供至少一种支持的AI模型的API密钥,例如OpenAI的GPT-4、Anthropic的Claude等。同时,它也支持连接本地部署的Ollama,如果你不想使用商业API,可以在自己电脑上运行开源模型。 - 这个工具是免费的吗?我可以自己修改它的代码吗?是的,Neural Agent是一个开源项目,遵循MIT许可证。这意味着你可以免费下载、使用、修改甚至分发它的代码。它鼓励社区开发者参与贡献,共同完善这个工具。