OMG-Agent简介

OMG-Agent 是一款基于自然语言指令的开源移动端自动化助手,专为 Android 手机操作场景设计,支持多种 GUI 模型和跨平台部署,适合开发者、AI爱好者及效率控使用。

68747470733a2f2f692e6d6565652e636f6d2e74772f54574b796f54652e676966 | OMG-Agent:开源安卓自动化助手,通过自然语言操控手机任务

项目亮点

  • 开源透明:完全开源,托管于 GitHub,支持二次开发与社区共建
  • 自然语言驱动:输入如“打开微信发消息给张三”的指令,即可完成手机自动化任务
  • 模型支持丰富:内置支持 AutoGLM 和 GELab-Zero 等知名手机 GUI 模型
  • ADB 实时操控:通过 ADB 接口与 Android 设备交互,支持截图、操作执行等功能
  • 双语界面 + 主题切换:中英文界面自由切换,支持暗色/亮色模式
  • 兼容性强:支持真实 Android 手机和模拟器,兼容 OpenAI 接口调用

使用流程概览

  1. 安装 ADB 环境
    • Windows: scoop install adb
    • macOS: brew install android-platform-tools
    • Linux: apt install adb
  2. 克隆并运行
    git clone https://github.com/safphere/OMG-Agent.git
    cd OMG-Agent
    pip install -r requirements.txt
    python run.py
    
  3. 手机配置
    • 开启开发者选项 + USB调试
    • 安装 ADBKeyboard 输入法
    • 使用 USB 连接手机并授权
  4. 开始使用
    • 点击「刷新」识别设备
    • 点击「开始投屏」预览界面
    • 输入自然语言任务并点击「执行」

支持模型介绍

模型名称 来源 特点
AutoGLM-Phone-9B 智谱AI 针对手机 GUI 操作优化的大模型
GELab-Zero-4B-preview 阶跃星辰 适用于通用手机 Agent 任务的轻量模型

这些模型均为专门训练的手机图形界面大模型,可高效处理复杂操作任务。

适合谁使用?

  • 想用自然语言远程操控手机的极客玩家
  • 研究自动化 UI 测试或 Agent 技术的开发者
  • 从事 AI Agent 产品研发、验证与测试的团队
  • 有多设备协同需求的自动化工作者

OMG-Agent获取项目

安装地址:网盘

GitHub 开源地址:👉 https://github.com/safphere/OMG-Agent/

  1. 转载请保留原文链接谢谢!
  2. 本站所有资源文章出自互联网收集整理,本站不参与制作,如果侵犯了您的合法权益,请联系本站我们会及时删除。
  3. 本站发布资源来源于互联网,可能存在水印或者引流等信息,请用户擦亮眼睛自行鉴别,做一个有主见和判断力的用户。
  4. 本站资源仅供研究、学习交流之用,若使用商业用途,请购买正版授权,否则产生的一切后果将由下载用户自行承担。
  5. 联系方式(#替换成@):feedback#abskoop.com