news 2026/4/3 9:22:14

能控制手机屏幕的开源agent多模态工具

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
能控制手机屏幕的开源agent多模态工具

之前探索了能控制电脑桌面的开源agent工具。

https://blog.csdn.net/liliang199/article/details/156018145

这里进一步探索能控制手机屏幕的开源agent多模态工具。

1 模拟工具

以下是几款可以实现移动端模拟操作的开源工具。

其中,Open-AutoGLM和Airtest功能较为强大和主流,

1.1 Open-AutoGLM

AI驱动,自然语言交互,多模态理解,面向开发者的高级自动化、智能任务助理

基于视觉语言模型理解屏幕,通过ADB执行操作,可解析用户指令并自动规划任务流程

https://github.com/zai-org/Open-AutoGLM

1.2 Airtest

跨平台,基于图像识别,提供IDE,游戏和App的UI自动化测试、简易脚本录制与回放

通过图像匹配定位UI元素,模拟点击、滑动等操作,支持生成测试报告

https://github.com/AirtestProject/Airtest

1.3 mcp-android-emulator

与AI助手(如Claude)深度集成 作为MCP服务器,将ADB操作(截图、点击、输入等)

通过AI助手直接控制安卓设备进行探索或测试,可以封装为AI可调用的工具

https://github.com/Anjos2/mcp-android-emulator

1.4 Mobile-Env

学术研究导向,强化学习平台,主要用于学术研究、开发与评估交互式AI代理

为训练AI代理与移动应用交互而设计,提供标准化的环境和任务集

https://github.com/stefanbschneider/mobile-env

2 选择工具

可以根据主要目的来选择适合的移动端模拟工具,目标是实现高度智能的自动化任务。

如果用自然语言描述复杂操作流程,应优先选择Open-AutoGLM。

如果主要进行UI自动化测试,如回归测试、兼容性测试,Airtest及其图形化IDE会更简单直接。

如果是探索AI模型控制手机,则选mcp-android-emulator,它能通过对话指挥AI助手操作设备。

如果是学术研究、训练AI模型,则选Mobile-Env,它提供了现成的强化学习实验平台。

在Android平台,则需要配置Android Debug Bridge (ADB) 环境,准备安卓真机或模拟器。

reference

---

能控制计算机桌面的多模态AI agent

https://blog.csdn.net/liliang199/article/details/156018145

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/13 21:40:40

【开题答辩全过程】以 基于web的拍卖系统设计与实现为例,包含答辩的问题和答案

个人简介一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。感谢大家的…

作者头像 李华
网站建设 2026/3/28 11:06:18

中国温室气体排放因子数据库

1793中国温室气体排放因子数据库数据简介本数据是2025年1月最新更新的《国家温室气体数据库》,该数据原始数据来源于国家温室气体排放因子数据库,发布年份为2024年,由数据皮皮侠团队人工整理。本数据记录了不同温室气体排放源的详细信息&…

作者头像 李华
网站建设 2026/3/19 14:10:50

康养休闲旅游实训室建设实施路径

一、康养休闲旅游服务实训室建设方案实施总纲与前期准备任何成功的建设都始于周密的准备。本阶段的核心是统一思想、夯实基础,为“康养休闲旅游服务实训室建设方案”的全面展开锚定方向。首要任务是成立专项工作小组,明确校方、企业、行业专家等多方职责…

作者头像 李华
网站建设 2026/3/30 23:44:23

如何评价灵心巧手在CES 2026上展示的灵巧手技术?它是否意味着具身智能的“最后一厘米”难题正在被攻克?

拉斯维加斯CES 2026的展馆,一如既往地喧嚣🔥然而,当全球目光聚焦于机器人炫酷的“躯体”时,真正的挑战仍藏在最后一厘米——那双“手”。2026年1月7日至9日,在美国拉斯维加斯举办的CES国际消费电子展上,灵心…

作者头像 李华
网站建设 2026/4/3 4:13:17

选对ERP和MES系统集成厂家是制造业数字化转型的生死线

作为一家制造业企业的老板或管理者,您一定深知这样的困扰: 销售部在ERP里下了急单,生产车间在MES里却迟迟看不到;车间现场的设备效率数据,财务部无法用来做精准的成本核算;一个简单的订单变更,需…

作者头像 李华