“肉包”AI手机助手:告别电脑,原生Kotlin实现无需Root的开源自动化新体验

2025年底,一款名为“豆包手机助手”的AI工具引起了广泛关注,它能自动完成比价、投简历等复杂手机任务,但由于其商业性质和稀缺性,许多用户表示“买不到”。基于此背景,一个完全开源的解决方案应运而生——它就是“肉包”AI手机自动化助手。

肉包:一款原生Android的开源AI助手

肉包的核心亮点在于其技术实现。与市场上大多数基于Python脚本封装的自动化方案不同,肉包是完全使用原生Android Kotlin语言编写的。这意味着,它不需要依赖外部电脑环境或复杂的Python依赖部署,所有操作都在手机本地完成,延迟更低,使用体验更佳。

解决传统方案的痛点

传统的手机自动化方案通常存在以下问题:

  • 必须连接电脑运行ADB命令。
  • 需要部署Python环境及各种依赖。
  • 操作受限于电脑端,用户体验不佳。

肉包通过提供一个独立的App,将整个流程简化为:安装App、配置API Key、输入指令,即可实现自动化。它实现了真正的“一机搞定一切”。

原生实现的关键:Shizuku权限

要实现模拟点击、滑动、读取屏幕内容等操作,App需要获得类似ADB的系统级权限。Android系统出于安全考虑,通常禁止普通App直接获取这些权限。肉包巧妙地利用了Shizuku。

Shizuku的作用

Shizuku是一个开源工具,它允许普通应用在不Root设备的情况下获得ADB级别的权限。通过Shizuku的无线调试或ADB启动一次服务后,肉包便可以直接执行必要的系统命令,如模拟点击(input tap)和截图(screencap),从而实现在手机本地进行自动化操作。

Tools与Skills双层Agent架构

肉包的架构设计深受Claude Code启发,采用了Tools(原子能力)和Skills(用户意图)的双层Agent框架,这使得它既能执行底层操作,又能理解复杂的用户指令。

Tools层:底层原子能力

Tools层提供了一系列基础操作能力,包括:

  • search_apps:智能搜索已安装应用。
  • open_app:打开指定应用。
  • deep_link:通过DeepLink跳转到App内特定页面。
  • clipboard:读写剪贴板内容。
  • http:执行HTTP请求,调用外部API。
  • shell:执行特定的Shell命令(需权限)。

Skills层:面向用户的任务

Skills层负责将自然语言指令转化为可执行的任务路径。它主要有两种执行模式:

Delegation(委托模式)

当系统识别到用户意图可以委托给其他具备强大AI能力的App时(如直接跳转到豆包、即梦等),它会使用DeepLink快速打开目标应用来完成任务。这种方式快速且高效。

GUI自动化模式

对于没有AI能力的App(如微信、美团),肉包会进入GUI自动化流程。它通过VLM“看懂”当前屏幕内容,然后根据Skill提供的操作步骤,循环执行“截图-分析-操作”的过程,直到任务完成。

核心特性一览

肉包凭借其独特的技术栈,提供了诸多亮点功能,使其在众多自动化工具中脱颖而出。

1. 智能AI Agent能力

基于先进的视觉语言模型(VLM),肉包能够准确理解屏幕视觉信息,并依据自然语言指令进行智能决策和下一步规划。

2. 精致的用户界面

作为开源项目,肉包在UI设计上投入了大量精力,采用了现代化的Material 3设计语言,并支持深色/浅色主题自适应,用户体验流畅美观。

3. 高度可定制性

用户可以灵活配置支持的VLM,包括阿里云通义千问、OpenAI GPT-4V、Claude等。同时,它支持在设置中切换API服务商,甚至可以配置自定义API端点以支持本地模型。

4. 强大的安全防护

数据安全是重中之重。肉包使用AES-256-GCM加密存储API Key。为了保护用户隐私,它内置了敏感页面检测机制,如检测到支付或密码输入页面会自动停止任务。整个过程通过悬浮窗实时显示进度,用户可随时手动终止。

5. Root模式支持

当Shizuku以Root权限运行时,肉包可以启用Root模式,解锁更底层的系统操作能力,但开发者提醒用户需谨慎使用su命令。

快速开始指南

要体验“肉包”的强大功能,需要满足以下前置条件并按步骤操作。

前置条件

  • Android 8.0 (API 26) 及以上版本。
  • 稳定的WiFi网络连接(Shizuku无线调试依赖)。
  • 已安装Shizuku应用并完成授权。
  • 一个VLM服务的API Key(如阿里云或OpenAI)。

安装与配置步骤

第一步:安装并启动Shizuku服务。

  • 推荐使用“无线调试”方式(Android 11+),在开发者选项中开启后,在Shizuku App中启动服务。
  • 或者使用ADB连接电脑,执行特定启动脚本。

第二步:安装肉包。

  • 从肉包的GitHub Releases页面下载最新的APK文件并安装。

第三步:授权与API配置。

  • 打开肉包App,在Shizuku中授权肉包的权限。
  • 进入设置页面,输入并保存你的VLM API Key。例如,国内用户推荐使用阿里云通义千问服务。

使用示例

配置完成后,用户就可以像与真人对话一样指挥肉包完成任务:

  • “帮我点一份附近好吃的汉堡。”
  • “打开网易云音乐播放每日推荐。”
  • “把相册里最新的照片分享到微博。”

肉包作为一款原生、开源且技术领先的AI手机助手,为用户提供了摆脱电脑束缚、实现便捷手机自动化的全新选择。

文章评论

登录后才能发布评论哦
立即登录/注册
消息提醒
Hello, world! This is a toast message.