AI 桌面助理
Mixstart 3.0 内置了强大的 AI 桌面助理,它不仅仅是一个聊天机器人,更是深层集成到系统中的智能管家。你可以通过自然语言指令来控制电脑、管理应用、处理文件、生成文档以及执行复杂的自动化任务。
唤起方式
你可以通过以下方式唤起 AI 助理:
- 快捷键:按下
Alt + V组合键(推荐)。
全能助手能力
AI 助理集成了 9 大类、超过 30 种系统级工具,为你提供全方位的桌面辅助。
1. 应用与窗口管理
AI 可以帮你快速启动、关闭或切换应用程序,无需手动寻找图标。
- 启动/关闭:"打开 VS Code"、"关闭记事本"、"强制关闭卡死的程序"
- 窗口控制:"切换到微信"、"回到浏览器"
- 运行状态:"现在运行了哪些程序?"、"列出所有打开的窗口"
2. 系统控制
通过语音或文字指令直接控制系统电源状态,支持定时任务。
- 电源管理:"锁定屏幕"、"让电脑睡眠"、"重启电脑"、"立刻关机"
- 定时任务:"30分钟后关机"、"取消关机计划"
- 系统状态:"查看 CPU 和内存占用"、"我的电脑运行多久了?"
3. 文件管理
完全通过自然语言管理你的文件系统。
- 文件浏览:"列出下载文件夹里的所有文件"、"看看桌面上有什么"
- 查找文件:"搜索下载文件夹里的 PDF 文件"、"找一下名字包含'报告'的文档"
- 整理文件:"把下载文件夹里的图片都移到图片目录"、"把桌面上的所有 Word 文档复制到备份文件夹"
- 清理与重命名:"删除这个临时文件"、"重命名这个文件夹为 Project_V2"
3.5 文件内容修改 New
AI 可以直接帮你修改文件内容,无需手动打开编辑器。支持文本文件、Excel 和 Word 文档。
- 文本文件编辑:"把 config.txt 的第 3 行替换成新内容"、"在第 10 行后插入一段代码"、"删除第 5-8 行"
- Excel 单元格操作:"修改 Excel 的 A1 单元格为 100"、"在表格末尾添加一行数据"、"把所有'待处理'替换成'已完成'"
- Word 文档编辑:"把 Word 文档里的'张三'替换成'李四'"、"在文档末尾添加签名"
- 批量修改:"把下载文件夹里所有 txt 文件的'旧版本'替换成'新版本'"
- 自动对比:修改完成后自动在浏览器中显示修改对比(Diff),方便确认更改
安全机制
- 修改后的文件默认另存为带
_modified后缀的新文件,原文件不受影响 - 自动创建备份,支持撤销恢复
- 如果文档已被其他程序打开,会自动生成新文件名避免冲突
4. 办公文档生成
AI 内置了 Office 文档生成引擎,一句话即可生成专业文档。
- Excel 表格:"帮我生成一个销售报表,包含日期、产品、金额三列"
- PPT 演示文稿:"做一个年终总结 PPT,要黑金主题,包含 5 页"
- Word 文档:"写一份项目会议纪要模板"
5. 桌面整理与推送
管理你的 Mixstart 桌面组件(栅栏、待办事项)。
- 栅栏管理:"创建一个叫'工作'的栅栏"、"显示'游戏'栅栏"
- 待办事项:"创建一个待办清单窗口"、"显示我的待办事项"
- 布局控制:"关闭所有桌面推送"、"查看桌面上有哪些栅栏"
6. 定时提醒
让 AI 成为你的贴身秘书。
- 设置提醒:"明天早上 9 点提醒我开会"、"每天下午 3 点提醒我喝水"
- 管理提醒:"查看我的所有提醒"、"取消明天的开会提醒"
7. 自动化脚本
AI 可以帮你创建、运行和管理 Mix 自动化脚本。
- 创建脚本:"创建一个脚本:先打开 VS Code,然后打开 Chrome,再播放音乐"
- 执行脚本:"运行'开发环境'脚本"
- 管理脚本:"列出所有脚本"、"查看'清理垃圾'脚本的内容"
8. 信息查询与计算
处理日常搜索和信息查询。
- 应用搜索:"搜索一下'Photo'开头的应用"、"查找系统中的计算器"
- 天气查询:"北京今天天气怎么样?"、"深圳明天有雨吗?"
- 数学计算:"计算 128 * 45 + 300"
- 时间日期:"现在几点了?"、"今天是星期几?"
9. 网页浏览
- 打开网页:"打开 B 站"、"访问 GitHub"
- 搜索内容:"用谷歌搜索 React 教程"
10. 剪切板工具
AI 可以读取、分析和修改你的系统剪贴板。
- 读取内容:"帮我翻译一下剪贴板里的这段话"、"分析剪贴板里的代码是干什么的"
- 写入内容:"生成一段请假条并复制到剪贴板"
- 清空:"清空剪贴板"
12. Vision Agent 屏幕代理 New
这是 AI 助理最核心的进化。借助 Vision Agent 模式,AI 不再仅仅是给你建议,而是能够真正观察你的屏幕并像真人一样操作你的电脑。
- 自主操作:一句话让 AI 自动完成复杂的 GUI 操作,如"帮我打开记事本写一段话"、"打开微信给张三发消息"。
- 视觉反馈:模型会自动截屏并分析屏幕上的每一个按钮、输入框,配合视觉大模型(如 GPT-4o, Gemini3-VL)进行精准决策。
- 后台异步执行:任务在后台静默运行,不会锁死 AI 对话框。你可以实时看到 AI 目前执行到的步骤(如:“正在寻找微信图标”、“正在键入文字”)。
- 多步拆解:对于复杂的任务,Agent 会自动将其拆解为多个子步骤并循环执行,直至任务完成。
使用注意
- 屏幕代理涉及高风险模拟操作,执行前会强制触发二次确认。
- 建议仅在配置了高性能 Vision 模型(如
qwen-vl-max或gpt-4o)时使用,以确保操作的精准度。 - 若任务涉及启动应用,建议先配合使用
launch_app工具确保应用已在前台。
11. 代码执行与数据获取 Pro
AI 可以直接执行代码来获取外部数据,然后基于数据生成文档。这是最强大的功能之一!
典型使用场景
| 场景 | 说明 | 示例指令 |
|---|---|---|
| 网络数据爬取 | 从网站 API 获取数据 | "获取 B站热门视频列表" |
| 数据 → 文档 | 获取数据后生成表格/文档 | "获取今日 A股涨幅前10,生成 Excel" |
| 信息查询 | 实时获取天气、汇率等 | "北京今天天气怎么样" |
| 文件处理 | 批量统计、格式转换 | "计算下载文件夹的大小" |
| 数据分析 | 词频统计、格式化等 | "统计剪贴板文本的词频" |
支持的语言
| 语言 | 说明 | 推荐程度 |
|---|---|---|
| JavaScript | 已内置 axios、cheerio 等模块,无需安装 | ⭐⭐⭐ 推荐 |
| Python | 需要用户系统已安装 Python | ⭐⭐ |
| PowerShell | Windows 自带 | ⭐ |
使用示例
示例 1:获取 B站热门视频并生成表格
用户:帮我获取 B站热门视频,生成 Excel 表格
AI 执行流程:
1. 调用 B站公开 API 获取热门视频数据
2. 提取标题、UP主、播放量等字段
3. 调用 create_excel 生成表格文件
4. 提示用户保存文件示例 2:获取 A股涨幅榜
用户:获取今日 A股涨幅前10,做成表格
AI 执行流程:
1. 调用东方财富 API 获取涨幅榜数据
2. 解析股票代码、名称、涨跌幅等
3. 生成 Excel 表格示例 3:天气查询
用户:深圳今天天气怎么样?
AI 执行流程:
1. 调用天气 API 获取深圳实时天气
2. 解析温度、天气状况、湿度等
3. 以自然语言回复用户内置 API 参考
以下 API 无需认证,AI 可以直接调用:
| 类别 | 用途 |
|---|---|
| B站 | 热门视频、视频搜索、用户信息 |
| 天气 | 全球城市天气查询 |
| 股票 | A股/港股实时行情 |
| IP地理 | 获取公网 IP 和位置 |
| GitHub | 仓库信息、Star 数等 |
提示
对于动态加载的网站(如淘宝、抖音),AI 会自动选择使用 API 而非直接爬取网页,确保数据获取的成功率。
文件上传与分析
Mixstart AI 助手支持多模态文件分析,你可以直接拖入或上传文件让 AI 进行处理。
支持的文件类型
| 类型 | 扩展名 | 功能示例 |
|---|---|---|
| 图片 | png, jpg, webp, bmp | "这张图片里有什么?"、"帮我把图里的表格转成 Excel" |
| 办公文档 | docx, xlsx | "总结一下这个 Word 文档"、"分析这个 Excel 表格的数据趋势" |
| 代码/文本 | txt, md, json, js, py... | "解释这段代码"、"帮我重构这个 Python 脚本" |
使用限制
- 图片:最大支持 5MB(自动转换 Base64 处理)
- 其他文件:最大支持 10MB
- 单次数量:最多同时上传 4 个文件
安全机制
为了保障系统安全,AI 助理内置了多重防护机制:
- 敏感操作确认:执行 删除文件、关闭进程、关机/重启 等高风险操作时,AI 会强制弹出确认卡片,只有当你点击"确认执行"后才会生效。
- 本地沙箱:所有系统操作均在本地安全环境中执行,保护你的隐私数据。
⚠️ 重要提醒
虽然 AI 助手已集成文件删除、系统关机等敏感操作功能,但 我们强烈建议不要使用 AI 执行此类操作。
AI 可能会因理解偏差导致误删重要文件或执行非预期操作。对于删除文件、移动重要数据、关机重启等敏感任务,请务必手动操作以确保万无一失。
AI 助手更适合用于: 启动应用、生成文档、查询信息、创建自动化脚本等安全可控的任务。
API 配置
Mixstart AI 助手支持多种配置方式,满足不同用户需求:
模式一:服务器代理(开箱即用)
如果你已购买专业版或在试用期内,无需任何配置即可直接使用 AI 助手。系统会自动通过官方服务器代理调用 AI 服务。
- ✅ 零配置,开箱即用
- ✅ 无需自备 API Key
- ✅ 免费版每日 10 次体验,专业版无限对话
模式二:自定义 API(完全控制)
如需使用自己的 AI 服务或私有部署,可在 设置 → AI 助理 中开启「使用自定义 API」:
- 选择 API 提供商(支持 OpenAI、通义千问、DeepSeek、Kimi、智谱 AI 等)
- 填入你的 API Key
- 可选:自定义 API 地址和模型
支持的提供商预设:
| 提供商 | API 地址 | 推荐模型 |
|---|---|---|
| OpenAI | api.openai.com | gpt-4o / gpt-4o-mini |
| 通义千问 | dashscope.aliyuncs.com | qwen-turbo / qwen-max |
| DeepSeek | api.deepseek.com | deepseek-chat |
| Moonshot (Kimi) | api.moonshot.cn | moonshot-v1-8k |
| 智谱 AI | open.bigmodel.cn | glm-4 / glm-4-flash |
模式三:混合模式(服务器 + 图片识别)
📢 当前状态
Mixstart 服务器默认配置的 AI 模型 不支持图片识别。如需使用图片分析功能,请按照下方教程自行配置 Vision API。
由于服务器默认模型不支持图片识别,你可以 单独配置 Vision 模型 配合服务器使用。我们推荐使用 通义千问 VL,性价比高且有免费额度。
📝 通义千问 API Key 申请教程
- 访问 阿里云百炼平台,使用阿里云账号登录(需完成实名认证)
- 在左侧菜单选择「密钥管理」
- 点击「创建新的 API-KEY」,复制生成的
sk-开头的密钥
💰 费用说明
开通服务免费,通义千问 VL 模型有 免费额度。超出后按量计费,价格非常实惠。
⚙️ 在 Mixstart 中配置
- 打开 Mixstart,进入 设置 → AI 助理
- 向下滚动到「图片识别配置」部分
- 开启「启用图片识别」开关
- 按以下配置填写:
| 配置项 | 填写内容 |
|---|---|
| Vision API Key | 粘贴你刚才复制的 sk-xxxxxxxx |
| Vision API Base URL | 填写 https://dashscope.aliyuncs.com/compatible-mode/v1 |
| Vision 模型 | (推荐)qwen3-vl-plus |
- 点击「保存设置」
配置完成! 现在你可以在 AI 助手中发送图片,系统会自动使用通义千问 VL 模型进行识别。
其他推荐的 Vision 模型:
- GPT-4o / GPT-4o Mini (OpenAI) - 需科学上网
- GLM-4V (智谱 AI)
提示
Vision 配置是独立的,无需开启「使用自定义 API」也可以单独配置图片识别功能。配置后,文字对话继续免费使用服务器代理,仅图片识别使用你配置的 Vision API。
UI 优化与稳定性 Update
为了提供更完美的视觉体验,Mixstart 对 AI 助理的窗口渲染进行了深度优化:
- 告别闪烁:针对 Windows 11 系统下的 DWM(桌面窗口管理器)渲染机制进行了特别适配,解决了在窗口缩放、淡入淡出时的“重影”与“闪烁”问题。
- 精致圆角:通过新的窗口混合模式,确保了在不透明背景下依然能呈现丝滑的圆角效果,彻底消除了旧版本中可能出现的黑色边缘溢出。
- 流畅动效:优化了动画帧率,无论是唤起还是隐藏,都能感受到更加自然、轻盈的交互反馈。