Skip to content

AI 桌面助理

Mixstart 3.0 内置了强大的 AI 桌面助理,它不仅仅是一个聊天机器人,更是深层集成到系统中的智能管家。你可以通过自然语言指令来控制电脑、管理应用、处理文件、生成文档以及执行复杂的自动化任务。

唤起方式

你可以通过以下方式唤起 AI 助理:

  • 快捷键:按下 Alt + V 组合键(推荐)。

全能助手能力

AI 助理集成了 9 大类、超过 30 种系统级工具,为你提供全方位的桌面辅助。

1. 应用与窗口管理

AI 可以帮你快速启动、关闭或切换应用程序,无需手动寻找图标。

  • 启动/关闭:"打开 VS Code"、"关闭记事本"、"强制关闭卡死的程序"
  • 窗口控制:"切换到微信"、"回到浏览器"
  • 运行状态:"现在运行了哪些程序?"、"列出所有打开的窗口"

2. 系统控制

通过语音或文字指令直接控制系统电源状态,支持定时任务。

  • 电源管理:"锁定屏幕"、"让电脑睡眠"、"重启电脑"、"立刻关机"
  • 定时任务:"30分钟后关机"、"取消关机计划"
  • 系统状态:"查看 CPU 和内存占用"、"我的电脑运行多久了?"

3. 文件管理

完全通过自然语言管理你的文件系统。

  • 文件浏览:"列出下载文件夹里的所有文件"、"看看桌面上有什么"
  • 查找文件:"搜索下载文件夹里的 PDF 文件"、"找一下名字包含'报告'的文档"
  • 整理文件:"把下载文件夹里的图片都移到图片目录"、"把桌面上的所有 Word 文档复制到备份文件夹"
  • 清理与重命名:"删除这个临时文件"、"重命名这个文件夹为 Project_V2"

3.5 文件内容修改 New

AI 可以直接帮你修改文件内容,无需手动打开编辑器。支持文本文件、Excel 和 Word 文档。

  • 文本文件编辑:"把 config.txt 的第 3 行替换成新内容"、"在第 10 行后插入一段代码"、"删除第 5-8 行"
  • Excel 单元格操作:"修改 Excel 的 A1 单元格为 100"、"在表格末尾添加一行数据"、"把所有'待处理'替换成'已完成'"
  • Word 文档编辑:"把 Word 文档里的'张三'替换成'李四'"、"在文档末尾添加签名"
  • 批量修改:"把下载文件夹里所有 txt 文件的'旧版本'替换成'新版本'"
  • 自动对比:修改完成后自动在浏览器中显示修改对比(Diff),方便确认更改

安全机制

  • 修改后的文件默认另存为带 _modified 后缀的新文件,原文件不受影响
  • 自动创建备份,支持撤销恢复
  • 如果文档已被其他程序打开,会自动生成新文件名避免冲突

4. 办公文档生成

AI 内置了 Office 文档生成引擎,一句话即可生成专业文档。

  • Excel 表格:"帮我生成一个销售报表,包含日期、产品、金额三列"
  • PPT 演示文稿:"做一个年终总结 PPT,要黑金主题,包含 5 页"
  • Word 文档:"写一份项目会议纪要模板"

5. 桌面整理与推送

管理你的 Mixstart 桌面组件(栅栏、待办事项)。

  • 栅栏管理:"创建一个叫'工作'的栅栏"、"显示'游戏'栅栏"
  • 待办事项:"创建一个待办清单窗口"、"显示我的待办事项"
  • 布局控制:"关闭所有桌面推送"、"查看桌面上有哪些栅栏"

6. 定时提醒

让 AI 成为你的贴身秘书。

  • 设置提醒:"明天早上 9 点提醒我开会"、"每天下午 3 点提醒我喝水"
  • 管理提醒:"查看我的所有提醒"、"取消明天的开会提醒"

7. 自动化脚本

AI 可以帮你创建、运行和管理 Mix 自动化脚本。

  • 创建脚本:"创建一个脚本:先打开 VS Code,然后打开 Chrome,再播放音乐"
  • 执行脚本:"运行'开发环境'脚本"
  • 管理脚本:"列出所有脚本"、"查看'清理垃圾'脚本的内容"

8. 信息查询与计算

处理日常搜索和信息查询。

  • 应用搜索:"搜索一下'Photo'开头的应用"、"查找系统中的计算器"
  • 天气查询:"北京今天天气怎么样?"、"深圳明天有雨吗?"
  • 数学计算:"计算 128 * 45 + 300"
  • 时间日期:"现在几点了?"、"今天是星期几?"

9. 网页浏览

  • 打开网页:"打开 B 站"、"访问 GitHub"
  • 搜索内容:"用谷歌搜索 React 教程"

10. 剪切板工具

AI 可以读取、分析和修改你的系统剪贴板。

  • 读取内容:"帮我翻译一下剪贴板里的这段话"、"分析剪贴板里的代码是干什么的"
  • 写入内容:"生成一段请假条并复制到剪贴板"
  • 清空:"清空剪贴板"

12. Vision Agent 屏幕代理 New

这是 AI 助理最核心的进化。借助 Vision Agent 模式,AI 不再仅仅是给你建议,而是能够真正观察你的屏幕并像真人一样操作你的电脑。

  • 自主操作:一句话让 AI 自动完成复杂的 GUI 操作,如"帮我打开记事本写一段话"、"打开微信给张三发消息"。
  • 视觉反馈:模型会自动截屏并分析屏幕上的每一个按钮、输入框,配合视觉大模型(如 GPT-4o, Gemini3-VL)进行精准决策。
  • 后台异步执行:任务在后台静默运行,不会锁死 AI 对话框。你可以实时看到 AI 目前执行到的步骤(如:“正在寻找微信图标”、“正在键入文字”)。
  • 多步拆解:对于复杂的任务,Agent 会自动将其拆解为多个子步骤并循环执行,直至任务完成。

使用注意

  • 屏幕代理涉及高风险模拟操作,执行前会强制触发二次确认。
  • 建议仅在配置了高性能 Vision 模型(如 qwen-vl-maxgpt-4o)时使用,以确保操作的精准度。
  • 若任务涉及启动应用,建议先配合使用 launch_app 工具确保应用已在前台。

11. 代码执行与数据获取 Pro

AI 可以直接执行代码来获取外部数据,然后基于数据生成文档。这是最强大的功能之一!

典型使用场景

场景说明示例指令
网络数据爬取从网站 API 获取数据"获取 B站热门视频列表"
数据 → 文档获取数据后生成表格/文档"获取今日 A股涨幅前10,生成 Excel"
信息查询实时获取天气、汇率等"北京今天天气怎么样"
文件处理批量统计、格式转换"计算下载文件夹的大小"
数据分析词频统计、格式化等"统计剪贴板文本的词频"

支持的语言

语言说明推荐程度
JavaScript已内置 axios、cheerio 等模块,无需安装⭐⭐⭐ 推荐
Python需要用户系统已安装 Python⭐⭐
PowerShellWindows 自带

使用示例

示例 1:获取 B站热门视频并生成表格

用户:帮我获取 B站热门视频,生成 Excel 表格

AI 执行流程:
1. 调用 B站公开 API 获取热门视频数据
2. 提取标题、UP主、播放量等字段
3. 调用 create_excel 生成表格文件
4. 提示用户保存文件

示例 2:获取 A股涨幅榜

用户:获取今日 A股涨幅前10,做成表格

AI 执行流程:
1. 调用东方财富 API 获取涨幅榜数据
2. 解析股票代码、名称、涨跌幅等
3. 生成 Excel 表格

示例 3:天气查询

用户:深圳今天天气怎么样?

AI 执行流程:
1. 调用天气 API 获取深圳实时天气
2. 解析温度、天气状况、湿度等
3. 以自然语言回复用户

内置 API 参考

以下 API 无需认证,AI 可以直接调用:

类别用途
B站热门视频、视频搜索、用户信息
天气全球城市天气查询
股票A股/港股实时行情
IP地理获取公网 IP 和位置
GitHub仓库信息、Star 数等

提示

对于动态加载的网站(如淘宝、抖音),AI 会自动选择使用 API 而非直接爬取网页,确保数据获取的成功率。

文件上传与分析

Mixstart AI 助手支持多模态文件分析,你可以直接拖入或上传文件让 AI 进行处理。

支持的文件类型

类型扩展名功能示例
图片png, jpg, webp, bmp"这张图片里有什么?"、"帮我把图里的表格转成 Excel"
办公文档docx, xlsx"总结一下这个 Word 文档"、"分析这个 Excel 表格的数据趋势"
代码/文本txt, md, json, js, py..."解释这段代码"、"帮我重构这个 Python 脚本"

使用限制

  • 图片:最大支持 5MB(自动转换 Base64 处理)
  • 其他文件:最大支持 10MB
  • 单次数量:最多同时上传 4 个文件

安全机制

为了保障系统安全,AI 助理内置了多重防护机制:

  1. 敏感操作确认:执行 删除文件关闭进程关机/重启 等高风险操作时,AI 会强制弹出确认卡片,只有当你点击"确认执行"后才会生效。
  2. 本地沙箱:所有系统操作均在本地安全环境中执行,保护你的隐私数据。

⚠️ 重要提醒

虽然 AI 助手已集成文件删除、系统关机等敏感操作功能,但 我们强烈建议不要使用 AI 执行此类操作

AI 可能会因理解偏差导致误删重要文件或执行非预期操作。对于删除文件、移动重要数据、关机重启等敏感任务,请务必手动操作以确保万无一失。

AI 助手更适合用于: 启动应用、生成文档、查询信息、创建自动化脚本等安全可控的任务。

API 配置

Mixstart AI 助手支持多种配置方式,满足不同用户需求:

模式一:服务器代理(开箱即用)

如果你已购买专业版或在试用期内,无需任何配置即可直接使用 AI 助手。系统会自动通过官方服务器代理调用 AI 服务。

  • ✅ 零配置,开箱即用
  • ✅ 无需自备 API Key
  • ✅ 免费版每日 10 次体验,专业版无限对话

模式二:自定义 API(完全控制)

如需使用自己的 AI 服务或私有部署,可在 设置 → AI 助理 中开启「使用自定义 API」:

  1. 选择 API 提供商(支持 OpenAI、通义千问、DeepSeek、Kimi、智谱 AI 等)
  2. 填入你的 API Key
  3. 可选:自定义 API 地址和模型

支持的提供商预设:

提供商API 地址推荐模型
OpenAIapi.openai.comgpt-4o / gpt-4o-mini
通义千问dashscope.aliyuncs.comqwen-turbo / qwen-max
DeepSeekapi.deepseek.comdeepseek-chat
Moonshot (Kimi)api.moonshot.cnmoonshot-v1-8k
智谱 AIopen.bigmodel.cnglm-4 / glm-4-flash

模式三:混合模式(服务器 + 图片识别)

📢 当前状态

Mixstart 服务器默认配置的 AI 模型 不支持图片识别。如需使用图片分析功能,请按照下方教程自行配置 Vision API。

由于服务器默认模型不支持图片识别,你可以 单独配置 Vision 模型 配合服务器使用。我们推荐使用 通义千问 VL,性价比高且有免费额度。

📝 通义千问 API Key 申请教程

  1. 访问 阿里云百炼平台,使用阿里云账号登录(需完成实名认证)
  2. 在左侧菜单选择「密钥管理
  3. 点击「创建新的 API-KEY」,复制生成的 sk- 开头的密钥

💰 费用说明

开通服务免费,通义千问 VL 模型有 免费额度。超出后按量计费,价格非常实惠。

⚙️ 在 Mixstart 中配置

  1. 打开 Mixstart,进入 设置 → AI 助理
  2. 向下滚动到「图片识别配置」部分
  3. 开启「启用图片识别」开关
  4. 按以下配置填写:
配置项填写内容
Vision API Key粘贴你刚才复制的 sk-xxxxxxxx
Vision API Base URL填写 https://dashscope.aliyuncs.com/compatible-mode/v1
Vision 模型(推荐)qwen3-vl-plus
  1. 点击「保存设置

配置完成! 现在你可以在 AI 助手中发送图片,系统会自动使用通义千问 VL 模型进行识别。

其他推荐的 Vision 模型:

  • GPT-4o / GPT-4o Mini (OpenAI) - 需科学上网
  • GLM-4V (智谱 AI)

提示

Vision 配置是独立的,无需开启「使用自定义 API」也可以单独配置图片识别功能。配置后,文字对话继续免费使用服务器代理,仅图片识别使用你配置的 Vision API。

UI 优化与稳定性 Update

为了提供更完美的视觉体验,Mixstart 对 AI 助理的窗口渲染进行了深度优化:

  • 告别闪烁:针对 Windows 11 系统下的 DWM(桌面窗口管理器)渲染机制进行了特别适配,解决了在窗口缩放、淡入淡出时的“重影”与“闪烁”问题。
  • 精致圆角:通过新的窗口混合模式,确保了在不透明背景下依然能呈现丝滑的圆角效果,彻底消除了旧版本中可能出现的黑色边缘溢出。
  • 流畅动效:优化了动画帧率,无论是唤起还是隐藏,都能感受到更加自然、轻盈的交互反馈。