自动复制问答, 提取截图, 构造评分模版, 调用DeepSeek API评估模型表现. 专为腾讯 Qlabel 平台定制, 节省重复操作时间, 提升标注效率与评估准确性.
✨ 脚本简介
Tagsy 是一款基于油猴(Tampermonkey)的浏览器自动化工具, 专为 Qlabel 平台设计. 它可以帮助标注人员自动提取问题和回答内容, 截图, 构建多模型评估模版, 并调用 DeepSeek API 自动化评分, 实现真正意义上的"自动质检".
无论你是模型评估人员, 标注项目管理者, 还是需要频繁做问答对比和模型打分的开发者, Tagsy 都是你理想的效率工具.
📦 功能特色
- ✅ 自动复制问答内容: 自动提取页面上展示的用户问题, 模型回答
- 🖼️ 截图提取: 抓取所有配图并自动转为 Base64, 用于模型视觉评估
- 🧠 构建六维度评分模版: 包括界面一致性, 图文匹配, 样式, 语义, 内容完整性等
- 🔁 支持多模型评估: 自动按模型 A, B, C 等分组, 快速构建多轮对比模版
- 🔗 调用 DeepSeek API 自动评分: 输入构造完成后, 一键获取模型打分
- 📋 内置状态提示与输出区域: 任务开始, 完成, 错误状态一目了然
- 🛠️ 可拓展接口与维度配置: 评分模版支持自定义字段与维度, 适配多种任务需求
🚀 如何使用
- 安装油猴插件(Tampermonkey)
- 安装本脚本
- 打开脚本发布页(例如 GreasyFork/GitHub Pages), 点击"安装".
- 进入 Qlabel 标注页面
- 支持带有问答内容和配图的页面, 脚本将在页面加载完毕后自动激活.
- 点击脚本按钮/快捷键操作
- 页面右上角或脚本菜单栏将显示 Tagsy 控制面板, 点击即可自动采集问答, 截图, 构建模版并发起评估请求.
- 等待评分结果返回
- DeepSeek 模型评分返回后, 结果将展示在页面底部的输出区域, 支持一键复制保存.
⚠️ 注意事项
- 请确认你已拥有访问 Doubao API 和 DeepSeek API 的权限(可在脚本中填写你的 Token)
- 若页面元素加载较慢, 脚本可能需等待 1-2 秒后再执行操作
- 部分任务页面结构差异较大, 若未能正确提取内容, 可向作者反馈以适配新页面
- DeepSeek API 使用频率高时可能返回
429 Too Many Requests, 建议适当控制调用节奏
🧪 评分维度模板(默认)
| 维度 |
说明 |
| UI一致性 |
页面结构, 样式是否统一, 是否存在错乱布局 |
| 图文一致性 |
图片是否与回答内容匹配 |
| 内容完整性 |
回答是否漏掉关键信息, 是否有缺失 |
| 语义准确性 |
回答是否表达清晰, 语法通顺, 逻辑严谨 |
| 语言风格匹配 |
回答风格是否符合任务设定(如是否够口语化, 正式, 简洁等) |
| 用户满意度预测 |
从用户角度预估对回答是否满意, 是否解决问题 |
✅ 已完成
v1.0.0_Release 初始化版本: 实现基础功能(复制问答 + 模板构建 + Doubao API 与 DeepSeek API 调用)
🛠️ 开发中 / 规划中功能(TODO)
🎉 如果你觉得这个工具好用, 请点赞, 收藏或分享给你的同事, 我要很多很多的小星星~