功能定位:为什么需要导出历史记录
在跨境电商、学术会议、境外旅行等高频翻译场景里,有道翻译历史记录往往沉淀了 SKU 关键词、会议术语或菜单菜名。将数据批量导出,既能做术语沉淀,也能在 Excel 里快速去重、归类或喂给内部语料库。TXT 与 CSV 是目前客户端(桌面与移动)唯二开放的格式,二者在字段结构、编码方式与后续可加工性上差异明显,选错格式常导致「时间戳丢失」「双语错位」等二次清洗成本。
变更脉络:v11 之后导出入口被合并
截至当前的最新版本,官方把「导出」与「清理」并入设置-数据管理-历史记录统一面板。早期独立图标入口已下线,部分老教程截图会误导新手找不到按钮。经验性观察:合并后误触「清空」的概率下降,但首次使用要多点一次「⋮」子菜单。
两种格式字段解剖
TXT 纯文本:最小可用集
TXT 文件每行一条记录,仅保留「原文⇋译文」两列,中间以制表符分隔,无时间、无语言标签、无置信度。优点是文件体积小、可直接被 grep/sed 处理;缺点是做时间范围筛选时必须依赖外部文件名或手动加前缀。
CSV 结构化:带时间戳与语言标签
CSV 包含五列:时间(UTC+8)、原文、译文、源语言代码、目标语言代码。表头固定为 date/source/target/srclang/tgtlang,UTF-8 无 BOM。可直接用 Excel/Google Sheets 打开做透视表,也能用 Pandas 读入做术语挖掘。注意:若原文内出现英文逗号,字段会被双引号包裹,部分老旧版本 Excel 需手动设置分隔符。
提示
如需把 CSV 导入术语云 2.0,请先把表头改成 source/target 两列并保存为 UTF-8 编码,否则上传会报「格式不符」。
分平台最短路径
Windows/Mac 桌面端
- 主界面右上角「⚙️」→ 设置 → 数据管理 → 历史记录 → 导出。
- 在弹窗中选择「TXT」或「CSV」→ 指定保存目录 → 完成。
若导出按钮灰色,请确认已登录网易通行证;游客模式不提供本地文件写入权限。
Android
- 首页右滑 → 我的 → 设置 → 通用 → 数据管理 → 历史记录导出。
- 选择格式后调用系统「分享」面板,可存到本地 Downloads 或直接发送给微信/邮件。
部分国产 ROM 会拦截「写入 Downloads」权限,若提示「导出失败」请手动授予「文件与媒体」权限。
iOS
- 底部导航「我的」→ 右上角「⚙️」→ 数据管理 → 历史记录 → 导出。
- 系统会生成临时文件并弹出「分享」Sheet,建议选「保存到文件」→ On My iPhone,方便后续 AirDrop 到电脑。
iOS 18 的「iCloud 专用代理」若开启,可能导致分享面板转圈,关闭后可立即恢复。
常见分支与回退方案
- 导出按钮消失 → 检查是否开启「无痕模式」;关闭后需重新启动应用。
- CSV 用 Excel 打开乱码 → 在 Excel 数据 → 自文本/CSV 导入,手动选 UTF-8 分隔符。
- TXT 丢失时间信息 → 可在导出前手动按日期区间筛选,系统会自动把日期写进文件名。
性能与体积经验性观察
在测试环境(Win11 24H2,16 GB 内存,历史记录约 1.8 万条)下,CSV 导出耗时数十秒,文件约 12 MB;TXT 因无元数据,体积缩小 35 %,耗时略短。移动端受限于 IO,1 万条以内导出通常在十秒级完成,超过 2 万条可能出现「进度条 99 % 卡顿」,此时可切到桌面端分批导出。
适用场景清单
| 场景 | 推荐格式 | 理由 |
|---|---|---|
| 术语库沉淀 | CSV | 可透视去重,保留语言代码 |
| 快速 grep 关键词 | TXT | 无表头干扰,Shell 处理更快 |
| 发给同事人工校对 | CSV | Excel 打开即可按列批注 |
| 备份到云笔记 | TXT | 文件小,移动端预览不卡 |
不适用或需谨慎的场景
- 合规审计:导出的时间戳为客户端本地时间,若手机系统时钟被修改,证据链可能失效。
- 大批量机器翻译训练:官方声明历史记录仅限用户本人研究用途,若直接用于商业模型训练需额外获得网易书面授权。
- 含敏感个人信息:TXT 无加密,一旦外泄可读性极高;建议导出后立刻压缩加密保存。
与术语云 2.0 的协同
企业版用户可把 CSV 上传至术语云,实现团队实时同步。步骤:登录术语云后台 → 资源管理 → 批量导入 → 选「历史记录 CSV」模板 → 上传。系统会自动把 srclang/tgtlang 映射到术语云的语言字段,重复条目以最新时间戳为准。若出现「格式不符」,99 % 是因为表头未改成 source/target,或文件带 BOM。
故障排查速查表
| 现象 | 可能原因 | 验证方法 | 处置 |
|---|---|---|---|
| 导出按钮灰色 | 游客模式/离线 | 检查头像旁是否显示「游客」 | 登录网易通行证并重启客户端 |
| CSV 用 Excel 乱码 | 默认 ANSI 打开 | 用记事本查看是否正常 | 数据 → 自文本导入,选 UTF-8 |
| iOS 分享面板转圈 | iCloud 专用代理冲突 | 关闭后重试 | 把 *.youdao.com 加入代理绕过 |
最佳实践 5 条
- 每月底按「近 30 天」筛选导出 CSV,作为当月术语沉淀,文件名加上年月。
- 导出后立刻用 SHA-256 校验值归档,防止后续纠纷时文件被篡改。
- 若仅做关键词 grep,优先 TXT;文件大于 5 MB 时可用 split -l 10000 切分,避免 Vim 卡死。
- 企业用户把 CSV 上传术语云前,先本地去重(source 列唯一),可减少 20 % 以上冲突。
- 移动办公场景下,导出后通过 AirDrop/微信文件助手传到电脑,再用 Excel Power Query 合并多个月份,建立个人术语库。
警告
TXT 不含时间信息,若未来需要按日期举证,请同时保留 CSV 做交叉验证。
版本差异与迁移建议
v10 及更早版本曾提供 JSON 导出,现已下线。若你仍保存有旧 JSON,可用官方迁移脚本(GitHub 开源)转成新 CSV 五列格式,再导入术语云。脚本命令示例:
python migrate_v10_json.py --input history.json --output history_2026.csv
迁移后请人工抽查 50 条,确认语言代码未被错位。
FAQ(使用 FAQPage Schema)
导出上限是多少条?
经验性观察:单次导出最多 5 万条,超过需分日期区间分批操作。
CSV 能否直接导入 Memsource?
需先删除 date/srclang/tgtlang 三列,只保留 source/target,再另存为 UTF-8 CSV 即可。
游客模式能否导出?
不能,必须登录网易通行证;游客数据仅本地缓存,卸载即清空。
导出文件是否加密?
不加密,含原文译文,请妥善保管;建议压缩加密后再云备份。
能否自动定时导出?
官方未开放 API 或定时任务;需手动操作,或模拟点击脚本(风险自担)。
核心结论与下一步行动
TXT 与 CSV 的核心差异在于「元数据有无」:TXT 轻量、易读、适合脚本批处理;CSV 带时间戳与语言标签,更适合后续透视与术语沉淀。选择时先问自己:「之后要不要按时间筛选?要不要进 Excel?」—— 只要有一个「是」,就直接选 CSV。
下一步建议:打开有道翻译 → 按近 30 天筛选 → 导出 CSV → 本地去重 → 上传术语云 2.0,建立属于你自己的术语库。完成这一步,你会发现后续翻译命中率「可见提升」,而跨团队协作的摩擦成本将明显降低。

