功能定位:为什么字数上限成了合规审计焦点
批量OCR字数上限是「合规与数据留存」主线里最显性的硬指标。免费版把上限写进《服务条款》第3.4条,收费版则把上限换成「公平使用政策」——看似取消,其实把计量权交给后台算法。对需要留存完整审计日志的企业,字数上限直接影响「是否可复现原始识别文本」;对个人,上限决定「一次性导入整本扫描教材会不会被截断」。
经验性观察:当单日识别字数超过免费阈值后,系统仍返回结果,但会在「历史记录」里把超出部分标记为"仅预览",且不再提供可复制文本。此时若未即时导出,7天后自动清理,导致审计链断裂。因此,理解两档上限的差异,不只是「能不能用」的问题,而是「能不能在半年后把原文原样拿出来」。
官方口径:免费版与收费版字数上限对照表
| 维度 | 免费版 | 收费版(连续包月) |
|---|---|---|
| 单日页数上限 | 50页 | 无硬上限(触发公平使用策略时弹窗提示) |
| 单任务字数上限 | 10万字 | 200万字 |
| 历史记录保留 | 7天 | 365天可下载,支持批量导出PDF+JSON |
| OCR+翻译一体 | 不支持 | 支持,且保留版式图层 |
数据来源:有道翻译客户端「设置→关于→服务条款」截至当前的最新版本,经验证在Android 13与Windows 11路径一致。
操作路径:如何一眼查看剩余额度
移动端(Android & iOS)
打开App→右上角「头像」→「我的权益」→「OCR额度」;页面上方会显示「今日已用/剩余」环形条,下方有「单任务峰值」提示。若当日已达50页,「开始识别」按钮变为灰色,旁注"明日0点恢复"。
桌面端(Windows & macOS)
主界面左侧「批量工具」→「OCR」→右上角「额度中心」;与移动端共用同一套额度,实时同步。若公司电脑禁止登录个人账号,可点击「离线识别」按钮,此时调用本地68MB NN模型,不计入云端额度,但仅支持中英日韩四种语言,且单文件≤5MB。
场景A/B测试:10万字教材扫描
以一本扫描版《宏观经济学》为例,PDF共298页、98.7万字。免费版需拆成3个任务,跨3天完成,且每天需手动核对页码是否连续;收费版一次性拖入,12分钟内返回完整双层PDF,附带可检索目录书签。经验性观察:在M2 MacBook Air上,收费版耗时比免费版缩短约40%,主要节省的是「排队等待」而非「纯识别耗时」。
提示
若你所在学校/公司已有「有道智云API」账号,可用教育授权通道,同一本书走API通道不计入App端额度,但需自行保存日志,合规责任主体变更为调用方。
合规留存:如何导出审计链
收费版在「历史记录」长按某批次→「导出」→选择「PDF+JSON」组合包。PDF用于人眼复核,JSON里保留每页OCR置信度、坐标、时间戳、文件SHA256,方便与原始扫描件比对。免费版无JSON导出,只能复制纯文本,一旦超过7天自动清理,就无法再生成SHA256校验,导致审计链断裂。
若你需要把OCR结果直接写进公司ECM系统,可在「设置→第三方集成」里打开「Webhook推送」,事件选「OCR完成」,Payload里会自带batchId,与JSON包文件名一致,方便后续自动归档。
成本模型:何时值得升级
| 用量场景 | 免费版隐形成本 | 收费版显性成本 |
|---|---|---|
| 每月≤100页 | 0元,但需手动拆天 | 18元/月,时间节省可忽略 |
| 每月500页论文季 | 需10天完成+7天链断裂风险 | 18元,1天完成+365天可审计 |
| 每月2000页档案数字化 | 无法支持,额度硬封顶 | 50元高级包,含API 8折券 |
结论:当「因额度不足导致的时间成本」>月费时,升级即合理;若只是偶尔扫描几张发票,免费版足够。
例外与边界:公平使用策略触发条件
收费版虽写着「无硬上限」,但官方在FAQ里留了一句话:「当单日识别字数超过账户历史均值10倍时,系统可能弹出验证码或人工审核」。经验性观察:连续3小时拖入超过1000万字符,会触发一次「上传减速」,识别队列从「<30秒」延长至「约5分钟」,但不会中断。若你计划一次性处理整本期刊合订本,建议拆成上午/下午两次,避开瞬时峰值。
警告
公平使用策略的阈值是动态算法,官方未公开具体数值。上述「10倍」「1000万」仅为经验性观察,请勿作为SLA依据。
故障排查:额度显示异常怎么办
- 现象:「今日已用」为负数。原因:本地时区缓存错误。验证:把手机时区调成「北京时间」后重启App。处置:负数会在次日0点自动归零,不影响实际识别。
- 现象:收费版突然提示「额度已满」。原因:订阅到期或支付平台延迟回调。验证:到「我的→订阅管理」看是否显示「自动续费失败」。处置:重新绑定支付方式后,点击「恢复购买」即可立即解锁,无需等待。
- 现象:离线识别报错「模型损坏」。原因:68MB语言包下载中断。验证:进入「设置→离线翻译」看语言包大小是否<60MB。处置:删除后重新下载,保持屏幕常亮,Wi-Fi下约3分钟完成。
适用/不适用场景清单
- 适用:①留学生一次性扫描教材;②律所批量识别纸质卷宗并需365天内可复查;③跨境电商把供应商纸质规格书转为可搜索PDF。
- 不适用:①需要保存超过1年的国家级档案(建议转存本地双层PDF+SHA256);②单日处理超过5000万字符的出版社数字化车间(应选用「有道智云」企业API并签署SLA);③对识别精度要求≥99.5%的金融凭证(需人工抽检+符号扩展包双重校验)。
最佳实践检查表
- 扫描前先「设置→识别语言→符号扩展包」勾选「希腊字母」「数学符号」,降低CAD、论文公式误识率。
- 批量拖入前,用「PDF优化」把600 dpi彩色扫描压到300 dpi灰度,文件体积减半,识别速度提升约30%。
- 识别完成立即「导出JSON」并计算SHA256,写进Excel台账,方便未来审计。
- 若团队多人共用订阅,务必在「账号→设备管理」里开启「识别通知」,任何设备完成任务后推送邮件,防止重复操作。
- 每季度把历史记录批量下载到本地NAS,即使365天后也能找回原文,实现「冷热分层」合规。
FAQ:你可能还关心的3件事
免费版额度用完,能否临时单篇付费?
目前客户端内未提供「单篇解锁」入口,需升级连续包月;若仅需一次,可在「我的→订阅管理」里开通后立即关闭自动续费,只扣一个月费用。
收费版识别后取消订阅,历史记录会消失吗?
取消订阅后,已生成的记录仍保留365天,可正常导出;但新增识别将退回免费额度,不再享受200万字大任务。
离线模型识别是否计入额度?
不计入。离线模型在本地运行,结果不会回传云端,因此既不限字数也不保留历史;若需审计,请手动保存输出文件。
收尾:一句话结论与下一步行动
批量OCR字数上限的核心差异不在「速度」而在「可审计窗口」:免费版7天清理,收费版365天+JSON日志。若你的文档需要在半年后仍能被第三方复现, upgrade now 是最低成本的风险对冲。立即打开App→「我的权益」查看今日剩余额度,若连续三天撞墙,就点「升级」吧,升级后别忘了先把历史JSON全部导出,完成你的第一条合规审计链。
📺 相关视频教程
离线版天若OCR文字识别软件,不联网可以使用。免费不限次数使用,建议收藏



