图片文字提取器 (OCR)
使用 OCR 从图片中提取文字。通过 Tesseract.js 支持 100+ 种语言。
拖放文件到此处或点击浏览
image/*
什么是 OCR(光学字符识别)?
OCR(光学字符识别)将图片中的文字转换为可编辑、可搜索的数字文本。我们的工具使用 Tesseract.js——领先的开源 OCR 引擎的 WebAssembly 版本——在浏览器中直接识别 100+ 种语言的文字。
为什么选择我们?
需要将扫描文档数字化、从截图中提取文字,或让图片内容可搜索?我们的工具在浏览器中即时完成——无需注册、无需上传到服务器,你的图片始终完全保存在你的设备上。
使用方法
1
拖放或选择图片文件
2
选择文字语言
3
等待 OCR 处理完成
4
复制提取的文字
核心功能
100+ 种语言
识别英文、中文、日文、韩文等多种语言
WASM 驱动
Tesseract OCR 引擎完全在浏览器中运行
100% 隐私
图片在本地处理——从不上传到服务器
复制文字
一键复制提取的文字到剪贴板
进度追踪
OCR 处理时显示实时进度条
多种格式
支持 JPEG、PNG、WebP、GIF、BMP 和 TIFF
支持的图片格式
位图
JPEGPNGWebPGIFBMPTIFF
常见问题
支持哪些语言?
我们的 OCR 工具支持 100+ 种语言,包括英文、简体中文、繁体中文、日文、韩文、西班牙文、法文、德文、阿拉伯文、印地文等。选择正确的语言可获得最佳识别效果。
文字识别准确率如何?
准确率取决于图片质量、字体清晰度和文字大小。清晰、高分辨率且使用标准字体的图片通常能达到 95% 以上的准确率。模糊或过小的文字会降低准确率。
能识别手写文字吗?
Tesseract.js 针对印刷文字优化。手写识别能力有限,仅对非常清晰、间距良好的手写体效果较好。建议使用包含印刷或打字文字的图片以获得最佳效果。
有文件大小限制吗?
没有服务器端限制,因为处理在浏览器中进行。超大图片处理时间可能较长。为获得最佳性能,建议使用 10 MB 以内的图片。
我的图片会被上传到服务器吗?
不会。所有 OCR 处理完全在浏览器中通过 WebAssembly 进行。你的图片从不离开设备,也不会被存储在任何地方。