guide·Команда pdfty··2 min read

Как распознать текст со скана (OCR) в PDF бесплатно

Скан PDF, где текст нельзя выделить или найти? Распознайте текст за секунды — поиск, копирование и выделение заработают. Бесплатно, без программ.

Распознавание текста со скана в PDF
Скан → документ с поиском за секунды

Отсканировали документ, открыли PDF — а текст нельзя ни выделить, ни найти поиском. Потому что страница на самом деле картинка, фото бумаги. OCR (распознавание текста) это исправляет.

Что делает OCR

OCR «читает» картинку и добавляет поверх неё невидимый слой настоящего текста. Скан выглядит точно так же, но теперь:

  • работает поиск (Ctrl/Cmd-F),
  • текст можно выделить и скопировать,
  • скринридеры читают документ вслух,
  • по документу можно делать редактирование с поиском нужных слов.

Как распознать — пошагово

1

Откройте инструмент OCR

Перейдите на pdfty.com/tools/ocr. Бесплатно до 20 МБ.

Drop PDF here
2

Загрузите скан

Перетащите PDF со сканом (или фото документа).

Drop PDF here
3

Выберите язык

Русский, английский и десятки других. Для смешанных документов можно выбрать несколько.

WebPrintPrepress
4

Нажмите «Распознать»

10–20 секунд на документ средней длины.

Compressing…69%~2 seconds remaining
5

Скачайте PDF с текстом

Внешне тот же скан, но теперь с поиском и копированием.

All done — file readyAuto-deleted in 1 hour
10–20 сек
Среднее время распознавания
Tesseract
Бесплатный движок с поддержкой русского
+ поиск
Текст становится выделяемым и ищется
1 час
До удаления файла с сервера

Частые вопросы

Скан станет выглядеть иначе?

Нет — картинка остаётся прежней. Текстовый слой невидимый, добавляется поверх.

Насколько точно распознаётся?

Для чистых сканов — очень хорошо. Для мятых, тёмных или рукописных — хуже (рукописный текст распознаётся плохо у любого бесплатного движка).

Какие языки поддерживаются?

Русский, английский и десятки других. Для документа на двух языках выберите оба.

Можно потом сжать распознанный PDF?

Да — после OCR прогоните файл через Сжатие, текстовый слой сохранится.

Распознавание идёт на сервере?

Да, по защищённому HTTPS. Файл удаляется в течение 1 часа.

Команда pdfty

Команда pdfty — приватные онлайн-инструменты для PDF: сжатие, конвертация, OCR, подпись и защита. Файлы удаляются через 1 час. О нас →

Читайте также