Как распознать текст со скана (OCR) в PDF бесплатно

Скан PDF, где текст нельзя выделить или найти? Распознайте текст за секунды — поиск, копирование и выделение заработают. Бесплатно, без программ.

Распознавание текста со скана в PDF — Скан → документ с поиском за секунды

TL;DR

Самый быстрый способ: перетащите скан на pdfty.com/tools/ocr, нажмите «Распознать», скачайте PDF с текстовым слоем. Около 10–20 секунд.
OCR добавляет невидимый слой настоящего текста поверх скана — внешне ничего не меняется, но появляются поиск, копирование и выделение.
Нужно для: отсканированных договоров, книг, квитанций, всего, где страница — это фото и текст «не выделяется».
Бесплатно, на движке Tesseract. Поддерживает русский и ещё десятки языков.

Отсканировали документ, открыли PDF — а текст нельзя ни выделить, ни найти поиском. Потому что страница на самом деле картинка, фото бумаги. OCR (распознавание текста) это исправляет.

Что делает OCR

OCR «читает» картинку и добавляет поверх неё невидимый слой настоящего текста. Скан выглядит точно так же, но теперь:

работает поиск (Ctrl/Cmd-F),
текст можно выделить и скопировать,
скринридеры читают документ вслух,
по документу можно делать редактирование с поиском нужных слов.

Как распознать — пошагово

Откройте инструмент OCR

Перейдите на pdfty.com/tools/ocr. Бесплатно до 20 МБ.

Загрузите скан

Перетащите PDF со сканом (или фото документа).

Выберите язык

Русский, английский и десятки других. Для смешанных документов можно выбрать несколько.

Нажмите «Распознать»

10–20 секунд на документ средней длины.

Скачайте PDF с текстом

Внешне тот же скан, но теперь с поиском и копированием.

10–20 сек

Среднее время распознавания

Tesseract

Бесплатный движок с поддержкой русского

+ поиск

Текст становится выделяемым и ищется

1 час

До удаления файла с сервера

Частые вопросы

Скан станет выглядеть иначе?

Нет — картинка остаётся прежней. Текстовый слой невидимый, добавляется поверх.

Насколько точно распознаётся?

Для чистых сканов — очень хорошо. Для мятых, тёмных или рукописных — хуже (рукописный текст распознаётся плохо у любого бесплатного движка).

Какие языки поддерживаются?

Русский, английский и десятки других. Для документа на двух языках выберите оба.

Можно потом сжать распознанный PDF?

Да — после OCR прогоните файл через Сжатие, текстовый слой сохранится.

Распознавание идёт на сервере?

Да, по защищённому HTTPS. Файл удаляется в течение 1 часа.