Ликбез

Как распознавать текст на картинках и как переводить его

17.04.2024 39859 Комментарии (81)

Современные средства машинного перевода настолько хороши, что позволяют очень быстро и качественно переводить любой скопированный пользователем текст. Однако нередко бывает так, что текст на каком-то сайте невозможно скопировать, потому что он представлен в виде графики, картинки. Сейчас не будем обсуждать, зачем это делают создатели сайтов - причины там могут быть самые разные, - но то, что подобное встречается, причем нередко - это неоспоримый факт.

И мне неоднократно в письмах пользователей, которые спрашивали совета по тому или иному поводу, попадались вопросы на эту тему: как получить текст с изображения в виде текста, с которым можно работать, ну и как более общей вопрос - как переводить текст с картинок, потому что чаще всего речь идет именно о переводе.

Давайте это рассмотрим в данной статье.

Задача перевода текста с картинки разбивается на три этапа.

Этап первый - создание скриншота текста с картинки, чтобы с ним можно было потом работать.

Этап второй - распознавание текста со скриншота.

Этап третий - перевод распознанного текста.

Создание скриншота с картинки

Скриншот обычно можно делать базовыми средствами операционной системы. В операционной системе Windows 11 (и нескольких предыдущих) есть встроенное средство создания скриншотов Snipping Tool ("Ножницы"), которое вызывается нажатием клавиши Print Screen (или Shift+Win+S).

При этом в самом верху экрана по центру появится вот такая панель с пиктограммами.

Первая пиктограмма - захват прямоугольного изображения. Выделяете мышкой прямоугольную область на экране, отпускаете левую кнопку - захваченная картинка появляется в приложении "Ножницы", где ее можно сохранить, отредактировать, загрузить в редактор Paint, скопировать в системный буфер и так далее.

Также в панели инструментов, вызываемой по кнопке Print Screen, можно вызвать подменю, в котором выбирается захват прямоугольника, активного окна, всего экрана или произвольной фигуры.

Для Windows, разумеется, также есть куча самых разнообразных приложений для захвата скриншотов, и я больше всего люблю приложение FastStone Capture, которое использую много лет.

На компьютерах Mac скриншоты также легко делаются с помощью комбинаций Shift+Cmd+3 (полный экран), Shift+Cmd+4 (область экрана) и так далее.

Распознавание текста

В случае с Windows в приложении "Ножницы" есть встроенная система распознавания текста. Если вы делаете скриншот с текстом и открываете его в приложении "Ножницы", то прямо там можно нажать соответствующую пиктограмму снизу, чтобы распознать текст и скопировать его в буфер.

Разумеется, это работает для самых разных языков.

Если у вас нет встроенной системы распознавания, то вы можете воспользоваться приложением для распознавания (английская аббревиатура - OCR, Optical Character Recognition) или каким-то онлайновым сервисом.

Пока в Windows не было встроенной системы распознавания, я использовал вот такой онлайновый сервис. Ему указывается скриншот, выбирается язык, выбирается выходной формат - он и распознает.

У бесплатной версии есть определенные ограничения на количество распознанных скриншотов (что-то там порядка 10), но обычно этого вполне хватает.

Для Mac мне хвалили программу распознавания OwlOCR.

Перевод текста

С переводом распознанного текста совсем все просто: копируете текст в Переводчик Гугла, Яндекс.Переводчик или DeepL - получаете перевод.

Однако если вы используете переводчик DeepL (а он, наверное, лучший из всего, что есть), то там есть очень интересная возможность создания скриншота с текстом, распознавания и перевода "в одном флаконе". По умолчанию такой перевод появляется по комбинации клавиш Ctrl+F8: вы выделяете прямоугольный блок с текстом на картинке, отпускаете левую кнопку мыши, после чего в окне DeepL появляется перевод. И это очень и очень удобно.

Единственное, о чем нужно предупредить: эта функция DeepL почему-то не справляется с кириллицей, распознает ее крайне криво. Со всеми остальными языками, поддерживаемыми DeepL, никаких проблем не было.

17.04.2024

Обсудить статью на форуме

Ликбез

Назад Вперед

Комментарии 81

Вот еще одна программа, которая позволяет делать со скринами все что душе угодно. В том числе и распознавать. Называется ShareX. Рекомендую.

siramand

06.05.24 09:56

0 0

Алекс, все намного проще.
addons.mozilla.org
Right click -> Send to Google Lens, там выбираем "переводчик".
И ВСЁ!!

dredkin

18.04.24 11:24

0 1

А в хроме и аддон не нужен.

Witalij

dredkin

18.04.24 15:57

0 2

На Самсунге - сфотал, нажал на глазик справа вверху, пальцем выделил (можно сразу всё), скопировать или перевести нажать.

zolotit

18.04.24 04:28

0 1

На пикселе примерно так же

Witalij

zolotit

18.04.24 15:56

0 0

Корейский Самсунг АИ понимает не очень...
А так-да.

SirWilderon

zolotit

25.04.24 22:47

0 0

Попробовал сделать все по инструкции - нажал на PrtSc и стал искать на экране меню. Не нашел. Хотел уже Алексу пожаловаться, но потом вспомнил, что удалил Ножницы сразу после инсталляции винды 😄

Monteckel

18.04.24 01:48

0 1

PrtSc и стал искать на экране меню.

Там в винде10 и 11 ножницы (сниппинг тул) - чуть другая подсистема.
Попробуйте нажать Win+Shift+S, либо включите в настройках клавиатуры вот эту настройку (я текст взял из приложухи именно этим способом):

Print Screen shortcut
Use the PrtScn button to open screen snipping
Based on other app settings, you might need to restart your PC to see this change.

phanex

Monteckel

18.04.24 09:20

0 0

Если речь о ПК, то есть способ даже проще в пару кликов при помощи Power Toys или ABBYY Screenshot Reader. Не надо никаких скриншотов - можно просто навести на любую область экрана и вуаля - распознанный текст в буфере.
Но способ описанный Алексом однозначно зачетный, учитывая что не требуется никаих сторонних приложений. Вообще красота. Спасибо за ликбез.

benderunit2000

17.04.24 21:35

0 1

В Windows 10 у меня по Win+Shift+S выплывает "Набросок на фрагмент экрана". Там нет возможности копировать текст.
Принудительно запустил "Ножницы", не нашёл там опцию распознавания текста.

Zhekator

17.04.24 19:52

0 0

Оно появилось с 11 версии. Так что вставь текст в гугль (нажав на фотоаппарат в строке поиска) и всё.

phanex

Zhekator

18.04.24 09:17

0 0

"Для Mac мне хвалили программу распознавания OwlOCR".
Спасибо за рекомендацию, Алекс! Установил, потестирую в ближайшие дни.

Рекорд Надоев

17.04.24 19:36

2 0

Скармливаю картинки/скриншоты в командной строке Tesseract֊у, отлично работает, доступен практически для любой операционной системы.

SergeyM

17.04.24 18:32

0 0

Перевожу через Google Lens, это удобнее всего. Но спасибо, интересно было узнать разные варианты, в том числе предложенные в комментариях.

4aldon

17.04.24 17:08

0 6

Самый простой способ распознания - это Google Lens.
Идём на главную страницу Google, жмём на линзу с поиском по картинке, либо кидаем файл, либо просто вставляем из клипборда, копируем распознанный текст. Не нужно ничего, кроме браузера.

phanex

17.04.24 16:08

0 3

Даже не нужно идти на главную страницу Google. Right-click по картинке или тексту веб страницы и потом "Search images with Google".

Chernomorec

phanex

17.04.24 18:05

0 4

Если картинка уже в браузере, то да. Но как раз такое мне нужно очень редко, чаще всего что-то из телеги, или из браузера, но где до картинки добираться через девелоперс тулс, сканы и так далее.

В данном способе ценна именно возможность вставки из буфера обмена, в который можно поместить откуда угодно, сделав скриншот области через win+shift+S, или просто включив настройку "выделять область при нажатии на принтскрин" (как сделал я)

phanex

Chernomorec

18.04.24 09:16

0 0

Для файрфокса есть специальный аддон, который добавляет меню по клику правой кнопкой, "Search on Google Lens".
Далее просто нажимаем "переводчик" - и вот он, переведенный текст.
Два клика.

dredkin

phanex

18.04.24 11:26

0 0

Ну, передать из браузера в линзу не проблема сотней способов.
Для меня самое ценное именно буфер обмена, так как картинку (если она не упрятана в, скажем канвас или в цсс, т.е. не кликабельна) могу что в хроме, что в Вивальди туда кинуть и так.

phanex

dredkin

18.04.24 19:06

0 0

По поводу комбинации клавиш для снятия скриншотов в Маке. Я работаю на Винде, а мак у меня домашний, и знаете, реально бесило, как легко снять скриншот части экрана в Винде (Shift+Win+S) и как нужно раскорячиться, чтобы сделать это на маке (Shift+Control+Command+4). Нашел интересный выход, поделюсь, может, кто не знает. На Маке можно переназначать шорткаты действий и как правило свободны клавиши F1 и F2. Я повесил на F1 снять скриншот части экрана в буфер обмена и F2 на скриншот части экрана в файл. Стало намного удобнее.

4aldon

17.04.24 14:51

0 0

как нужно раскорячиться, чтобы сделать это на маке (Shift+Control+Command+4)

Я использую сочетание Cmd+Shift+5, попробуйте и вы. Три клавиши вместо четырех, плюс дополнительные "плюшки".

Рекорд Надоев

4aldon

17.04.24 15:16

2 3

Спасибо, у меня теперь одна клавиша, удобнее. А старая комбинация - и ваша - не устраивала, потому что цифры далеко от функциональных клавиш и одной рукой не нажмёшь или сложно. Комбинация из винды Win+Shift+S - три клавиши, но они рядом и нажимаются без проблем, удобно. Да еще и открывается сразу в Snip, можно сразу отредактировать да и в файл сохранить.

4aldon

Рекорд Надоев

17.04.24 17:00

0 1

Cmd+Sh+4 от зубов отскакивает. Скриншот селектом.

Не работает у меня такое сочетание. Как правило, мне нужен скриншот части экрана и не в файл, а в буфер обмена, стандартное сочетание из 4 клавиш - Sh+Cmd+Ctrl+4. Это было очень неудобно. А теперь стало просто через F1. Иногда мне нужен скриншот в файл, это теперь я делаю простым нажатием F2.

4aldon

lvbnhbq1977

17.04.24 17:07

0 1

Есть ещё отличная программка Shottr. Есть бесплатная версия и платная. Заменяет родной граббер картинок, позволяет назначать любые шоркаты, есть свой встроенный простой редактор - позволяет убрать текст, либо замазать прямоугольником часть, сделать кроп, нарисовать стрелочки, линии, кружки, и автоматическая линейка вертикальная и горизонтальная, которая считает расстояние в пикселях между разными объектами (для веб разработчиков)

Dimonius

4aldon

17.04.24 21:31

0 2

Я использую сочетание Cmd+Shift+5, попробуйте и вы. Три клавиши вместо четырех, плюс дополнительные "плюшки".

Не понимаю тех, кто минусует ваш комментарий. Я об этом функционале не знал и очень благодарен за совет. Хотя мне конкретно для задачи просто снять скриншот части экрана функционал излишен, но на будущее запомню, действительно, похоже на виндовый интерфейс Snip, удобно сразу редактировать.

4aldon

Рекорд Надоев

18.04.24 09:26

0 1

Очень приятно, спасибо. Награда нашла героя, как говорится. А минусующих я знаю, это глубоко несчастные, одинокие люди.

Рекорд Надоев

4aldon

18.04.24 15:28

0 0

Тот же принцип, но можно сделать проще (если информация не конфиденциальная):
1. Копируем с помощью инструмента windows "Snipping Tool" участок изображения с текстом в буфер обмена.
2. Открываем Гугл и в правом верхнем углу страницы нажимаем "картинки" - важно: нажимать именно там, а не значок фотоаппарата в строке поиска (по крайней мере у меня только так работает).
3. Дальше, теперь уже, нажимаем значок фотоаппарата в строке поиска справа и вставляем изображение из буфера обмена "Ctrl+V".
Начинается поиск по картинке и под ней появляются три кнопки: поиск, текст - распознанный текст, и перевод - перевод распознанного текста .

Paspartu

17.04.24 14:39

0 3

Для распознавания пользуюсь ABBYY Screenshot Reader. Удобная штука, выделяешь область и сразу в буфер обмена распознанный текст. А потом хоть в гугл переводчик, хоть куда.

Silvester

17.04.24 13:33

0 2

Для распознавания пользуюсь ABBYY Screenshot Reader

Это платная программа?

Рекорд Надоев

Silvester

17.04.24 19:33

2 0

Несправедливо не упомянут встроенный в десктопный Chrome механизм "Search image with Google", который позволит это сделать в пару кликов без всяких скриншотов и других промежуточных действий.

subst

17.04.24 13:10

0 6

Несправедливо не упомянут встроенный в десктопный Chrome механизм "Search image with Google"

да, отлично работает, регулярно пользуюсь

Аляксандр

subst

17.04.24 14:01

1 3

На самом деле, для меня реально загадка, почему в хроме это приходится делать самому.
Ведь механизм перевод текста "на лету" уже есть, почему бы не добавить то же самое и для картинок? чтобы не надо было каждый раз кликать на каждой картинке и посылать её на гугл ленс.

dredkin

subst

18.04.24 12:15

0 0

Вчера делал задание по немецкому, аудирование, не сошёлся в ответах с учебником. Решил подключить нейросеть, заодно проверить как она работает с разными типами информации. Учебник в виде скана и не самого лучшего, закидываю аудиофайл, скрин страницы, прошу дать ответ по заданию и транскрипцию аудио. Всё просто идеально сделала, транскрипция без ошибок. Ответ, кстати, совпал с моим. Уровень B2, DeepL такой уровень уже не всегда корректно переводит. Новая сетка от Гугла, по-моему лучше ГПТ4 и бесплатная. И миллион токенов за раз переваривает, может по большой книге задания выполнять.

Hed-ge-Hog

17.04.24 13:02

0 0

Новая сетка от Гугла, по-моему лучше ГПТ4 и бесплатная.

Пожалуй, да. Попросила сгенерировать поздравление с теми же условиями, что и чат GPT, текст получился намного менее формальным и более человечным. И без видимых грамматических ошибок, в отличие от.

Suddenly

Hed-ge-Hog

18.04.24 07:41

0 0

В Яндекс.браузере(не знаю как в других) когда делаешь поиск по картинке - он не только находит схожие , но и сам распознает текст. Таким образом - не надо ничего копировать , сохранять - просто в браузере кликаешь правой кнопкой по картинке - сделать поиск и получаешь распознанный текст, очень удобно!

Alex_TAV1

17.04.24 12:54

0 0

Тут для распознавания мчится AI
g.co

rstrelba

17.04.24 12:35

0 0

У эпла все встроенное и на маках и на телефоне, распознается и на фотках и на картинках, даже никаких скриншотов делать не надо. Распознается, выделяется и копируется даже в окне быстрого просмотра по нажатию пробела на файле или объекте.

17.04.24 12:24

1 4

Не умеет в Грузинский. Google lens - умеет. Ходил с обоими 😄

vanburg

17.04.24 14:46

0 1

Я для перевода использую чатгпт. И текст, и картинки переводит гораздо лучше Гугла. Ещё и пояснения по переводу попросить можно.

Michael Selehov

17.04.24 12:21

0 0

чатгпт

Gemini пробовали?

Сэр Макс

Michael Selehov

18.04.24 08:12

0 0

Нет. Меня достаточно устраивает чатгпт, чтоб не тратить время на что-то другое 😄

Michael Selehov

Сэр Макс

18.04.24 09:27

0 0

На скриншоте с Гугловским переводчиком отчётливо видно кнопку "Изображения".
Посему, самый быстрый способ будет не возиться с Ножницами, а нажать Win+Shift+S или сделать принт-скрин и сразу из буфера влепить эту картинку в Гугл переводчик. Он всё разберёт и переведёт.

Youkora

17.04.24 11:54

0 3

А можно вставить картинку в гугл переводчик он и перевел и текст даст скопировать сразу.

Ilya__

17.04.24 11:45

0 5

Я такой старый, что для OCR до сих пор пользуюсь Файнридером

WolferR

17.04.24 11:19

0 2

Дорого

bblu

WolferR

17.04.24 12:44

0 0

У некоторых установлена бесплатная винда и бесплатный файнридер)

zolotit

bblu

17.04.24 13:31

0 2

Есть ещё прога такая бесплатная Crow Translate, в ней функция захвата и перевода встроена.

Dhwty

17.04.24 11:01

0 1

Идешь на гугл переводчик, добавляешь картинку, копируешь текст. Мультиплатформенно

PS картинку можно даже вставить из буфера обмена!

aka_mik

17.04.24 10:43

0 11

Google Object
Вполне справляется с небольшими кусками экрана и картинками. Мне пока хватает.
Плюс может сразу показать, где похожий текст или картинка встречается.
Плюс сам опознает исходный язык.

Red Actor

17.04.24 10:34

0 1

На iOS все встроенное. Даже системный поиск может найти текст на фотке, про которую вы уже забыли

bblu

17.04.24 10:28

1 5

в macOS (по крайней мере в Sonoma) распознавание текста работает "из коробки", в Preview открываешь картинку, выделяешь и просто копируешь текст.

Alex76

17.04.24 10:03

0 6

в Preview открываешь картинку, выделяешь и просто копируешь текст.

Да, и в Quick Look (по нажатию пробела) это тоже можно делать.

Рекорд Надоев

Alex76

17.04.24 14:16

2 2

Можно также установить приложение DeepL для Windows.
И в нём сразу отмечать область экрана и переводить текст в ней.

Michaell

17.04.24 09:51

0 1

Оффтоп Какой многообещающий заголовок. Я аж встрепенулся.
Владимир Путин получил свое
16 апреля президент России Владимир Путин принял в Кремле главу Центризбиркома Эллу Памфилову для вручения удостоверения президента России.Коммерсантъ

kardamon2007

17.04.24 09:40

7 2

для вручения удостоверения президента России

Выходит, Памфилова - новый президент РФ? Ведь у нее теперь есть соответствующее удостоверение. 😄

Рекорд Надоев

kardamon2007

17.04.24 14:17

2 1

Я имел в виду "Получил своё!

kardamon2007

Рекорд Надоев

18.04.24 11:37

0 0

У меня беда - на офисном компе не работает Print Screen, как и иное сочетание клавиш. (

Астронафт

17.04.24 09:36

0 0

Тогда только запустить Snipping Tool через кнопку "Пуск" и держать его открытым )

Akhmad

Астронафт

17.04.24 10:28

0 0

Смартфон с Google Lens сделает это быстрее. Ну, если не предполагается дальнейшей работы с распознанным и переведенным текстом на том компе...

Джутовый Мешок

17.04.24 09:25

1 4

Пользуюсь аналогичными средствами под Андроидом, ибо требуется в основном на мобильных устройствах за пределами офиса/дома.
Win в этом случае малоактуален, под ним для этого есть ABBYY FineReader 12.

Сэр Макс

17.04.24 09:25

0 0

По моему актуальная версия finereader 15 или 16.

Vovka__

Сэр Макс

17.04.24 09:36

0 1

актуальная версия finereader 15 или 16.

У меня лицензионка, не вижу смысла менять.

Сэр Макс

Vovka__

17.04.24 11:02

0 0

Смысл только в том, что свежие версии распознают НАМНОГО более качественно.
PS Да, последняя версия - 16я.

Vovka__

Сэр Макс

17.04.24 14:28

0 0

свежие версии распознают НАМНОГО более качественно

Меня и текущая полностью устраивает, ошибок распознавания не наблюдаю.
Но передам инфу своему сисадмину 😄

Сэр Макс

Vovka__

18.04.24 08:15

0 0

А как бы в Win10 включить, чтоб по PrintScrn ножницы открывались автоматически, а не просто в буфер скриншот копировался? А то к сочетанию Shift+win+s я никогда привыкнуть не смогу.
Ну и распознания по картинке в приложении ножниц в Win10 похоже нету((.

Lepkovskiy

17.04.24 09:24

0 3

В самом приложении ножниц была соответствующая опция

LbICbIY

Lepkovskiy

18.04.24 22:44

0 0

В случае с Windows в приложении "Ножницы" есть встроенная система распознавания текста.

В Windows 10 не наблюдаю. Может только в 11 добавили? Или что-то обновить надо?

FatherYan

17.04.24 09:23

0 6

Не видел ножниц отдельно, но есть более удобная тулза из пакета powertoys learn.microsoft.com
Нажимаешь комбинацию клавиш Win+Shift+T, выделяешь текст на картинке и получаешь в буфере распознанный результат.

roman.maschak

FatherYan

17.04.24 09:35

0 9

Поставил. Работает. Спасибо огромное.
Если кому еще надо, инструкция по установке пакета тут: learn.microsoft.com

FatherYan

roman.maschak

17.04.24 09:58

0 0

что-то на кириллице хромает оно ...
вот что получилось из вашего поста

He Bhaen HOXHHU OTaenbHO, HO eCTb 60nee ya06Hag Tynga "3 naKeTa powertoys
learn.microsoft.com
HaXhMae1Llb KOM6HHaLU4}O KnaBVIU.J Win+Shift+T, Bblnenqelllb TeKCT Ha KaPTV•1HKe 91 nonyqaeLLlb B
6y$epe pacn03HaHHblV1 pegynbTaT.
roman.maschak
FatherYan 17.0424 09:35

Alberto

roman.maschak

17.04.24 10:09

2 2

Как говорится, если что-то не получается, то RTFM.

Supported languages
Text Extractor can only recognize languages that have the OCR language pack installed.

Поставьте нужный языковый пакет и должно сработать.

jbroid

Alberto

17.04.24 11:39

0 4

честно говоря , я тупо пользуюсь смартфоном
просто включаю пекреводчик и навожу нв экран
но это для бытового использования

saveli

17.04.24 09:21

0 11

А как потом этот текст на компьютере получить? Через Избранное в Телеге пересылать, или через почту сам себе? Какие-то костыли же.

Lepkovskiy

saveli

17.04.24 09:48

3 0

На macOS + iPhone общий буфер обмена. Контролцэ на телефоне, контролвэ на компьютере.
Наверняка на Android + Windows такого добра навалом, так как системы более открытые.

bblu

Lepkovskiy

17.04.24 10:26

0 2

Если на телефоне клава стоит от MS - SwiftKey, на ней можно включить общий с компом буфер обмена. Правда, у меня не работало 😄 Только между мобильными смог настроить.

Dhwty

Lepkovskiy

17.04.24 11:04

0 1

этот текст на компьютере получить

легко.
А вот как на компе с Win без сканера сделать фото реального изображения для захвата/извлечения/перевода текста...