Скопировать текст с картинки

Мгновенное извлечение текста из изображений: 4 простых рецепта

Сколько раз вы бывали в ситуации, когда нужно извлечь из картинки несколько строк, а перепечатывать от руки лень? Глупая ситуация: ведь ставить ради такого полноценный пакет распознавания текста — слишком накладно и по времени, и по деньгам. Приятная новость в том, что теперь это и не нужно. Интернет и мобильные устройства рады предложить массу решений, которые справятся на раз, потребовав минимум времени на подготовку. Впрочем, учитывая глубину задачи, будет полезно знать о ней чуть больше, чем знает средний пользователь. Поэтому давайте сегодня пройдёмся по её основным пунктам.
Начать стоит с парадоксальности. Распознавание текста на изображениях — одна из тех вечных тем, которые всегда актуальны, всегда развиваются и, к сожалению, никогда не доведены до конца. Каждые пять лет можно писать новый обзор продуктов — и всякий раз демонстрировать новые направления, в которых исследователи и разработчики продвинулись, но так и не завершили начатое.
Что мешает? А дело в том, что символы на бумаге, напечатанные даже самым качественным типографским аппаратом, а тем более написанные рукой, с точки зрения компьютера — всегда нечто размытое, нечёткое, непонятное! Компьютер ведь воспринимает мир не как мы (образами!), а ноликами и единичками. И каждый символ для него — такой набор ноликов и единичек, светлых и тёмных точек, которые необходимо сравнить с эталонным алфавитом и выбрать наиболее похожий знак. То есть, распознать.

Так что хоть занимаются этим исследователи уже буквально половину столетия, успехи так себе: точность распознавания даже печатного текста по-прежнему варьируется где-то от 80% и выше, сильно завися от качества исходной фотографии, уровня контраста, разрешения (количества точек в снимке) и других факторов. Для текстов, написанных от руки, всё ещё хуже (там приходится прибегать к предварительному обучению «распознавалки»), но об этом чуть позже.
Ещё, распознавая текст с отсканированного листа или фотографии, стоит сразу отказаться от мысли, что удастся сохранить стиль документа. Тип шрифта, размещение слов на странице, таблицы, выравнивание и прочее скорее всего собьются или потеряются. К счастью, даже в таком виде автоматическое распознавание всё-таки приносит достаточно пользы, чтобы его применять: ведь оно избавляет от необходимости перепечатывать текст от руки. Поэтому давайте рассмотрим четыре типовых случая из жизни и рецепты для них. Итак, что делать, если у вас на руках картинка, в которую впечатан текст?

1 Самый простой и быстрый способ: отдать её на растерзание автоматическому распознавателю, встроенному в сервисы Google. Для этого вам потребуется аккаунт в Google (если у вас Android-смартфон, такой аккаунт у вас уже есть) и облачный накопитель Google Drive.
Загружайте картинку на Google Drive (drive.google.com), щёлкайте по ней правой кнопкой мыши и командуйте «Открыть с помощью -> Google Документы». Это всё, что нужно: графический файл автоматически будет преобразован в текстовый. Быстро, сравнительно качественно и с поддержкой десятков языков. Но что делать, если текст не в изображении, а, скажем, написан на доске, напечатан на бумажном чеке, квитанции?

2 Тут пригодятся мобильные приложения, превращающие смартфон сразу и в сканер, и в распознаватель текста. Их буквально море, от титулованных (вроде MS Office Lens и ABBYY FineScanner) до десятков малоизвестных разработок. Чтобы их найти, просто выполните в вашем магазине приложений поиск по слову «OCR» (это английская аббревиатура, означающая «Оптическое Распознавание Символов»).
Вероятно, приложению понадобится доступ в интернет, возможно, самые мощные из них будут не бесплатны, либо станут требовать оплату за каждый распознанный лист. Но в общем и целом нужно признать, что смартфон идеально приспособлен для этой задачи — ведь у него есть всё необходимое: фотокамера, мощный процессор и интернет-соединение. Особенно для коротких текстов это точно лучшее решение.
Позаботьтесь об освещении и постарайтесь, чтобы картинка занимала всю площадь экрана, причём без «зума» (тогда качество распознавания будет наивысшим).

3 Если же текста много, лучше применить специализированные веб-сервисы — которые, по сути, не что иное как программы распознавания текста, выведенные в интернет. Самые «умные» из них ограничивают бесплатный функционал — как, к примеру, всё тот же ABBYY FineReader Online, позволяющий распознать лишь 10 бесплатных страниц в месяц. Но на каждый такой сервис найдётся несколько абсолютно бесплатных аналогов, позволяющих распознавать сколько угодно страниц: это Free-OCR.com, NewOCR.com, i2OCR.com, OnlineOCR.net и многие другие (их легко найти через любой поисковик, запросив «бесплатный OCR онлайн».
Единственное, о чём следует помнить, пользуясь подобными сервисами (как и приложениями из предыдущего пункта, впрочем), что если его владелец не принадлежит к списку заслуживающих доверия компаний, не стоит скармливать ему конфиденциальные документы. Утечка, конечно, не гарантирована, но, знаете сами, бережёного бог бережёт.

4 Наконец, самый тяжёлый случай — это рукописный текст. Простые онлайновые «распознавалки» его читать не умеют. Приложения пытаются (в частности, упоминавшееся выше MS Office Lens), но похвастаться особыми успехами не могут. Необходимы хитрые алгоритмы, основанные на искусственном интеллекте и самообучении. Исследователи периодически рапортуют об успехах, но до стадии продуктов они никак не дойдут.
Поэтому, если у вас есть написанный от руки текст, который необходимо преобразовать в цифровой вид, придётся воспользоваться полноценным программным пакетом, вроде уже знакомого ABBYY FineReader. И даже здесь предварительно нужно будет произвести обучение программы, показав ей, как автор данного текста пишет отдельные буквы.
К сожалению, даже после этого качество распознавания не гарантировано. Если текст написан твёрдой рукой, да ещё и буквы раздельно, тогда может получиться. В других случаях скорее всего «распознавалка» наделает столько ошибок, что вы устанете их исправлять. Поэтому если ваш текст написан, простите, в стиле «курица лапой», проще и быстрей будет перепечатать его руки. Увы, компьютеры пока недостаточно умны для такой простой задачи!

P.S. В статье использована графическая работа FontFont.

Если вам понравилась статья — порекомендуйте ее своим друзьям, знакомым или коллегам, имеющим отношение к муниципальной или государственной службе. Нам кажется, что им это будет и полезно, и приятно.
При перепечатке материалов обязательна ссылка на первоисточник.

Сервис Onlineocr.net

Если ваш фотоаппарат находится у вас под рукой, то всё будет намного проще и быстрее. Ускорить рутинную, нудную работу позволит фотоаппарат и специальный бесплатный сервис onlineocr.net.

Если вы ещё не переносили фото с фотоаппарата на компьютер, то обязательно сделайте это. Затем вам надо зайти на onlineocr. На данный сервис закачиваете своё изображение. Формат при этом не имеет абсолютно никакого значения. Вы можете загружать в форматах JPG, PNG, PCX, TIFF и т.д.

Также обязательно выберете язык текста, находящегося на изображении.

Определитесь с форматом, который вам наиболее удобен:

  1. xls, открывающийся с помощью программы Microsoft Excel;
  2. doc, для открытия которого используется Microsoft Word;
  3. txt, который открывается при помощи блокнота.

И нажмите кнопку «Convert».

Сервис быстро сканирует ваше изображение и выдаёт вам чистый текст, не содержащий присутствовавших на изображении лишних деталей. Затем его можно скопировать и вставить в любой документ или скачать, как отдельный файл.

На качество текста, который вы получите после сканирования, влияет одно важное условие. Будучи размещёнными на фотографии, буквы должны быть четко прописанными, то есть не содержать декоративных закруглений, не переходить по контуру в размытие, не сливаться с общим фоном и прочее.

Проще говоря, картинка должна быть очень чёткой. Слова написаны чёрным цветом на светлом либо белом фоне. Они должны быть достаточно хорошо различимыми, чтобы их распознавание сканером не вызвало проблем. Только в этом случае удастся получить текст без ошибок.

Удаляем текст с фото или картинки

Делается это в программе PhotoShop. Если на вашем ПК этот программный продукт не установлен, тогда первым делом исправьте эту ситуацию (пакет для установки можно скачать в Интернете).

После того, как программа будет установлена, зайдите в нее и в меню «Файл» — «Открыть» выберете интересующее вас изображение. Когда картинка загрузиться, активируйте инструмент «Лассо» (в левой части экрана) и обведите все слова, которые вы бы хотели убрать с фото.

Кроме лассо подойдет любой другой выделяющий инструмент. Всё зависит от конкретной ситуации

Далее кликните «Редактировать» и в появившемся списке выберете пункт «Выполнить заливку». В меню «Использовать», необходимо выбрать пункт «С учетом содержимого». Нажмите «Ок».

Важно! Параметр «с учетом содержимого» подойдет не всегда. Чтобы получить желаемый результат, придется немного поэкспериментировать. Благо, любые изменения легко отменить нажатием клавиш Ctrl+Z.

После того, как программа выполнит ваше требование, нажмите комбинацию клавиш CTRL+D для того, чтобы снять выделение. Все, можно сохранять!

Если вы хотите стать уверенным пользователем фотошопа, то рекомендую изучить курс «Photoshop от А до Я».

Вот как просто всё делается! Как видите никакой «премудрости» здесь нет. Надо просто иметь доступ в сеть интернет или установленную на ПК специальную программу и чётко следовать инструкциям.

Желаю удачи! Не забудьте подписаться на обновления блога и поделиться прочтенным материалом с друзьями в соц. сетях. До встречи!

C уважением! Абдуллин Руслан

Онлайн сервис OCR

Вы, конечно, можете вручную набрать материал, но что если текст очень длинный? В этой ситуации, мы обращаемся за помощью к сервису ОСR — сайт http://www.onlineocr.net. ОСR (происходит от английского названия: оптическое распознавание символов) – это набор методов или программного обеспечения для распознавания знаков и полных текстов в графических файлах в форме растра.

Для примера давайте скопируем текст из моей последней статьи. Я сделал скриншот поста нс главной странице. Вот он:

  1. Загружаем его в сервис OCR, нажав на кнопочку «Select file» и выбираем путь к данному файлу.
  2. Выбираем язык на котором написано на выбранном изображении. В моем случае «Russian».
  3. Выбираем тип файла, в который сохранится запись – Microsoft Word (docx). Всего доступно три типа файлов: word, exel и обычный txt.
  4. Далее вводим CAPCHA и нажимаем кнопочку «CONVERT».

Ждем некоторое время, пока сервис обработает наш файл и ВУАЛЯ, все скопировано вплоть до «улыбок». ))

Далее весть текст можно скачать в виде текстового word файла к себе на компьютер, нажав на ссылку «Download Output File».

Идем далее.

Инструмент OCR онлайн

Другим способом копировать и редактировать надписи на фото и графических картинках можно с использованием онлайн-инструментов. Одним из таких инструментов является: http://newocr.com.

Использовать инструмент очень легко, просто выберите файл изображения, выберите язык документа и загрузите изображение. После загрузки изображения, нажмите кнопку «OCR», и программа начинает конвертировать загруженное изображение.

Преобразованный текс, данным сервисом не слишком совершенен. Программа иногда теряет некоторые символы и нечеткие изображения букв. К счастью, она указывает на эти ошибки, и вы можете быстро все исправить.

После проверки орфографии, остается только скопировать и сохранить полученный документ. Этот инструмент дает возможность, помимо всего прочего переводить машинопись с помощью Google Translator. Когда статья готова, можно сохранить ее как PDF, TXT или DOC.

Честно сказать, данный сервис мне не очень понравился из-за наличия мешающейся рекламы + еще при конвертации страница перезагружается и вообще дизайн какой-то шаблонный и некрасивый. Но на все найдутся свои покупатели…)))

Копирование и вставка текста на современных мобильных гаджетах

В системе Windows, Андроид и IOS на современных смартфонах iPhone или Android, вы можете скопировать в основном произвольные фрагменты надписи и вставить их почти во все места, где можно вводить текст, экономя для себя, благодаря этой функции, много времени.

Скопировать адрес электронной почты и вставить его в качестве пункта назначения на карте. Скопировать рецепт с веб-сайта, вставить его в текстовое сообщение и отправить другу. Скопировать пункт из документа, Word Mobile Office и вставить его в сообщение электронной почты боссу.)))

Есть два способа копирования текста: выбор его или навигация по меню. После копирования в телефон, можно вставлять текст в любые другие места, любое количество раз.

Можно скопировать и вставить также отсканированную информацию с помощью функции Bing Vision в телефоне.

Дорогие читатели, на этом обзор инструментов распознавания текста закончен. Была рад поделиться с вами знаниями. В статье представлены лишь некоторые инструменты, такие как OCR, которые могут быть для вас очень полезны. Если вам известны, какие — то другие, проверенные средства этого типа, приглашаю вас поделиться ими в комментариях к статье.

С уважением, Роман Чуешов

Как скопировать текст с картинки

  • 15.03.2017
  • Просмотров: 16761

В этой заметке расскажу как скопировать текст с картинки с помощью онлайн сервиса. Называется этот сервис OCR (Optical Character Recognition), что в переводе означает «Оптическое Распознавание Символов». Данный сервис поддерживает 46 языков, включая китайский, японский и корейский.

Сканер OCR позволяет распознать и извлечь текст из PDF-файлов, а также изображений форматов jpg, bmp, tiff, gif, и конвертировать их в редактируемые форматы word, excel и txt. Но хватит слов, давайте перейдем к действиям и откроем сайт http://www.onlineocr.net/.

На первом шаге необходимо выбрать файл, с которым будем работать через кнопку «Select file…». В моем примере это картинка как на скриншоте ниже.

Далее из выпадающего списка выбираем язык текст, который размещен на изображении, и формат выходного файла.

На последнем шаге вводим цифры с картинки и нажимаем кнопку «Convert».

На выходе мы получаем текст, который можно скопировать и использовать в своих целях, а также ссылку на скачивание файла с текстом, который мы выбирали на втором шаге.

Это замечательный сервис, который позволяет распознать текст с картинки или pdf файла, не прибегая к установке дополнительных программ. Но как и у других подобных инструментов у него есть ряд недостатков. Во-первых, текст распознается не всегда так как надо и приходится его полностью перепроверять, исправляя ошибки. Во-вторых, текст на картинке должен быть написан ровно, потому что если буквы будут написаны под углом, хорошего результата ждать не стоит.

Не забудьте поделиться ссылкой на статью ⇒

В интернете достаточно большое количество сервисов, которые позволяют объединить несколько PDF файлов в один, но большинство из них имеет свои недостатки. Какие-то сервисы имеют ограничения на размер загружаемых файлов, а другие и вовсе делают это криво. Поэтому сегодня разберем сервис SmallPDF, который делает это максимально правильно.

  • 25.06.2017
  • Просмотров: 1344
  • PDF

Недавно я задался вопросом, как можно ускорить работу сайта, чтобы статьи на сайте грузились быстрее. Один из моментов оптимизации скорости работы любого сайта — это уменьшение веса изображений. Вот как раз сегодня попытаемся разобраться как можно решить этот вопрос в режиме онлайн.

  • 30.03.2018
  • Просмотров: 2554

В этом уроке расскажу как открыть заблокированный сайт с помощью браузера Опера и его опции Турбо. Вся особенность работы Опера Турбо в том, что страница передается не напрямую, а через зарубежные серверы. На них она оптимизируется, обрабатывается и возвращается обратно в ваш браузер в другом, измененном виде. По сути на сайт заходит иностранный сервер, а так как сайт заблокирован только для русских серверов, то он без проблем получает к нему доступ.

  • 31.08.2015
  • Просмотров: 6752
  • Видеоурок

В этом уроке расскажу об интересном сервисе DropMeFiles и о том как передать большой файл через интернет. DropMeFiles — это бесплатный сервис, с помощью которого можно мгновенно передавать файлы через интернет.

  • 29.11.2015
  • Просмотров: 4249

Сегодня расскажу как открыть заблокированный сайты через анонимайзеры. Еще их называют web-прокси. Анонимайзеры — специальные сайты, которые работают как прокси-серверы, позволяя зайти через них на сайты под видом пользователей из других стран. Таким образом мы скрываем свое реальное расположение.

  • 23.09.2015
  • Просмотров: 10081
  • Видеоурок

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *