Как распознать текст и конвертировать в Word
В сегодняшнем видеоуроке я расскажу как распознать текст и конвертировать в Word с помощью бесплатной программы CuneiForm. В конце поста вы сможете скачать CuneiForm бесплатно...
После публикации поста PDF-Viewer vs Adobe Reader и Foxit Reader в комментариях появились вопросы о том, как редактировать сам текст документа, так как PDF-Viewer позволяет что-то вписывать в pdf документы, ставить штампы, заметки, но сам текст документа не изменяет...
Поэтому я пообещал, что сделаю видеоурок о программе распознавания текста, что и делаю сегодня!
Итак, вперед!
Как распознать текст и конвертировать в Word
Если вы зададите поисковику найти «pdf в текст», "как распознать текст", "конвертировать в word", "перевести в ворд", "распознавание текста со скана" или "скан в текст", то найдете, в основном, только платные программы!
А в самом верху списка, конечно же будет ABBYY FineReader!
Действительно ABBYY FineReader — лидер среди программ распознавателей текста! Но его единственный недостаток — платность! Например, ABBYY FineReader 11 Professional Edition стоит 3590 р! ABBYY FineReader 10 Home Edition — 1340 р.
Вроде и недорого, но если мне раз в месяц нужно распознать документ, то нет смысла тратиться!
Хотя у меня есть бесплатная 6-я версия ABBYY FineReader! Она шла в программном обеспечении моего принтера EPSON. Но в лицензии написано, что я не имею права передавать ее кому-либо, более одного раза!
Можно, конечно, найти и пиратскую версию! Точнее взломанный FineReader с кряком или кейгеном или патчем, но это уже уголовное преступление!
Лучше все-таки распознать текст с CuneiForm
Поэтому, хорошо поискав, я нашел совершенно бесплатную программу для распознавания текста и конвертирования в Word - CuneiForm!
CuneiForm, по качеству распознавания текста, ничем не уступает ABBYY FineReader! Единственный недостаток - CuneiForm не конвертирует pdf в текст! Она делает распознавание текста со скана или фото!
Я в видеоуроке это не упомянул, но даже не обязательно сканировать документ! Можно воспользоваться программой для снятия скринов FSCapture! О том, как с ней работать, посмотрите видеоурок здесь...
Делаете скрин документа, сохраняете в JPG и распознаете в CuneiForm! Все очень просто! Кстати, FSCapture — очень полезная программа не только для снятия скринов! Очень рекомендую освоить!
Но, вернемся к CuneiForm!
Пользоваться программой очень легко! Перевести в Word текст можно всего одной кнопкой! Все делается пости на автопилоте! Уверен, что вы разберетесь даже без видеоурока! 🙂
Но все же можете посмотреть! И, если нужно скачать урок себе на компьютер, то здесь можете посмотреть, как это сделать!
Скачать CuneiForm, программу распознавания текста, можно здесь...
Теперь, собственно видеоурок —
Хорошая програмка, правда в последнее время очень редко пользуюсь. 🙂
Ответить
Сергей, спосибо за этот и другие уроки и информацию. Мне нравится что вы всё обьясняете точно и без лишних слов. У вас талант к видео-консультациям, в отличие от других людей, занимаюшихся этим же. Ещё раз спосибо.
Ответить
Сергей Медведев Отвечает:
Пожалуйста! 🙂
Ответить
FineReader давно пользуюсь, а вот про CuneiForm не слышал, надо попробовать, все хотел такую бесплатную прогу найти да руки не доходили. Спасибо за информацию.
Ответить
Сергей Медведев Отвечает:
Попробуйте...
Ответить
Спасибо вам огромнейшее! Для меня как для переводчика это просто необходимый инструмент!
Ответить
Сергей Медведев Отвечает:
Пожалуйста, Ольга! 🙂
Ответить
Добрый день!
Может не внимательно перечитал все тут, но не понимаю насчет конвертации текста из PDF в Ворд.
Зачем дополнительные программы???
Лично я перевожу текст из PDF в Ворд непосредственно в самой программе PDF Viewer.
Инструменты--->Основные--->Выделение ...и ВСЕ!!!! да-да ВСЕ!!! копируете как текст и вставляете в ВОРДЕ...ВСЕ!!!
Надеюсь помог кому-то советом...
Юрий KENIG39
Ответить
Сергей Медведев Отвечает:
Странно Юрий, что у вас так получается...
Дело в том, что документ PDF имеет совсем другую кодировку, нежели Ворд! Поэтому после копирования из PDF Viewer и вставки в Ворд, ничего, кроме непонятных символов не получится.
Может вы знаете, какой-то секрет, который меняет кодировку? Поделитесь!
Ответить
Юрий Отвечает:
Никакого секрета...странно...у моих коллег тоже все работает...
Проверил только что и для Open Office и для Word... все работает и никаких абракадабра...
Единственное может быть то что у меня программа PDF-XChange Viewer...
Может народ тут пусть попробует и отпишется...
Ответить
Сергей Медведев Отвечает:
У меня тоже PDF-XChange Viewer!
Ответить
George Отвечает:
@Юрий, Я тоже самое проделываю в SDTU Viever 😛
Ответить
кажется теперь все ясно...для Word 2007 не хочет...у меня 2003
Ответить
Сергей Медведев Отвечает:
К сожалению у меня нет 2003 поэтому ничего не могу сказать...
Может кто откликнется, кто пользуется!
Ответить
Теперь относительно изменений шрифта текста или вставки своего текста в существующий или требуется заменить часть текста на свой. Где-то тут Вы писали что этого сделать нельзя...МОЖНО...PDF-XChange Viewer это позволяет, однако требуется приложить несколько усилий.
Пример: требуется вставить свой текст в существующий, причем например подогнать его например по высоте 18 и шрифту Arial.
Я делаю так: печатная машинка-набираю текст на поле страницы в любом месте-выделяю его-в меню вверху где иконки выбираю нужный мне шрифт, высоту, курсив и много еще чего — далее необходимо курсор кликнуть на любое пустое место, НО ТОЛЬКО НЕ ENTER, иначе удалите только что набранный вами текст-ВСЕ-осталось только перенести его по полю к требуемому тексту (кликнув на набранный только что текст).
Другой пример: требуется заменить несколько строчек текста и вставить свой, другими словами, наложить свой текст поверх существующего.
Я делаю так: прямоугольник (обязательно настраиваем цвет заливки и цвет линии -БЕЛЫЙ) ---далее накладываем этот прямоугольник на текст, который надо убрать (другими словами — мы скрываем текст, т.е. его закрашиваем белым прямоугольником) — а дальше вставляем любой текст как я писал в первом примере, естественно подогнав по размеру и шрифту.
По долгу профессии приходится много работать с программой PDF-XChange Viewer. Если есть вопросы--как говорится чем могу...пишите. Спасибо за внимание.
Ответить
Сергей Медведев Отвечает:
Спасибо Юрий, это ценная информация!
Просто я под заменой обычно понимаю именно замену! А наложение, конечно можно сделать, хоть и несколько геморройно! 🙂
Я, когда ИП оформлял помучился исправляя некоторые ошибки! Да, если подправить нужно немного, то можно помучиться, а вот есть солидно, то лучше уж конвертировать в Ворд!
Я рад, что вы помогаете некоторым читателям, которым не смог помочь я! Будем обращаться за советом!
Ответить
А где скачать бесплатно?
Ответить
Сергей Медведев Отвечает:
Что скачать бесплатно?
Ответить
При запуске через сканирование пишет:"Не могу записать документ".В чем может быть проблема?
Ответить
Сергей Медведев Отвечает:
Возможно в защищенности документа...
Ответить
Спасибо за информацию!
Бесплатно скачала программу CuneiForm!
Отличная программа, после нескольких попыток сканирования документа (начала с цветного фото в разрешении 300 DPI, закончила в черно-белом варианте в разрешении 600 DPI), в конечном итоге при переводе фото в WORD получилось все отлично. Текст читаем!!! Все супер!
Ответить
Сергей Медведев Отвечает:
@Виктория, пожалуйста! 🙂
Ответить
Здравствуйте,а у меня ничего совсем не получается 🙁 В распознаном тексте выдаёт несколько закорючек и всё. Другой вопрос,Word д/б установлен обязательно для этой программы? Он у меня установлен,но я пользуюсь OpenOffice,он совсем не при делах?
Ответить
Сергей Медведев Отвечает:
В OpenOffice и будут закорючки! программа работает только с Word...
Ответить
Александра Отвечает:
@Сергей Медведев, Понятно, спасибо.Ещё вопрос,справку к программе читала, но не нашла, она только jpeg распознаёт, или картинки других форматов тоже может?
Ответить
Сергей Медведев Отвечает:
А вы попробуйте, Александра! 🙂
Ответить
Марк Отвечает:
@Сергей Медведев, Здравствуйте!
Такой вопрос. У меня текст в виде картинки в формате PDF. Т.е. отсканированный текст книги, но созранён в виде картинки в pdf.
Что делать, как распознать?
Буду очень благодарен
Ответить
Ваша программа стала спасенем для меня! Спасибо огромное!
Ответить
Сергей Медведев Отвечает:
Пожалуйста! Заходите еще! 🙂
Ответить
Здравствуйте! Сергей, подскажите пожалуйста, возможно через эту программу перевести рисунок в редактируемый документ?
Ответить
Сергей Медведев Отвечает:
Если под рисунком вы подразумеваете текст, то да...
Ответить
Пробовал .Есть документы на диске.Скопированы в формате пдф.Никак не воткнуть их в программу.
Ответить
Сергей Медведев Отвечает:
Не понял, что вы пробовали?
Ответить
Перевести в Ворд.А в программу не воткнуть файлы.
Ответить
Всё уже придумано за нас! По ссылке находится он-лайн конвертер Pdf в Doc, просто выбираете файл в формате Pdf со своего компьютера и через несколько секунд автоматически скачивается распознанный файл в формате doc (MS Word 97-2003): go4convert.com/ToDoc_Ru
Ответить
Неподарок Отвечает:
Спасибо тебе, мил человек,выручил. Сидела третий час уже,пока не перешла по волшебной ссыли
Ответить
Здравствуйте, Сергей.
Не получается сконвертировать текст. Как можно отправить Вам скрин?
Ответить
Спасибо за своет долго искал бесплатную версию для распознавания. Программка супер!!!
Ответить
Здравствуйте. Я тоже хочу такую программу 😉 . НО... У меня MacBook. Программу скачиваю, а она не открывается... Можно как-то выйти из такого положения? Заранее благодарна
Ответить
Сергей Медведев Отвечает:
Здравствуйте Елена!
К сожалению, выйти их этого положения можно только одним путем — найти программу для вашей операционной системы. Наверняка они есть, поищите! 🙂
Ответить
Здравствуйте, Сергей! скажите пожалуйста, почему когда я скачиваю программу по вашей ссылке, она сохраняется в блокноте, а когда ее открываешь, там закорючки(( что делать?(
Ответить
Сергей Медведев Отвечает:
Вообще-то программа должна открываться, как программа, а не в блокноте...
Ответить
Крис Отвечает:
Да я понимаю... Но что мне в данной ситуации делать? Почему так происходит? может нужна(или наоборот мешает) какая-то другая программа на компьютере? Посоветуйте пожалуйста что-нибудь, я уже несколько дней мучаюсь...
Ответить
Сергей Медведев Отвечает:
Понимаете, я вам даже подсказать ничего не могу. Я же не вижу, что вы делаете и что у вас там происходит на компьютере...
Попробовал бы помочь, но как? 🙂
Ответить
так, у меня все закачалось, но теперь при после распознавания текста (со скрина) выдает закорючки 😕
Ответить
Сергей Медведев Отвечает:
Вот это уже другое дело! 🙂
Обычно такое бывает, если система не русскоязычная, либо кодировка в системе неправильная...
Ответить
Здравствуйте! у меня Word 2007. Скачала вашу программу, распаковала архив, установила, а потом долго искала, почему-то нет конкретного значка на рабочем столе для простого запуска, нужный,как мне кажется, файл (ехе) нашла где-то в локальном диске, в программных файлах, открыла, все сделала, как учили, но конвертирует более, чем не корректно: кусками и закорючками. что я сделала не так: скачала, установила или открываю не тем местом???
Ответить
Сергей Медведев Отвечает:
Трудно сказать, Елена. Я ведь не вижу, что у вас там происходит и не видел, что вы делали...
Ответить
Спасибо Вам огромное!Программа замечательная и простая в обращении.
Помогла избежать зачета))
Ответить
Сергей Медведев Отвечает:
Пожалуйста, Дарья! Но не стоит избегать зачетов! 🙂
Ответить