Под этим термином подразумевается перенос данных, содержащихся в исходном файле в полноценный, редактируемый текст Word. Под привычным названием Word подразумеваем любой идентичный ему редактор, например, бесплатный Writer от Libre Offiсe. Конвертация из Word в PDF как правило понятна. Эта функция встроена в текстовые редакторы и не вызывает нареканий. Перевести же файл из PDF в Word бывает практически невозможно.
С конвертацией «простых
» файлов PDF, данные которых полностью состоят из текста, как правило ничего сложного. Примером такого файла может быть PDF, созданный из текстовых данных, непосредственно в редакторе типа Word.
Вот несколько вариантов конвертирования, первые два способа применимы offline
:
Третий — отличный способ online конвертирования:
А вот как перевести «сложный» , состоящий из комбинированных данных файл PDF в Word ? Такие файлы встречаются не редко. И именно с ними возникают трудности. Предыдущие способы тут совершенно не годятся. Изображение, входящее в состав сложного файла никак не редактируется вместе с текстом. Вот пример сложного файла:
Задача — преобразовать все данные исходного файла в полноценный, редактируемый текстовый файл формата Word. Есть два реальных, неплохих online
способа решения этой задачи:
Пожалуй, с них, как с наиболее интересных, и начнем.
Пробуем «Способ распознать текст на изображении:» , описанный в предыдущей публикации: Напомню, что мы пользовались онлайн конвертером с созвучным названием Convertio. Там все просто. Заходим на сайт (это ссылка именно на нужную страницу), загружаем наш файл и включаем преобразование. Вот сразу результат!
Абсолютно все содержимое исходного файла перенесено из пдф в ворд. Текст прекрасно редактируется. Есть и ошибки преобразования.
Но в целом, задача неплохо решена! Хочется только обратить внимание на две детали.
Периодически, по мере сил и возможности проверяю сервисы, которые рекомендую в статьях. На февраль 2019 года Convertio в тестовом (бесплатном) режиме работает довольно неплохо.
На февраль 2019 года docs.zone при окончании конвертации дает скачать результат без регистрации и подписки на платный тариф в 20$ за год без ограничений по количеству документов. Пользуйтесь!
Наиболее мощный алгоритм в этом конвертере OCR, его и выбираем. Или сразу переходите по этой ссылке .
Загружаем наш сложный файл. Не обращаем внимание на назойливые предложения зарегестрироваться, включаем преобразование. Вот такой получился результат.
Можно сказать, что идеально.
Можно сказать, что оба онлайн конвертера с задачей справились. Они сохраняют формат текста. Они умеют распознавать изображение как текст. У Convertio присутствуют ошибки. Задача перевода PDF в Word выполнена. Твердая четверка для Convertio и похоже, пятерка с плюсом для docs.zone.
Сначала попробуем, что получится при попытке конвертировать наш сложный исходник из pdf в Word. Начинаем с самого простого действия. Открываем файл, далее, нажимаем: «Файл», затем «Сохранить как другой…», выбираем «Текст…».
Вот результат. Собственно, что просили, то и получили. Сохранился только текст, который был заполнен на бланке — картинке:
Если мы в качестве конвертируемого файла возьмем простой pdf, в котором данные представлены в виде текста, то результат получится такой же. Текст в формате.txt, его можно скопировать, перенести в Word или Libre Office, но в любом случае, все фрматирование при этом утрачивается безвозвратно.
Пробуем следующий шаг. Все как и в первом случае, только вместо «Текст» выбираем «Word или Exel онлайн…». Звучит, по крайней мере оптимистично.
При клике на это поле открывается окно браузера с удивительно наивным предложением заплатить 966 рублей в месяц за платную версию. Хорошо, что при этом есть возможность бесплатной тестовой версии в течении 7 дней.
Ну что же, начинаем установку тестовой семидневки. Не буду описывать довольно стандартную и понятную процедуру. Скажу только, что времени ушло изрядно. Дважды потребовалось регистрироваться. Сначала на сайте, просто для того, чтобы скачать установочный файл. Повторно пришлось вводить свои данные уже после установки, или на финальной ее стадии, если быть точным. Установка программы тоже время заняла немало. Не засекал, так как занимался другой работой, но периодически с любопытством поглядывал на прогресс-бар в ожидании успеха.
Итак, платная (7-и дневная тестовая) версия Adobe Acrobat DC установлена.
Пробуем. Открываем наш исходный файл «Сообщение о наличии объектов недвижимого имущества». Кликаем «Файл», затем «Экспорт в», далее, «Microsoft Word”. Отлично! Видим на выбор два варианта: «Документ Word» и «Документ Word 97-2003».
Начнем с первого.
Вот такой результат получился после попытки перевести pdf в Word:
Изображение из исходного документа так и осталось изображением. Видите, значёк «якорь» слева? Практически все данные, как были картинкой формата пдф, так и остались картинкой, которую мы не можем редактировать как текст, только теперь она вставлена в документ ворд. И только те данные, что были изначально в виде текста конвертированы как полноценный текст, который можно редактировать. Форматирование текстовых данных сохранилось.
Пробуем вариант с «Документ Word 97-2003».
Только текст. То же самое, что получилось после попытки конвертации в Adobe Reader.
Нельзя не напомнить, что в сервисе Google Drive легко организована конвертация из pdf в Word. Правда, чтобы пользоваться этим сервисом необходимо иметь свой аккаунт в Google , создать который супер просто. У кого учетная запись уже есть, то сразу сюда: https://drive.google.com/
Для преобразования файла достаточно зайти в Google Drive, нажать кнопку «Загрузить», в открывающемся меню выбрать опцию «Загрузить файлы».
После загрузки файла с форматом pdf кликаете по нему правой кнопкой мыши, и из предложенных действий выбираете «Открыть с помощью», и «Google документы». Собственно, все, как только документ открылся, он преобразован.
Правда, наш тестовый сложный файл, после того как был загружен и открыт с помощью Google Документов перенес в документ только ту часть данных, которая изначально была текстом. Часть данных бывшая изображением не перенесена вообще. То есть получился все тот же вариант, что и в
Для самых сложных случаев, файлов, состоящих из комбинированных данных, можно пользоваться отличным онлайн сервисом docs.zone или Convertio , который чуть похуже, но тоже работает.
Не могу однозначно сказать, что Convertio совсем плох, возможно качество результата в том числе зависит и от исходного документа. В нашем примере на тестовом документе Convertio явно проиграл.
Для повседневного использования в онлайн режиме отлично подходит . Основные плюсы по сравнению с Adobe:
А у Вас есть другие идеи по преобразованию PDF в Word?
Задачей этой небольшой статьи-руководства является ответ на поставленный ее заглавием вопрос.
Сразу поблагодарим компанию «Adobe» за этот замечательный формат - PDF . Еще большие благодарности тем, кто заталкивает в этот формат все, что только попадется под руку: и текст, и графику, а также считает дурным тоном прислать вам обычное письмо не конвертировав его в PDF …
Но, спокойно, без нервов! Что нужно переводчику от PDF? Верно - ТЕКСТ. Лучше даже неформатированный (Plain Text). Ну, а на картинки можно посмотреть и в «Adobe Reader» (ранее Acrobat Reader).
Итак, начнем.
ЗАПОМНИТЕ! Если заказчик хочет получить на выходе PDF да еще и с рисунками в растре, и чтобы форматирование сохранилось, смело шлите его к верстальщику с Adobe inDesign! Или осваивайте его сами и требуйте надбавку за верстку!
Сначала попробуйте получить у заказчика исходник PDF - может его как раз из вашего любимого Microsoft Word конвертером PDF и сделали… Если его нет, тогда разберемся, какого вида бывают файлы PDF и как из него выудить текст.
1. PDF содержит настоящий текст (ура!). Его можно извлечь простым выделением и копированием или в обычном «Adobe Reader» (бесплатная программа для чтения PDF) в меню «Файл» выбрать «Сохранить как текст» (или иногда даже «Сохранить как текст с форматированием», если это возможно и нужно). Есть и более сложные и небесплатные варианты, о которых мы подробнее поговорим чуть позже.
1.1. PDF содержит настоящий текст (рановато радуетесь!), но неведомые силы не позволяют нам его копировать - файл защищен паролем и копирование текста запрещено. Что же делать? Либо взять пароль у заказчика, либо воспользоваться утилитой PDF Password Remover.
1.2. PDF содержит настоящий текст (рано радуетесь!). Его можно вытащить простым копированием, но… кодировка какая-то у него не та. И кроме крокозябров и цифр ничего вытащить не удается. Без паники - читаем следующий пункт.
2. PDF собран из картинок или шрифты в нем в кривых или «кривой» кодировке. Вот это уже «тяжелый случай». Тут не обойтись без обожаемого «FineReader» (ABBYY PDF Transformer не дает таких же хороших результатов как конвертер PDF, поскольку не в состоянии правильно определить все блоки автоматически. Скажем так: PDF Transformer - это урезанная автоматическая версия FineReader). За преобразование в текст тоже неплохо бы получить дополнительное вознаграждение, ведь вы расходуете ваше драгоценное время на процесс распознавания, который проходит не всегда так гладко, как хотелось бы. Но ведь заказчику-то все равно, пользуетесь вы электрословарями и средствами автоматизации или нет. Так что это ваши проблемы. :(
3. PDF собран из картинок с неподдающимся распознаванию тексту. Сочувствую. Распечатываем, забываем о всяких «продвинутых прогах», вешаем бумажку на планшет и переводим, совершенствуя свои навыки чмакания по клавиатуре.
Теперь, как и обещал, поподробнее по первому пункту. Для примера возьмем довольно сложный файл нестандартного формата бумаги с руководством к велонавеске с сайта компании Shimano: SI-41R0F-PD-M970_540_520-EN.pdf (182 Кбайт) . В нем есть все: и таблицы, и рисунки в растре, и текст в разных шрифтах и размерах. Попробуем преобразовать его по очереди разными способами.
1. В файле разрешено копирование - PDF Password Remover не требуется.
2. Текст «живой». Пробуем бесплатный способ:
Теперь опробуем специализированные программы-конвертеры PDF (а не конверторы!). :
Adobe Acrobat 7.0 или 8.0 Файл - Сохранить как… - *.doc, *.rtf
Лучше их и не смотреть: это ужас какой-то. И это «родной инструмент» для работы с PDF?! Текстовый формат - то же, что и в Adobe Reader.
Посмотреть сконвертированный файл:
Save as *.txt ,
Save as *.doc ,
Save as *.rtf
Был выбран автоматический режим обработки. Результат, надо заметить, не плох, но для перевода мало пригоден - те же лишние знаки абзаца, неудобный текст. Здесь также представлен файл, сохраненный в Word «Как простой текст»
Штука, конечно, хорошая. Только для работы BCL Jade нужен еще и сам Adobe Acrobat (не Reader). Он в него встраивается как плагин. И привыкнуть к нему придётся - «зонировать» всё придется вручную. Зато он часто справляется с такими вещами, которые другим не под силу (правда, только при условии «живого» PDF). Обычно используется для «довытаскивания» того, что не вытащил или не так вытащил Solid.
Прямо-таки верх аскетизма! Ничего лишнего. То есть, вообще ничего: «Failed to convert» - это единственное, что удалось добиться от BCL easyConverter:(
Качаем, качаем, качаем… Что ж... скачал! И хотел бы подивиться на распрекрасный файл формата *.doc . Но вот надежды обмануты: несмотря на всю внушительность, программа выдала файл с ОТСУТСТВУЮЩИМИ фрагментами текста! Забыть как страшный сон.
Уже почти отчаявшись, запускаю некий Infix PDF Editor. Открываю PDF-ку, выбираю сохранить «Как простой текст»… Смотрим… И, о чудо (!) : мы получили удобоваримый в переводческой кухне текст, лишние знаки абзаца отсутствуют как класс - класс, в общем и целом, и «одобрямс» (даже RTF у них приятен глазу - размер и цвет шрифта сохранен).
И на последок бесплатные он-лайн PDF конвертеры: ZamZar и Freepdfconvert. http://www.freepdfconvert.com Встречайте! Но не забудьте: файлы с секретными данными там конвертить не стоит;)
Этот он-лайн сервсис предназначен для конвертации всего во все и скачивания фильмов в YouTube и подобных сервисов, но в том числе умеет и конвертировать файлы PDF в форматы DOC, RTF, ODT, TXT
Текстовый файл, вылезший из недр Замзара, ужасен, а вот *.doc приятно удивил - это ПЕРВЫЙ приличный макет документа. Картинки изуродованы изрядно, но текст везде на месте. Даже со спецсимволами. Однако он совсем непригоден для перевода: чересполосица какая-то да и только плюс знаки абзаца в конце КАЖДОЙ строки.
А вот этот преобразователь поработал на славу: все выглядит очень прилично! И картинки нормального качества и текст. Лишние знаки абзаца (которые можно убрать макросом) стоят там, где и в самом PDF. Если работать только в виде "Разметка страницы", то "твердое четыре".
Результат перевода сервисом Freepdfconvert.com тестового PDF файла в формат Microsoft Word -
Есть он-лайн сервис и от самих создателей PDF:
Вывод: Стоит начать с самых надежных и простых программ. Если же результат неудовлетворительный, остается пробовать остальные.
Уф. Так вот он какой, этот «пе-де-эф». Надеюсь, я вам хоть немного помог. Успехов!
Всё просто. Загрузите PDF-документ с жёсткого диска / из облачного хранилища или перетащите в поле загрузки.
После загрузки PDF-файла выберите формат Microsoft Word из выпадающего меню. Доступно два варианта: DOC и DOCX.
Вам не надо скачивать приложение или устанавливать программу. PDF2Go работает онлайн в любом браузере..
Забудьте о вредоносных программах и вирусах, просто скачайте полученный документ Word.
Несмотря на универсальность формата, PDF-документы сложно редактировать. Чтобы извлечь или отредактировать текст, надо преобразовать PDF в редактируемый Word.
Оптическое распознавание символов (OCR) позволяет редактировать даже отсканированные книги. Не тратьте время, чтобы скопировать текст вручную, мы обо всём позаботимся!
Если вы преобразуете PDF в документ Microsoft Word на сайте PDF2Go, вашему файлу ничего не угрожает.
SSL-шифрование, регулярная очистка сервера, безопасность загрузки и скачивания файлов. Все права на документы остаются за вами.
Для получения дополнительной информации ознакомьтесь с Политикой конфиденциальности.
Конвертируйте PDF-файлы на компьютере, смартфоне или планшете!
Онлайн-сервис PDF2Go позволяет конвертировать PDF-файлы в Word. В поезде или автобусе, в отпуске, на работе или дома - просто подключитесь к сети!
PDF (пдф) - это формат, через который можно легко и удобно читать книги на компьютере. Он позволяет сохранить хорошее качество не только текста, но и изображений, поэтому часто используется в печатной продукции.
Если это просто электронная книга, которую читаешь для души, то никаких неудобств данный формат не вызывает. Но когда с таким документом приходится работать, для многих это может оказаться проблемой. Не очень понятно, как перевести его в обычный текст и, вообще, возможно ли это сделать без потери форматирования.
Сейчас мы рассмотрим наиболее простые способы перевода в Word с сохранением первоначального вида.
В последних версиях Microsoft Office приложение Word имеет встроенный инструмент для конвертирования pdf. Нужно просто открыть файл в этой программе, а дальше система сделает все сама.
1 . Нажимаем на кнопку «ФАЙЛ» в левом верхнем углу окна.
2 . Идем по пути Открыть → Компьютер и выбираем папку, где находится наш файл.
3 . Выбираем документ и жмем кнопку «Открыть».
Появится окно с предупреждением, которое можно не читать и сразу жать кнопку «ОК».
Вот и всё! Теперь документ можно редактировать и сохранить в обычном формате doc или docx.
Правда, разрывы страниц расположены не в тех местах, что в исходном файле, но это как-нибудь можно пережить. Главное, все таблицы и списки доступны для редактирования.
Если у вас старая версия MS Word, но зато есть программа Adobe Acrobat Reader или Foxit Reader (в одной из них обычно и открываются все pdf файлы), тогда конвертировать можно с помощью нее.
1 . Открываем файл в Adobe Reader или Foxit Reader и копируем нужный фрагмент документа.
Обычно достаточно просто открыть файл и он сразу же запустится в одной из этих программ (вверху будет написано, в какой именно).
Для копирования всего текста в Adobe Reader нажимаем вверху на «Редактирование» и выбираем «Копировать файл в буфер обмена».
В Foxit Reader для переноса всего текста нужно нажать на «Главная» вверху, щелкнуть по иконке буфера обмена и выбрать «Выделить все». Затем опять щелкнуть по иконке и выбирать «Копировать».
2 . Создаем документ в Ворде. Для этого щелкаем на свободном любом месте Рабочего стола правой кнопкой мыши и выбираем пункт Создать → Документ Microsoft Office Word.
А можно просто открыть программу через Пуск → Все программы → Microsoft Office → Microsoft Office Word.
3 . Вставляем в документ тот фрагмент, который мы скопировали из pdf файла. Для этого щелкаем правой кнопкой мыши по листу и в контекстном меню выбираем пункт «Вставить».
В итоге получаем тот же текст, но с возможностью редактирования. Правда, часто он добавляется с немного измененным форматированием и без изображений.
Резюме: с обычным текстом такой вариант вполне допустим, но если в документе есть еще и таблицы, списки, изображения, лучше конвертировать другими способами.
Программы для распознавания текста:
ABBYY FineReader (платная)
WinScan2PDF (бесплатная)
Всем привет. Решил написать полезную статью на тему, как конвертировать pdf в word, чтобы можно было редактировать текст бесплатно. Смотрим все способы.
PDF формат – формат документов, который помогает сохранять презентабельный и компактный внешний вид на любых гаджетах: компьютерах, планшетах, телефонах. Именно поэтому в настоящее время такой формат используется для электронных книг и журналов, так как он сохраняет все настройки текста.
Пользователи считают, что PDF файлы очень удобны в использовании, только есть одно «но» — редактирование текста. В таком формате невозможно как-то изменять текст, более того, не все PDF форматы «разрешают» копировать информацию. Именно поэтому пользователи ищут способы, как можно перевести PDF формат в Word, редактор, где можно полноценно работать с текстом. Рассмотрим несколько способов.
Конвертирование файлов – преобразование определенного рода файлов в какую-то другую форму. Поэтому когда мы преобразовываем PDF файл, например, в Word, это будет называться конвертирование.
Если данные способы Вас не устраивают, существует еще несколько онлайн-приложений, которые смогут помочь конвертировать файлы PDF в Word.