Як у ворд вставити сканований файл. Як відсканований документ перекласти у формат Word

Дуже багато користувачів, які працюю з текстовими документами, нерідко потребують копіювання якогось тексту, скажімо, з паперового оригіналу, щоб потім вставити його в Word. Це рятує від набору тексту вручну. Гаразд, якщо це один-два аркуші. А коли сторінок десять-двадцять?

Як перекласти відсканований документ у Word

Тут на допомогу приходить сканер, який вміє розпізнавати все те, що перебуває у друкованому виданні. З його допомогою можна перевести документи в різні електронні формати. Якщо текст дуже складний і написаний іноземною мовою, ви можете скористатися послугами бюро перекладів та запевнень у Москві.

Найпростіший спосіб (звичайно, якщо ви не потребуєте редагування), відсканувати текст (зазвичай сканери за промовчанням пропонують графічний режим), а потім скопіювати отриманий результат і вставити його в Word. Однак, у даному методіє один істотний недолік. Редагувати текст у графічному поданні документ не вдасться. Можна змінити, наприклад, лише насиченість, колірну гаму, розмір всього фрагмента. Але не більше.

Для того, щоб можна було редагувати отриманий результат як звичайний текст, необхідно спочатку задавати розпізнавання об'єкта, що сканується саме як текст. Оптимальним варіантом для цього є програмне забезпеченнятипу ABBYY Fine Reader. Це одна з найрозумніших програм для сканування друкованого матеріалу. Вам необхідно просто задати відповідні налаштування та почати сканування. Результат буде виведено у окремому вікні. Сам текст можна відредагувати там, а потім, скопіювавши його, вставити в свій редактор, або ж, відразу ж скопіювати, потім вставити в Word і вже там проводити редагування. Другий варіант перспективніший, оскільки, в більшості випадків Word включена функція автозбереження. Тому, якщо раптом станеться якийсь збій у системі, ви легко зможете відновити останню збережену копію документа. Те саме стосується випадкового видалення чи втрати файлів. Вам просто не треба буде думати, як відновити видалені файли.

Іноді виникають ситуації, коли в режимі сканування ви отримуєте документ формату PDF, який розпізнається додатками типу Adobe Readerабо подібними до нього. Так само, як і графіку, документ у форматі PDFредагувати у плані тексту неможливо. У цьому випадку вам на допомога прийдепрограма ABBYY PDF Transformer. Відкривши у програмі відповідний файл формату PDF, ви в кілька кліків зможете перевести його до будь-якого іншого формату, у тому числі й у формат Microsoft Word. Необхідно просто вибрати збереження, вказати назву файлу, у типі документа вибрати Документ Word із зазначенням розширення DOC (хоча зазвичай, це не потрібно).

Таким чином, найкраще задавати сканування відразу з розпізнаванням тексту. Це не займе ні часу, ні сили. Зате потім, ви відразу можете приступати до редагування отриманого результату.

Вадим Панькова спеціально для

Вітаю. Сьогодні я розповім, як сканувати текст у документ Word . Для чого це потрібно робити? Відповідь очевидна для подальшого редагування тексту. Адже зображення не так просто відредагуватиме. Що краще використовувати, програми або онлайн сервісдля переведення сканованого тексту до документа Word? Про це я розповім нижче у статті.

Для того щоб максимально прискорити та спростити завданняя шукав сайти, на яких онлайн можна конвертувати сканований документ у формат Word. Для цього мені довелося спочатку сканувати, а потім конвертувати. Відразу скажу, що багато сайтів обмежують кількість перекладів у Word, а щоб не обмежено конвертувати потрібно заплатити. Мені вдалося знайти пару сайтів, які не обмежено вирішують це завдання, але ділитися не буду, оскільки конвертувати сканований текст на Word онлайн виявилося марною тратою часу. Відсоток розпізнавання тексту дуже низькийпростіше було б передрукувати документ з нуля.

У такому разі, якщо онлайн інструментина даний момент погано переводять сканований документ у Word, то як зробити це максимально якісно? Читайте про це далі, я наведу зрозумілу інструкцію.

Погулив ще кілька хвилин, знайшов програму, що називається ABBYY FineReader Professional. Напевно, Ви вже чули про неї. Завантажив її тут http://nnm-club.me/forum/viewtopic.php?t=851116, легко встановлюється та відмінно працює.

ABBYY FineReader може перекласти скановані документи не тільки у Word, а й у PDF та багато інших текстових та журнальних форматів.

Користуватися нею дуже просто. Встановлюєте та запускаєте. На моніторі повинні побачити таке вікно, як нижче не скріншоті.

Тут нічого складного, інтуїтивно зрозуміло, що потрібно натиснути в нашому випадку на "Сканувати в Microsoft Word". Потім побачимо вікно налаштувань сканування, де можна нічого не змінювати.

Поставимо програмі не просте завдання. сканувати та розпізнати сторінку книги. Кладемо книгу або будь-який інший документ на сканер і натискаємо сканувати. Програма починає сканування, а потім автоматично розпізнає документ. Якщо автоматичного розпізнавання не відбулося, то натисніть правою кнопкоюна сканований документ та натисніть «Розпізнати». Нижче на скріншоті видно, який результат вийшов у мене.

Далі натискаєте на піктограму Word вгоріта документ збережеться у текстовий формат документа Microsoft Word. Зрозуміло, потрібно враховувати, що розпізнаний текст потрібно обов'язково перечитувати, адже в будь-якому випадку можливі помилки.

Ставте запитання, пишіть коментарі. Дякую за увагу.

Якщо Ви обрали швидкий шлях написання теоретичного розділу, про який ми говорили в параграфі 2.1., найімовірніше Вам не обійтися без сканування документів. В іншому випадку, цей пункт можете пропустити та починати конспектувати матеріали, знайдені в бібліотеці .

Перед початком сканування потрібно визначитися, що саме Ви хочете використовувати під час написання роботи. А для цього потрібно спочатку переглянути літературу і виділити олівцем потрібні моменти.

Коли я вперше сканував статтю з журналу для своєї першої курсової, для мене це заняття було неймовірно складним. В результаті кількох годин роботи зі сканером і FineReader'ом у мене на виході вийшла маячня, яка не піддається редагуванню. У результаті довелося все набирати руками. Щоб у Вас не трапилося подібного, розглянемо детальніше всі технічні моменти сканування.

Для сканування нам, звичайно ж, буде потрібно сканер. Його не обов'язково купувати. Можна, наприклад, на якийсь час взяти на якийсь час у товариша. Я користуюся сканером CanoScan Lide 60. Це хоч і не найновіша модель, але мені дуже подобається цей компактний, швидкий та зручний у роботі "девайс". Якщо Ви взяли на час сканер, щоб він працював потрібно спочатку встановити програму-драйвер. Драйвера та посібник зі встановлення завжди можна знайти на настановному диску, який додається до пристрою чи завантажити на сайті у виробника. Після інсталяції драйвера підключіть сканер до комп'ютера за допомогою з'єднувального шнура. Тепер можна вже безпосередньо розпочати сканування.

Але спочатку трохи теорії. Ви повинні знати, що процес сканування складається з двох етапів:

1. Безпосереднє сканування документа. На цьому етапі сканер як би фотографує поверхню документа, що сканується, і зберігає отримане зображення на комп'ютер у вигляді звичайного файла.jpg .gif або в іншому форматі;

2. Розпізнавання документа. Це процес перетворення тексту із зображення зробленого сканером у звичайний тест, який потім можна зберегти у Word та редагувати. Розпізнавання здійснюється без участі сканера за допомогою спеціальної програми (найпопулярніша Adobe FineReader). Таким чином, Ви можете спочатку відсканувати кілька аркушів тексту та зберегти їх у вигляді зображення і лише потім перетворювати на текст.

Тож почнемо етап перший – сканування:

– запускаємо драйвер сканера: Пуск – Усі програми – Canon – ScanGear(Назву драйвера я вказую для свого сканера). З'явиться вікно драйвера:

– відкриваємо кришку сканера і кладемо книгу, журнал або їх копію текстом донизу, якомога рівніше по відношенню до країв робочої поверхні сканера:

Тут дуже важливо зробити так, щоб кришка сканера якомога щільніше притискала документ, що сканується, не допускаючи попадання зовнішнього освітлення не робочу поверхнюсканера, що стикається з документом;

- Виконаємо необхідні установкиу драйвері сканера. Насамперед потрібно встановити дозвіл, у якому буде відскановано документ. Роздільна здатність – це показник, який визначає рівень деталізації об'єкта при скануванні та визначається в точках на дюйм (dpi, або т/д). Чим більша роздільна здатність, тим якісніше виходить зображення. Але при скануванні текстових документівнемає сенсу встановлювати максимальний дозвілоскільки толку від цього буде нуль. Крім того, сканування з великою роздільною здатністю займає більше часу. Я рекомендую встановлювати роздільну здатність в межах 400-500 т/д (dpi). При такому налаштуванні зображення виходять досить якісними для гарного розпізнавання, а сам процес сканування не займає багато часу. Пропоную подивитися на скріншот установок мого принтера:


Для початку потрібно перейти в "Розширений режим".Джерелом завжди буде "Планшет"(Планшетний сканер). Кольоровий режим краще встановити "Чорно-білий"адже для сканування тексту нам кольори не потрібні, а це зменшить розмір зображень на виході. Дозвіл, як я вже сказав, слід встановити 400 т/д. Вихідний розмір зображення – обов'язково "А4". Тепер можна сміливо натискати на кнопку "Сканувати". Мій сканер влаштований таким чином, що спочатку запам'ятовує відскановані зображення в внутрішньої пам'яті, і лише при закритті вікна драйвера пропонує зберегти їх на комп'ютер. Мені залишається лише вказати місце, куди буде збережено результати роботи.

У вас мають бути файли такого типу:

При збільшенні такого зображення має бути чітко видно текст.

Другий етапрозпізнанняотриманих зображень та їх перетворення на текст. Як я вже казав, для цього знадобиться спеціальна програма. FineReader. Завантажте програму за цим посиланням (32Мб). Пароль до архіву – сайт. Запропонована версія не вимагає установки (portable). У папці з програмою буде багато різних файлів, але Вам потрібен лише один – FineReader.exe. Подвійний клік на цьому файлі запустить програму на комп'ютері.

Ця версія програми досить стара. Усі скріншоти нижче я робив, використовуючи саме її. Якщо ця версія FineReaderу вас не запускається - виберіть нову.

Вікно FineReaderмає такий вигляд:

Після встановлення мови, на якій надруковано відскановані документи, можна починати розпізнавання. Якщо в тексті є відразу дві мови (наприклад, російська та англійська) установку зробіть відповідно.

Щоб розпочати розпізнавання, натисніть на стрілку праворуч від першої кнопки Сканувати- а потім - Відкрити зображення:

Відкриється вікно вибору зображень. Відкрийте папку, в яку Ви зберегли відскановані зображення, натисніть CTRL+A(англійська) на клавіатурі та натисніть на кнопку Відкрити.

Після цього зліва у вікні FineReader'аз'являться ескізи доданих файлів, по центру – на даний момент виділений ескіз у збільшеному вигляді, знизу – ще більше збільшення, а праворуч – результат розпізнавання:

Для прикладу я взяв лише два зображення. На скріншоті вище виділено перший із них, його зараз і розпізнаємо. Як бачите, зображення відскановано вертикально, щоб розпізнати текст знімок, потрібно спочатку розгорнути на 90 градусів. Для цього скористаємося кнопками та . Наступним кроком потрібно вказати програмі, яку саме частину зображення потрібно розпізнати, а також задати тип даних, які мають вийти на вихід текст, таблиця або зображення. І тому існують кнопки, соответственно: . Наприклад, якщо потрібно відзначити текстовий блок, натискаємо лівою кнопкою на , після цього натискаємо лівою кнопкою мишки в верхньому лівому куті текстового блоку і, утримуючи ліву кнопку, перетягуємо в правий нижній кут. Наприклад, я повністю підготував до розпізнавання одне зображення:

Як бачите, всі текстові блоки у прикладі вище виділені зеленим, а малюнки – червоним. Таблиці готуються до розпізнавання аналогічно. Для цього призначена кнопка . Щоб перейти до наступного знімка, клацніть лівою кнопкою миші на його ескізі зліва. Таким чином, готуються до розпізнавання всі отримані в результаті сканування зображення. Після завершення підготовки зображень слід виділити їх усі. Для цього клацніть лівою кнопкою в порожньому місціна панелі ескізів (вона називається Пакет) та натисніть Ctrl+A(англійський) на клавіатурі. Далі клацніть на кнопку і зачекайте поки FineReaderперетворює зображення на текст. Після цього можна зберігати отриманий текст у Word за допомогою кнопки після натискання на яку відкриється вікно . У ньому необхідно вибрати формат для збереження – Microsoft Word, а також поставити позначку, щоб збереглися всі сторінки:

Після натискання кнопки ОКпрограма створить документ Word і вставить у нього текст із розпізнаних сторінок у порядку, де вони перебувають у панелі ескізів (Пакет). Отриманий документ одразу ж збережіть у папку у файловій структурі дипломної роботи та можете приступати до редагування. Як це робиться, описано в моєму безкоштовному курсі.

І останній момент. Якщо Ви сканували газету або журнал, текст там часто дається у вигляді колонок (як у прикладі вище). Ці колонки у Ворді потрібно перетворити на одну. Виділіть текст у вигляді колонок та виконайте команду: Формат – Колонки – Одна – ОК. Тільки після цього можна ставити Книжкову орієнтацію у Параметрах сторінки, відступи полів, шрифт тощо.

Як відсканувати документ та розпізнати його в MS Word

Зберігати відскановані документи на жорсткому диску або зовнішньому носіїзручно та безпечно. Однак, як змінити сторінки, зазвичай представлені у вигляді зображення? Нам знадобляться спеціальні програми, про встановлення та управління якими ми розповімо нижче.

Як відсканувати документ перед редагуванням?

Щоб успішно маніпулювати файлом надалі, важливо правильно перевести його у формат "картинки", а також врахувати кілька простих, але корисних нюансів у самому процесі. Для цього:

  • Розгладьте всі заломи та складки, щоб вони не відобразились на скані і не призвели до труднощів у розпізнаванні літер.
  • Для зручності користування збережіть файл у форматі PDF, JPG або TIFF.
  • PDF-документ можна буде відкрити та редагувати програмою Adobe Acrobat(або будь-який інший, призначений для подібних цілей).
  • Зайдіть на сайт компанії-творця сканера, або пошукайте фірмову програму на диску, що додається (часто відомі бренди мають власні додатки для зміни відсканованих сторінок).
  • Для подальшого використання файлу в MS Office 2003 або 2007 установіть утиліту Microsoft Office Document Scanning. Вона робить конвертацію сканованого файлу автоматично, переводячи його відразу в текст (програма не працює з "свіжішими" версіями Офісу).
  • Рекомендується сканувати в чорно-білій гамі, а не в кольоровій – це спрощує аналіз тексту.
  • TIFF формат найкраще застосовувати для OCR конвертерів, тобто програм, які виробляють оптичне розпізнавання.

Як відредагувати відсканований документ – робота з OCR-утилітами

Принцип методу Optical Character Recognition - зчитування наявних на папері символів, подальше їх порівняння з елементами з власної бази даних. Таким чином відбувається перетворення суцільної картинки в текст, що редагується. Яскраві прикладипрограм, що справляються з цим завданням – Adobe Acrobat та Evernote. Щоб внести виправлення до наявного скану, просто відкрийте його одним з таких програм, весь наступний процес відбудеться автоматично. Коли програма закінчить розпізнавання, запропонує користувачеві зберегти документ в одному з доступних форматів.


Як відредагувати відсканований документ PDF

Якщо відсканований документ збережено в PDF файл, ми з легкістю зможемо відредагувати його у програмі Acrobat DC. Для цього:

  • відкриваємо меню "Інструменти" -> "Редагувати PDF";
  • програма запускає процес редагування, показуючи меню підказок у правому кутку зверху;
  • клацнувши на ній і вибравши "Параметри", можна вказати мову розпізнавання;
  • що внести зміни, просто натисніть на будь-якому рядку документа;
  • документ, відкритий для редагування через OCR, супроводжується особливою панеллю з налаштуваннями, розміщеною праворуч екрана;
  • у розділі “Налаштування”, крім мови, також зручно вибирати шрифт, що відображається, позначати сторінки, які необхідно редагувати (усі або по одній).


У всесвітній мережі існує доступна альтернатива програмам-конвертерам, що встановлюються. Це онлайнові OCR, які легко переведуть отримане зображення в будь-який текстовий формат. Наприклад, сайт pdfonline.com дозволить за кілька хвилин із відсканованого PDF-документу зробити звичайний файл MS Word.

Ті люди, які активно працюють з документами та ін. текстовою інформацією, однозначно бачать необхідність сканування різних матеріалів. Важливо пам'ятати про те, що для отримання якісних документів наявність сканера взагалі не обговорюється. Однак у певних ситуаціях може згодитися і фотографія необхідного тексту, однак знімок також має високу якість.

Як відсканувати документ у Word

  • Насамперед відбувається сканування документа. Для цієї справи краще вибирати формат png або jpg. Розмір зображення також має бути значним (від 400 dpi), щоб при розпізнаванні не було жодних проблем.
  • Отримані зображення зберігаються в конкретному місці, після чого буде потрібно сама програма для розпізнавання тексту. Найкраще зробити вибір на користь Adobe FineReader. Це універсальне програмне забезпечення, яке за якістю своєї роботи не викликає жодних нарікань. Важливо відзначити, що після встановлення цієї програми відповідна вкладка має з'явитися і в MS Word, відповідно, використання функціоналу спрощується.
  • Через Adobe FineReader потрібно вибрати пункт меню "Файл" та "Відкрити", вибираємо необхідні зображення. Далі з'явиться меню обробки зображення, нам необхідно вибрати мову, яка використовується в документі, а також деякі інші опції, серед яких словники та інші налаштування (не настільки важливі для отримання результату).
  • Натискаємо кнопку «Розпізнати» та чекаємо, поки процес завершиться. Цілком ймовірно, що розпізнається далеко не всі, тому ті слова, які програма не змогла визначити, будуть виділені іншим кольором, їх можна редагувати у програмі.
  • Якщо текст у самому відсканованому документі трохи зміщений, в Adobe FineReader необхідно вибрати ті чи інші абзаци тексту за допомогою виділення. Це дозволить не пропустити текст під час розпізнавання.
  • У результаті потрібно натиснути кнопку «Зберегти», після чого з'являється можливість вибрати місце збереження документа, а також його формат. Звичайно, у випадку з MS Word потрібно вибирати розширення doc або docx.
  • Якщо перед збереженням виявляється, що документ розбитий на кілька колонок, необхідно вибрати меню «Формат», далі перейти в «Колонки» і вибрати «Одна», щоб документ виглядав просто і гармонійно. Також у «Параметрах сторінки» є можливість налаштування полів, відступів та шрифтів.


У результаті документ можна вільно редагувати безпосередньо в офісному пакеті MS Office. Важливо, що з розпізнаванні документа у Word, форматування відбувається ще простіше, оскільки функціонал єдиний, як вихідних документів, так розпізнаваних.

Що стосується розпізнавання з фотографій або інших матеріалів, то тут не так просто отримати висока якістьрозпізнавання, оскільки мова йдепро зміщені поля, відступи та інші деталі документів, на виправлення яких доведеться витратити чимало часу.