В попередня стаття Ми пояснюємо, як ми можемо завантажувати відео та субтитри, щоб мати можливість скористатися перевагами інструментів, які настільні відеопрогравачі роблять доступними для людей з обмеженими можливостями та тих із нас, хто має проблеми із зором. Далі ми пропонуємо додаткові прийоми для недалекоглядних користувачів Linux.
У цьому випадку ми побачимо як ми можемо змінити типографіку, фон і формат електронних книг.
Більше хитрощів для недалекоглядних користувачів Linux
Я повинен зробити уточнення. В Інтернеті є кілька посібників, які пояснюють, як це зробити за допомогою плагінів. Проблема полягає в тому, що стосується електронних книг, які розповсюджує Amazon, потрібен серійний номер пристрою, зареєстрованого на ім’я користувача. Оскільки в мене їх немає, все, що залишається, це зробити все важким способом.
Програми, які нам знадобляться
(Ви можете знайти їх у репозиторіях основних дистрибутивів Linux)
- Скрот: інструмент захоплення екрана для командного рядка.
- Xdotools: Імітує натискання кнопки миші.
- Gscan2PDF: Перетворити pdf зображення в текстовий pdf.
- калібр: Перетворення тексту PDF в інші формати.
- tesseract-ocr і tesseract-ocr-spa: Програма розпізнавання іспанських символів і мови.
У випадку з Caliber я рекомендую встановити його з їх веб-сайту, оскільки він зазвичай оновлюється. Ми робимо це з терміналу за допомогою цієї команди:
sudo -v && wget -nv -O- https://download.calibre-ebook.com/linux-installer.sh | sudo sh /dev/stdin
Метод
Що ми будемо робити, це автоматизувати перегортання сторінок онлайн-читача та скріншотів. Далі ми об’єднаємо знімки екрана в PDF і виконаємо оптичне розпізнавання символів, щоб створити ще один у текстовому форматі. Якщо ми хочемо, ми можемо конвертувати цей другий pdf в інший формат.
Перший крок: автоматизація
Робити різні скріншоти Нам потрібно автоматизувати процес гортання сторінок, оскільки робити це вручну втомливо. Процес полягає в наступному.
- Відкрийте книгу в веб-зчитувачі або програмному забезпеченні для зчитування служби, де знаходиться книга.
- Розгорніть вікно.
- Відкрийте термінал, але зробіть його меншим, щоб ви могли бачити інше вікно. Розмістіть його з лівого боку.
- У терміналі введіть команду xdotool getmouselocation, але не натискайте Enter.
- Перемістіть вказівник туди, де знаходиться кнопка перегортання сторінки читача, і натисніть Enter.
- Зверніть увагу на координати, які він показує вам у терміналі.
Відкрийте текстовий редактор свого дистрибутива та вставте цей сценарій.
#!/bin/bash
while [ 1 ]; do
xdotool mousemove XXXX YYY click 1 &
scrot -q 100 '%Y-%m-%d-%H:%M:%S.png' -e 'mv $f ~/Carpeta_de_archivos/'
sleep 20
done
Замініть XXXX і YYYY координатами, які ви скопіювали раніше. Замініть ~/File_Folder/' папкою, у якій ви хочете зберегти файли.
Збережіть файл під назвою script.sh.
Тепер наведіть вказівник на піктограму сценарію, який ви зберегли, і клацніть правою кнопкою миші на «Властивості», виберіть опцію, щоб надати йому дозвіл на виконання.
Створіть папку призначення за допомогою команди
mkdir ім'я папки призначення.
Пам’ятайте, що воно має відповідати назві папки, яку ви додаєте до сценарію.
Далі відкрийте зчитувач і термінал. В терміналі пишіть.
./script.sh
Встановіть рідер на весь екран і дочекайтеся завершення процесу захоплення. Ви помітите, чому саме тоді перестанете гортати сторінки. Згорніть зчитувач і закрийте термінал.
Щоб отримати найкращі результати, відображайте текст в одному стовпці.
Другий крок: створення PDF
Перейдіть до папки призначення та видаліть дублікати. далі:
- Відкрийте Gscan2pdf.
- Перейдіть до меню Файл/Відкрити і виберіть усі зображення.
- Перейдіть до меню Інструменти/OCR і виберіть Усі сторінки, Тессеракт як засіб OCR і відповідну мову.
- Натисніть на Почати окр.
- Після завершення розпізнавання перейдіть до Файл/Зберегти і виберіть Усі та формат pdf.
- Натисніть «Зберегти» та виберіть місце призначення.
Тепер у вас є PDF-файл із текстом, який підтримує стилі та зображення. Якщо ви лчитач тексту дозволяє змінювати кольори та типографіку. Ви також можете конвертувати його в інші формати за допомогою Calibre.