Ремонт, сервис, услуги » Информация » Экспорт статей Хабра в html, markdown




Экспорт статей Хабра в html, markdown

Автор: addministr от 11-05-2022, 20:45

Категория: Информация



Экспорт статей Хабра в html, markdown


До меня было написано 4 статьи по экспорту статей с хабра в FB2 и pdf:




Экспорт избранного Хабра в FB2




Экспорт избранного Хабра в FB2 — скоростная PHP-версия




Экспорт Хабра в FB2




Экспорт Избранного на Хабре в PDF




Я же хотел получить исходники своих статей. markdownify и некоторых танцев с бубном получаю md.



Как пользоваться



Скрипт написан на python, скачиваем с github, устанавливаем зависимости и запускаем:



apt-get install python3-lxml
pip3 install -r requirements.txt
git clone https://github.com/dvjdjvu/habrArticleSrcDownloader
cd habrArticleSrcDownloader
./src/main.py jessy_james

Вместо jessy_james подставить имя нужного пользователя. Взять его можно из ссылки профиля:



После запуска получаем такую картину:



./src/main.py jessy_james
[info]: Скачивается: C/C++ из Python (ctypes) на Android
[info]: Директория: 16 C C++ из Python (ctypes) на Android создана
[info]: Директория: picture создана
[info]: Статья: C C++ из Python (ctypes) на Android сохранена
[info]: Скачивается: Своя docking station для ноутбука
[info]: Директория: 15 Своя docking station для ноутбука создана
[info]: Директория: picture создана
[info]: Статья: Своя docking station для ноутбука сохранена
[info]: Скачивается: Tango Controls hdbpp-docker
[info]: Директория: 14 Tango Controls hdbpp-docker создана
[info]: Директория: picture создана

...

[info]: Скачивается: Игрушка ГАЗ-66 на пульте управления. Часть 2
[info]: Директория: 2 Игрушка ГАЗ-66 на пульте управления. Часть 2 создана
[info]: Директория: picture создана
[info]: Статья: Игрушка ГАЗ-66 на пульте управления. Часть 2 сохранена
[info]: Скачивается: Игрушка ГАЗ-66 на пульте управления. Часть 1
[info]: Директория: 1 Игрушка ГАЗ-66 на пульте управления. Часть 1 создана
[info]: Директория: picture создана
[info]: Статья: Игрушка ГАЗ-66 на пульте управления. Часть 1 сохранена

Статьи скачиваются от последней написанной к первой.

Иерархия каталога статей будет такой:



Создается папка article, далее папка с именем пользователя, далее папки с названиями статей. В папке со статьей будет два файла (.md и .html) и папка с картинками статьи.



Смотрим что получилось, берем содержимое полученного файла markdown и вставляем в редактор статей:



Почти работает как я хотел ;), есть некоторые проблемы с отображением изображений (исходник html отображает правильнее). Постараюсь их исправить.

Спасибо за внимание.



Ссылки






Исходный код скрипта


 

Источник: https://habr.com/ru/post/665254/





Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь.
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.

Архив | Связь с админом | Конфиденциальность

RSS канал новостей     Яндекс.Метрика