Обложка канала

Python - Советы, библиотеки, гайды

10180 @xo_py

Всё для Python программиста :3 Готовый код, советы, лайфхаки, годные библиотеки, уроки и многое другое!

Python - Советы, библиотеки, гайды

4 года назад
Открыть в
newspaper3k - модуль, который даёт возможность извлекать статьи и связанные мета-данные из множества разных источников. С использованием newspaper3k можно извлечь изображения, текст и имена авторов. Данный модуль, кстати, поддерживает NLP-функциональность 🌚 Поэтому, если вы собирались использовать BeautifulSoup или другую библиотеку для вебскрапинга в своём следующем проекте, лучше сэкономьте своё время и силы и установите newspaper. Ставится командой ⚙ pip install newspaper3k Документация и примеры кода здесь :3