newspaper3k - модуль, который даёт возможность извлекать статьи и связанные мета-данные из множества разных источников.
С использованием newspaper3k можно извлечь изображения, текст и имена авторов.
Данный модуль, кстати, поддерживает NLP-функциональность 🌚
Поэтому, если вы собирались использовать BeautifulSoup или другую библиотеку для вебскрапинга в своём следующем проекте, лучше сэкономьте своё время и силы и установите newspaper.
Ставится командой ⚙ pip install newspaper3k
Документация и примеры кода здесь :3