Обложка канала

Ivan Begtin

3903 @begtin

I am focused on Open Data, Procurement, e-Government, Open Government and other tech stuff

Ivan Begtin

3 года назад
Открыть в
Полезное для тех кто постоянно работает с Pandas в наборе заметок Modern Polars [1] написанных по мотивам Modern Pandas [2]. Основная идея в том что Polars существенно быстрее и более однозначно позволяет работать с теми же данными и миграция на Polars с Pandas не является чем-то реально очень сложным. Наоборот, это довольно просто. А также несколько полезных обзоров Polars в Towards Data Science: - Pandas vs. Polars: A Syntax and Speed Comparison [3] - Tips and Tricks for Working with Strings in Polars [4] - Polars: Pandas DataFrame but Much Faster [5] Про Polars именно сейчас особенно много пишут и как продукт он полностью подпадает под категорию давайте сделаем продукт совместимый с продуктом лидером, но значительно быстрее. Кроме Polars, конечно, есть ещё modin, PandaPy, datatable, Dask, PySpark, Vaex и другие. Надеюсь однажды увидеть обзор со сравнением их всех. Ссылки։ [1] https://kevinheavey.github.io/modern-polars/ [2] tomaugspurger.github.io/posts/m…-scaling [3] towardsdatascience.com/pandas-…4e27497e [4] towardsdatascience.com/tips-an…b74aeec2 [5] towardsdatascience.com/pandas-…d6be4cd4 #opensource #datatools
Modern Polars

kevinheavey.github.io