Обложка канала

Datalytics

5840 @datalytx

Канал, посвященный анализу данных с помощью Python. Не столько про машинное обучение, сколько про подготовку/очистку/предобработку данных, использование Python для получения данных из API, парсинга веб-сайтов, автоматизации различной рутины

Datalytics

4 года назад
Открыть в
Яндекс выложили в открытый доступ систему управления базами данных YDB [1] с полным исходным кодом [2]. Эта распределенная SQL база данных, с собственным расширением языка SQL - YQL [3] и, в целом, выглядит любопытно. Что стоит внимания: - работа в кластере как часть системы - обещанная простая масштабируемость Что удивительно: - база написана полностью на C++, хотя сейчас более популярно когда базы данных создаются на более высокоуровневых языках, в том числе и для того чтобы привлечь разработчиков которые хотят их изучать - поддержка JSON и иерархических данных весьма скромная, по крайней мере документации об этом мало, хотя и упоминается - вместо придумывания своего языка запросов расширяют SQL, что может быть и не плохо, просто +1 SQL диалект - нет PostgreSQL или MySQL "совместимости из коробки", а это полезная фича которую декларируют многие новые СУБД и сервисы. В целом база явно написана под высокие нагрузки, стоит пристального внимания и тестирования. Ссылки: [1] https://ydb.tech/ [2] https://github.com/ydb-platform/ydb [3] https://ydb.tech/ru/docs/yql/reference/ #data #opensource #yandex #tools
YDB — an open-source Distributed SQL Database

YDB is an open-source Distributed SQL Database that combines high availability and scalability with strong consistency and ACID transactions.

ydb.tech