Обложка канала

Developer Starter pack

4518 @devsp

Начинаешь свой путь в разработку? Или ты гуру и хочешь узнать новое? Тогда тебе стоит взглянуть на @devsp ✔️Английские термины(без него никуда) ✔️Бесплатные ресурсы для получения основ различных языков программирования ✔️Ресурсы - помощники ✔️Интересны

Developer Starter pack

6 лет назад
Открыть в
Утечка данных в Machine learning: как обнаружить и избежать ее

Утечка данных происходит, когда данные, используемые в процессе обучения, содержат информацию о том, что модель пытается предсказать. Это похоже скорее на «обман», но мы не знаем, так ли это, поэтому лучше назвать это «утечка». Утечка данных является серьезной и широко распространенной проблемой в области data mining и machine learning, которую необходимо решать для получения надежной и обобщенной прогностической модели. 
Существуют разные причины утечки данных. Некоторые из них очень очевидны, но некоторые сложно заметить с первого взгляда. В этой статье я объясню причины утечки данных, как она вводит в заблуждение, а также способы обнаружения и ее предотвращения.