Валидация данных (англ. Data validation) — это процесс проверки данных различных типов по критериям корректности и полезности для конкретного применения. Валидация данных проводится, как правило, после выполнения операций ETL и для подтверждения корректности результатов работы моделей машинного обучения (предиктов). Валидация данных применяется не только к табличным данным, но и датасетам, содержащим наборы таблиц, текстовую, графическую, звуковую информацию. Различные методы валидации данных применяются при автоматизированной обработке информации, статистике, сборе и обработке результатов научных и медицинских исследований и в других областях.
Abstract from DBpedia / Wikipedia · CC BY-SA
via Wikidata sitelinks · CC0
Discovered by embedding cosine similarity (sentence-transformers MiniLM, 384-dim).