New Directions for Data Quality Mining

Laure Berti-Équille; Tamraparni Dasu

Document Associé À Des Manifestations Scientifiques Année : 2009

New Directions for Data Quality Mining

(1) ,

Laure Berti-Équille

Fonction : Auteur
PersonId : 19540
IdHAL : laure-berti-equille
ORCID : 0000-0002-8046-0570
IdRef : 130675725

Institut de Recherche en Informatique et Systèmes Aléatoires

Tamraparni Dasu

Fonction : Auteur

Résumé

As data types and data structures change to keep up with evolving technologies and applications, data quality problems too have evolved and become more complex. Data streams, web logs, wikipedias, biomedical applications, video streams and social networking websites generate a mind boggling variety of data types. Data quality mining, the use of data mining to manage, measure and improve data quality, has focused mostly on addressing each category of data glitch separately as a static entity. In this tutorial we highlight new directions in data quality mining, particularly: (a) the applicability and effectiveness of the methodologies for various data types such as structured, semi-structured and stream data, (b) the detection of concomitant data glitches like the occurrence of outliers in data with missing values and duplicates (c) the design of sequential approaches to data quality mining, such as workflows composed of a sequence of tasks for data quality exploration and analysis. We give a brief overview of past work, introduce current research in this area, and highlight new directions and open problems in data quality mining. The tutorial includes extensive case studies, applications and practical examples.

Domaines

Web Intelligence artificielle [cs.AI] Base de données [cs.DB] Apprentissage [cs.LG] Machine Learning [stat.ML] Méthodologie [stat.ME] Autres [stat.ML]

Fichier principal

tutorial-KDD09-Berti-Equille-Dasu.pdf (2.21 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

Laure Berti-Equille : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-01856320

Soumis le : vendredi 10 août 2018-15:47:40

Dernière modification le : vendredi 24 mars 2023-14:53:07

Archivage à long terme le : dimanche 11 novembre 2018-13:21:15

Dates et versions

hal-01856320 , version 1 (10-08-2018)

Identifiants

HAL Id : hal-01856320 , version 1

Citer

Laure Berti-Équille, Tamraparni Dasu. New Directions for Data Quality Mining. International Conference on Knowledge Discovery and Data Mining (KDD 2009), Jun 2009, Paris, France. ⟨hal-01856320⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

INSTITUT-TELECOM EC-PARIS UNIV-RENNES1 CNRS INRIA INSA-RENNES IRISA INRIA-MECSCI UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES INSA-GROUPE UR1-MATH-NUM

136 Consultations

103 Téléchargements

New Directions for Data Quality Mining

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager