Empirical Risk Minimization with Relative Entropy Regularization

The empirical risk minimization (ERM) problem with relative entropy regularization (ERM-RER) is investigated under the assumption that the reference measure is a $\sigma$-finite measure, and not necessarily a probability measure. Under this assumption, which leads to a generalization of the ERM-RER problem allowing a larger degree of flexibility for incorporating prior knowledge, numerous relevant properties are stated. Among these properties, the solution to this problem, if it exists, is shown to be a unique probability measure, mutually absolutely continuous with the reference measure. Such a solution exhibits a probably-approximately-correct guarantee for the ERM problem independently of whether the latter possesses a solution. For a fixed dataset and under a specific condition, the empirical risk is shown to be a sub-Gaussian random variable when the models are sampled from the solution to the ERM-RER problem. The generalization capabilities of the solution to the ERM-RER problem (the Gibbs algorithm) are studied via the sensitivity of the expected empirical risk to deviations from such a solution towards alternative probability measures. Finally, an interesting connection between sensitivity, generalization error, and lautum information is established.

Le problème de minimisation du risque empirique (ERM) avec régularisation d'entropie relative (ERM-RER) est étudié sous l'hypothèse que la mesure de référence est une mesure $\sigma$-finie, et pas nécessairement une mesure de probabilité. Sous cette hypothèse, qui conduit à une généralisation du problème ERM-RER permettant une plus grande flexibilité pour l'incorporation des connaissances antérieures, de nombreuses propriétés pertinentes sont énoncées. Parmi ces propriétés, la solution à ce problème, si elle existe, se révèle être une mesure de probabilité unique, mutuellement absolument continue avec la mesure de référence. Une telle solution présente une garantie probablement-approximativement-correcte pour le problème ERM indépendamment du fait que ce dernier possède ou non une solution. Pour un ensemble de données fixe, et sous une condition particulière, le risque empirique s'avère être une variable aléatoire sous-gaussienne lorsque les modèles sont échantillonnés à partir de la solution au problème ERM-RER. Les capacités de généralisation de la solution au problème ERM-RER (l'algorithme de Gibbs) sont étudiées via la sensibilité de la valeur espérée du risque empirique aux déviations d'une telle solution vers des mesures de probabilité alternatives. Enfin, un lien intéressant entre la sensibilité, l'erreur de généralisation et l'information lautum est établi.

Mots clés

Relative Entropy Empirical Risk Minimization Gibbs Measure Gibbs Algorithm Generalization Sensitivity Supervised Learning PAC-Learning Regularization

Apprentissage Supervisé Apprentissage PAC Régularisation Entropie Relative Minimisation du Risque Empirique Mesure de Gibbs Algorithme de Gibbs Généralisation Sensitivité

Domaines

Machine Learning [stat.ML] Intelligence artificielle [cs.AI] Théorie de l'information [cs.IT] Apprentissage [cs.LG] Théorie de l'information et codage [math.IT]

Fichier principal

INRIA-RR9454.pdf (1.29 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

Samir M. Perlaza : Connectez-vous pour contacter le contributeur

https://hal.science/hal-03560072

Soumis le : mardi 27 février 2024-08:09:11

Dernière modification le : jeudi 11 avril 2024-21:50:02

Dates et versions

hal-03560072 , version 1 (07-02-2022)

hal-03560072 , version 2 (21-02-2022)

hal-03560072 , version 3 (21-07-2022)

hal-03560072 , version 4 (10-08-2022)

hal-03560072 , version 5 (12-07-2023)

hal-03560072 , version 6 (21-11-2023)

hal-03560072 , version 7 (27-02-2024)

Licence

Paternité

Identifiants

HAL Id : hal-03560072 , version 7

Citer

Samir M. Perlaza, Gaetan Bisson, Iñaki Esnaola, Alain Jean-Marie, Stefano Rini. Empirical Risk Minimization with Relative Entropy Regularization. [Research Report] RR-9454, Inria. 2022. ⟨hal-03560072v7⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-RENNES1 INRIA IRISA INRIA-RRRT INRIA2 LARA UR1-MATH-STIC UR1-UFR-ISTIC UPF 35430 UNIV-COTEDAZUR UNIV-RENNES UR1-MATH-NUM

609 Consultations

770 Téléchargements