Bandit Theory meets Compressed Sensing for high dimensional Stochastic Linear Bandit - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Rapport (Rapport Technique) Année : 2012

Bandit Theory meets Compressed Sensing for high dimensional Stochastic Linear Bandit

Alexandra Carpentier
  • Fonction : Auteur
  • PersonId : 910455
Rémi Munos
  • Fonction : Auteur
  • PersonId : 836863

Résumé

We consider a linear stochastic bandit problem where the dimension $K$ of the unknown parameter $\theta$ is larger than the sampling budget $n$. In such cases, it is in general impossible to derive sub-linear regret bounds since usual linear bandit algorithms have a regret in $O(K\sqrt{n})$. In this paper we assume that $\theta$ is $S-$sparse, i.e.~has at most $S-$non-zero components, and that the space of arms is the unit ball for the $||.||_2$ norm. We combine ideas from Compressed Sensing and Bandit Theory and derive algorithms with regret bounds in $O(S\sqrt{n})$.
Fichier principal
Vignette du fichier
SparseBanditsAISTATS.pdf (1.22 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-00659731 , version 1 (13-01-2012)
hal-00659731 , version 2 (16-05-2012)

Identifiants

Citer

Alexandra Carpentier, Rémi Munos. Bandit Theory meets Compressed Sensing for high dimensional Stochastic Linear Bandit. [Technical Report] 2012. ⟨hal-00659731v2⟩
342 Consultations
304 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More