Thresholding Bandit for Dose-ranging: The Impact of Monotonicity - Université Toulouse III - Paul Sabatier - Toulouse INP Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2018

Thresholding Bandit for Dose-ranging: The Impact of Monotonicity

Résumé

We analyze the sample complexity of the thresholding bandit problem, with and without the assumption that the mean values of the arms are increasing. In each case, we provide a lower bound valid for any risk δ and any δ-correct algorithm; in addition, we propose an algorithm whose sample complexity is of the same order of magnitude for small risks. This work is motivated by phase 1 clinical trials, a practically important setting where the arm means are increasing by nature, and where no satisfactory solution is available so far.
Fichier principal
Vignette du fichier
main.pdf (420.89 Ko) Télécharger le fichier
threshold_bandit_hall.pdf (427.88 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01629479 , version 1 (06-11-2017)
hal-01629479 , version 2 (18-07-2018)

Identifiants

Citer

Aurélien Garivier, Pierre Ménard, Laurent Rossi, Pierre Ménard. Thresholding Bandit for Dose-ranging: The Impact of Monotonicity. 2018. ⟨hal-01629479v2⟩
304 Consultations
312 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More