Vers des systèmes de recommandation robustes pour la navigation Web : inspiration de la modélisation statistique du langage - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Thèse Année : 2010

Towards Robust Recommender Systems for Web Navigation: Inspiration from Statistical Language Modeling

Vers des systèmes de recommandation robustes pour la navigation Web : inspiration de la modélisation statistique du langage

Geoffray Bonnin

Résumé

The goal of this thesis is to enhance the quality of the recommender systems for Web navigation by using sequentiality. The notion of sequentiality has been widely studied in the frame of Web recommendation. Such studies usually attempt to provide a trade-off between accuracy, space and time complexity, and coverage. Two extra problems are the presence of noise within the sessions of navigations (navigation mistakes, pop-ups, etc.), and parallel browsing. Most of the models that have been proposed in the literature either exploit low size contiguous sequences and are not robust to noise, or discontiguous sequences and induce large time and space complexities. This last problem can be lowered by performing a selection of sequences in order to lower space complexity, but this results in a coverage problem. Last, to the best of our knowledge, parallel browsing has never been studied in the frame of recommendation. The challenge of this thesis is thus to propose new sequential algorithms that have the five following characteristics: (1) a good precision of recommendations, (2) a good robustness to noise, (3) the ability to take into account parallel browsing, (4) a high coverage and (5) a low time and space complexity. In order to complete this challenge, we take inspiration from Statistical Language Modeling (SLM). Indeed, the general characteristics of Web navigation are very close to those of natural language. SLM dates back to a longer time than recommender systems and have widely proved their accuracy and efficiency. Moreover, most of the statistical language models that have been proposed take into account sequences. We thus investigated the exploitation of models used in language modeling and adapted them to the specific constraints of Web navigation.
Le but de cette thèse est d'améliorer la qualité des systèmes de recommandation pour la navigation Web en utilisant la séquentialité des actions de navigation des utilisateurs. La notion de séquentialité a déjà été étudiée dans ce contexte. De telles études tentent habituellement de trouver un bon compromis entre précision, complexité en temps et en mémoire, et couverture. De plus, le Web a cela de particulier que du bruit peut être contenu au sein des navigations (erreurs de navigation, apparition de pop-ups, etc.), et que les utilisateurs peuvent effectuer des navigations parallèles. La plupart des modèles qui ont été proposés dans la littérature exploitent soit des suites contiguës de ressources et ne sont pas résistants au bruit, soit des suites discontiguës de ressources et induisent une complexité en temps et en mémoire importantes. Cette complexité peut être réduite en effectuant une sélection sur les séquences, mais cela engendre alors des problèmes de couverture. Enfin à notre connaissance, le fait que les utilisateurs puissent effectuer des navigations parallèles n'a jamais été étudié du point de vue de la recommandation. La problématique de cette thèse est donc de proposer un nouveau modèle séquentiel ayant les cinq caractéristiques suivantes : (1) une bonne précision de recommandation, (2) une bonne résistance au bruit, (3) la prise en compte des navigations parallèles, (4) une bonne couverture (5) et une faible complexité en temps et en mémoire. Afin de répondre à cette problématique, nous nous inspirons de la Modélisation Statistique du Langage (MSL), qui a des caractéristiques très proches de celles de la navigation Web. La MSL est étudiée depuis beaucoup plus longtemps que les systèmes de recommandation et a largement prouvé sa précision et son efficacité. De plus, la plupart des modèles statistiques de langage qui ont été proposés prennent en compte des séquences. Nous avons donc étudié la possibilité d'exploiter les modèles utilisés en MSL et leur adaptation aux contraintes spécifiques de la navigation Web.
Fichier principal
Vignette du fichier
these.pdf (1.01 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00581331 , version 1 (01-04-2011)

Identifiants

  • HAL Id : tel-00581331 , version 1

Citer

Geoffray Bonnin. Vers des systèmes de recommandation robustes pour la navigation Web : inspiration de la modélisation statistique du langage. Informatique [cs]. Université Nancy II, 2010. Français. ⟨NNT : ⟩. ⟨tel-00581331⟩
484 Consultations
3726 Téléchargements

Partager

Gmail Facebook X LinkedIn More