Sensolangue

Automatisation des commentaires de dégustation fournis par les consommateurs.

Responsable du projet à Changins : Pascale Deneulin

Partenaires : Haute Ecole Arc

Financement de la partie effectuée par Changins: HES-SO

2016 – 2018

Résumé

L’avis des consommateurs intéresse de plus en plus les entreprises agroalimentaires (moins cher et plus représentatif qu’un panel expert). Toutefois, l’analyse automatique de commentaires reste encore peu explorée et se fait aujourd’hui manuellement. Ce projet pluridisciplinaire vise à trouver un processus
d’automatisation intégrant des difficultés telles que le traitement de phrases comme «vin très acide mais peu amer» ou «vin présentant une belle acidité et une amertume rafraichissante». Le traitement automatique des négations et la reconnaissance de la polarité des termes en fonction de leur environnement apparaissent comme les principaux défis à relever pour proposer un outil utile dans le domaine du marketing et de l’analyse sensorielle.

Plusieurs étapes ont été mises en place durant le temps du projet.

1. Un grand nombre de commentaires de dégustation issus de professionnels et de consommateurs ont été recueillis via la plate-forme Mondovino (Coop) et diverses bases de données.

2. Deux ontologies du vin regroupant plus de 2’225 termes distincts en français et 425 termes distincts en anglais ont été créées afin de hiérarchiser et standardiser les termes et concepts du vin.

3. Les méthodes de langage naturel ont été appliquées et développées au moyen de plusieurs algorithmes d’apprentissage profond (deep machine learning) pour
analyser l’information contenu dans les commentaires recueillis.

4. L’approche développée a été entrainée et testée sur plus de 1000 commentaires de dégustation recueillis lors de tests consommateurs et labélisés par nos soins.

L’optimisation des algorithmes de machine learning appliqués au traitement de langage naturel (NLP) a montré une nette amélioration quant à l’extraction des concepts contenus dans les commentaires de dégustation, résultats supportés par des métriques classiques de machine learning. De même, la création d’une ontologie du vin conséquente et son implémentation continue permet à la fois d’améliorer l’extraction automatique mais également de diminuer la variabilité d’un traitement manuel.
Si aujourd’hui l’ontologie du vin est conséquente en français, celle en anglais mériterait d’être complétée faute de matériel disponible à la fin de ce projet. Bien que spécifique au secteur du vin, son processus de construction et l’utilisation seront transposables à tout autre domaine touchant l’avis de consommateurs (p.ex. tourisme, agro-alimentaire). La valorisation de ce projet va se poursuivre dans les prochains mois avec la publication d’articles. Une plateforme de démonstration a été mise à disposition en ligne pour valoriser les résultats.