Les forums, les réseaux sociaux, les commentaires et même les réponses aux sondages sont de nos jours un moyen d’obtenir de précieuses informations sur les besoins et les avis des consommateurs.
Empreints d’ émotions et de sentiments , les retours textuels sur internet permettent de déterminer le niveau d’appréciation des utilisateurs. Qu’il soit positif, négatif ou neutre, il est toujours bon de le prendre en compte lorsque l’on veut investir une nouvelle part de marché ou conforter nos choix.
La grande valeur de ces données n’est souvent pas assez exploitée par les entreprises, elles représentent pourtant une mine d’or ! L’analyse de sentiments permet d’établir des
rapports précis
, en un temps plus court qu’une étude de marché et en évitant toute
partialité
. De ce fait, on obtient rapidement un score et un verdict global, complet et cohérent.
Mais comment transformer ces données en informations significatives ? Voici quelques pistes et le
cas pratique
d’une analyse de sentiments réalisée pour l’application Run Advisor, une application de running créée à Clermont-Ferrand.
Contrairement aux études de marché classiques qui ont essentiellement pour objectif d’atténuer les risques commerciaux et marketing pris par une entreprise, les études de Data Marketing ont pour objectif d’anticiper le comportement du marché face à de nouvelles propositions que pourrait formuler un acteur.
Ces études se basent sur une utilisation des données consommateurs et sur l’ automatisation de l’exploitation de ces dernières, raison pour laquelle on évoque souvent le terme d’études “ data driven ” (conduites par la donnée).
Afin de préparer l’analyse de sentiments chez Run Advisor il nous a d’abord fallu réaliser un
scraping
puis une
vectorisation
.
Si nous voulons définir le scraping de façon simple nous pourrions dire que c’est le fait de pouvoir recopier, capter et télécharger le code source des sites internet et ainsi récupérer, dans ce code, le texte qui nous intéresse (comme les commentaires sur une page d’un réseau social ou les messages sur un forum).
Pour Run Advisor, les données captées représentent notre matière brute. Nous les récupérons sur un forum ayant pour thème des problématiques de running. Sur ce forum, le but est de récupérer uniquement le
texte
des messages via le code source et la
date
pour ensuite consigner toutes ces informations dans un fichier structuré.
C’est ensuite qu’arrive le
deep learning
et la partie
vectorisation
des mots.
Cette étape consiste à ingérer l’ensemble des données afin d’obtenir un algorithme avec des scores de similarité . Ce score se situe entre 0 et 1, 0 représentant une similarité faible et 1 une forte similarité. Il nous permet de savoir si les sujets étudiés ont un fort intérêt pour les utilisateurs et s' ils représentent une opportunité de positionnement pour les entreprises.
La vectorisation des mots (
word embedding
en anglais) est une méthode d’
apprentissage automatique
de représentation des mots. Chaque mot sera converti en un
vecteur de nombres
(en plusieurs dizaines de dimensions). Plus les vecteurs de deux mots seront proches, plus nous pourrons considérer qu’ils sont corrélés. Ce type de rapprochement permettra d’affiner le lien entre les deux mots étudiés (synonyme, lien hiérarchique, etc…).
Dans l’exemple ci-dessus, nous pouvons remarquer que les couples de mots (<king>,<men>) et (<queen>,<woman>) sont semblables.
L’algorithme de vectorisation des mots nous permettra de constater que si nous soustrayons au vecteur <king> le vecteur <men> puis lui additionnons <woman>, nous obtiendrons le vecteur <queen> :
<king> - <man> + <woman> = <queen>
Cet exemple simpliste nous montre l’intérêt de la vectorisation des mots, qui nous permet ici de déduire le lien entre le mot
King
et le mot
Queen
.
Pour cette mission, l’algorithme utilisé était
word2vec
(lien arXiv, Mikolov et al.)
Une autre application est la recherche de proximité (similarité contextuelle) entre deux mots, pour retrouver notamment ce que les personnes assimilent le plus à un mot donné.
On n’y penserait pas directement mais une des principales limites et difficulté de l’analyse de sentiments réside dans les erreurs d’ orthographe et de syntaxe . Comme dans toute étude data driven , il faut bien prendre en compte le fait que la donnée se situe sur un forum et que ce type de fautes sont monnaie courante et elles sont à prendre en compte lors de la vectorisation .
Une des solutions pour pallier ce problème est la
tokenisation
. Cette technique consiste à remplacer un verbe sous toutes ses formes conjuguées par sa forme à l’infinitif. On nettoie et garde ainsi un contenu plus clair et digeste pour l’algorithme.
Plus la donnée est mauvaise, plus ce travail sera compliqué et le résultat approximatif.
Concernant les avantages, contrairement à une étude qualitative - pour laquelle on doit faire venir des personnes qui devront être rémunérées - une analyse de sentiments supprime les risques de biais dans les résultats. En effet, lors d’une étude data driven, on étudie des messages bruts issus d’un forum où les utilisateurs parlent librement. Comparativement, le coût d’une analyse de sentiments sera logiquement réduit par rapport à une étude de marché plus classique.
Il n’y a d’ailleurs pas de secteur d’activité mieux qu’un autre pour effectuer une analyse de sentiments, ce n’est pas le secteur qui importe mais la donnée initiale, au-delà de sa qualité.
Aujourd'hui, l'application propose des milliers d' itinéraires , d' événements , de restaurants , d' hébergements mais aussi de chaussures et des magasins spécialisés adaptés aux coureurs. Ainsi, il compile toutes les informations clés pour tous les types de coureurs. L’application permet à chacun de trouver son bonheur que ce soit à proximité de son domicile où lors de ses déplacements.
Run Advisor nous a sollicité pour mener une étude hybride entre l’ analyse de sentiments (centrée autour des commentaires et/ou critiques de consommateurs) et l’ analyse de tendances (centrée sur les réseaux sociaux).
L’étude devait être centrée sur des sujets précis :
Pour Mathieu Fillion, un des créateurs de l’application, l’intervention d’Agaetis a permis d’avoir une approche plus scientifique , pour lui “ cette approche plus statistique est rassurante et permet de s’appuyer sur des chiffres lors des levées de fonds. S’appuyer sur la data permet de mieux cerner les besoins des clients avec des valeurs basées sur des faits réels ”.
Pour toute l’équipe de Run Advisor, l’intervention a permis de confirmer qu’ils étaient bien en phase avec les
besoins du marché
mais également de prioriser leurs sujets.
“ Dans sa globalité l’analyse allait dans notre sens ce qui nous a permis de conforter nos choix et de continuer d’avancer avec plus de certitudes sur notre positionnement et l’intérêt de notre solution .”
L’analyse de sentiments leur a d’ailleurs permis d’apporter des changements dans l’ UX ( user experience ou expérience utilisateur ) de l’application. Certaines catégories du site ont été mises plus en avant que d’autres en fonction des résultats pour mieux répondre aux besoins des utilisateurs.
Aujourd’hui Run Advisor comptabilise plus de
15.000 téléchargements
,
2.000 utilisateurs
par mois,
3.500 événements
et
parcours
, un large panel d’hébergements disponibles tout comme un large éventail de références de chaussures à la vente et
25 partenaires
.
L’ambition est d’atteindre plus de 100.000 utilisateurs et de continuer à favoriser l’ industrie locale auvergnate et française.
Les utilisations de l’analyse de sentiments sont à la fois vastes et puissantes. La possibilité d’extraire des informations à partir des données disponibles sur internet pour mieux comprendre les attitudes des consommateurs et s'adapter est un outil très intéressant pour les entreprises à la recherche de réponses rapides et précises.
Les
indicateurs de performances
traditionnels comme les vues, les partages, les clics, les likes ou les commentaires se concentrent sur le nombre. L’analyse de sentiments va au-delà de la
quantité
, car elle se concentre sur la
qualité
des interactions.
Merci de nous avoir contactés.
Nous reviendrons vers vous dès que possible.
Oups ! Une erreur s'est produite lors de l'envoi de votre message.
Veuillez réessayer plus tard.