Textométrie, sentiment analysis et subjectivité
La conférence de Bruno Falissard sur l’évaluation des
médicaments https://www.youtube.com/watch?v=gaa2NAuerVY, m'a donné à réfléchir sur plusieurs points :
Pour résumer son
propos,
Notre approche de la santé, est profondément marquée par le
dualisme corps/esprit de Descarte, et l'approche positiviste mécaniste du
XIXème (Claude Bernard).
L'essai randomisé est la méthode "gold standard"
d'évaluation des médicaments. Mais cette approche a des limites pour aborder la
perception subjective du patient, les effets positifs et négatifs, les effets
secondaires.
1. La nécessité
d'évaluer les effets subjectifs :
Je vais enfoncer des portes ouvertes, mais bon :
Comment appréhender les effets subjectifs ( d'un médicament, d'une thérapie, d'un bon vin....) ?
Comment appréhender les effets subjectifs ( d'un médicament, d'une thérapie, d'un bon vin....) ?
Oublions un moment les données physiologiques, les IRMf...
Il nous reste les enquêtes. Celles-ci sont maintenant bien
calibrées, avec des échelles de mesure, validées, des scores....
- elles sont orientées vers une ou plusieurs dimensions à
rechercher, mais ne diront rien sur ce qu'on ne cherche pas (lapalissade), les
effets non prévus
- elles sont relativement lourdes à mettre en place
- les questions fermées à choix limité ( Oui - non - nsp...)
sont réductrices.
Y-a-t-il d'autres
sources de connaissance de l'appréciation subjective (du patient) ?
Oui : le discours du
patient : la richesse de la langue et du vocabulaire est le moyen le plus
évident pour faire connaitre à l'autre ce qui est vécu en termes de sensations,
perceptions, émotions, pensées, jugements
La connaissance et l'analyse du/ des témoignages des
patients, demande du temps, et est elle-même très subjective
Les outils de textométrie sont à même d'aider à classer, hiérarchiser,
différencier, ces textes regroupés en corpus
Comme je trouve que l'analogie avec l'œnologie peut être
parlante, je vais par curiosité tenter de monter un petit corpus de
commentaires œnologiques : (si je trouve)
En effet, c'est à travers ce langage (très codifié) que
l'appréciateur tente de faire passer une expérience sensorielle, émotionnelle,
sensitive du vin, donc complètement subjective.
Je trouve le parallèle intéressant.
Un autre parallèle
pourrait se faire avec le corpus de commentaires compilés dans le raport Hite
sur l'expérience sexuelle des hommes et des femmes :
Comment faire partager à l'autre et expliquer un vécu complétement subjectif qu'est
l'orgasme par exemple ?
Ce corpus existe : Shere Hite a compilé des milliers de
témoignages écrits d'hommes et femmes de tous âges. Mais hélas je ne l'ai plus.
L'intérêt est uniquement de se familiariser avec les outils
de textométrie et les méthodes d'analyse textométrique :
Il ne suffit pas d'avoir un sac de mots (corpus) et de
secouer pour extraire uen vérité finale. Il faut construire une démarche,
procéder par étapes, un processus herméneutique :
(B.Pincemin in http://corpus.revues.org/2121#entries
)
On peut par exemple s'intéresser à la fréquence ou absence
de certains mots, et comparer par contrastes avec différentes segmentations du
corpus;
on peut partitionner ainsi un corpus en fonction d'attributs
(placés dans les métadonnées) tels que le temps (série temporelle, années,
millésimes), l'espace (bourgogne et bordeaux), l'auteur, la source... et mettre
en évidence des termes communs, des spécificités....
2. l'évaluation des
effets positifs et négatifs :
Cela me fait profondément penser aux outils et méthodes plus
souvent rencontrées dans le domaine du marketing, basés sur le sentiment
analysis :
Ca me semble plus basique et simple à appréhender :
Les commentaires des clients et retours d'expériences sont
analysés par les grandes sociétés telles que les compagnies d'aviation, les
grandes marques alimentaires ou high-tech :
Des milliers de personnes expriment sur des blogs leurs expériences,
ressentis, satisfactions ou mécontentements. Avec des mots, des onomatopées,
des émoticônes.....
Ces mots sont classés, éventuellement corrigés ou
lemmatisés. Un vocabulaire standard de mots représentant des affects positifs
ou négatifs a été mis en place et un score positif, neutre ou négatif est
affecté à ces mots dans un dictionnaire (sentiwordnet http://sentiwordnet.isti.cnr.it/ )
par simple association dans une base de données, les mots du corpus des clients
sont associés au dictionnaire, et pondérés. un score final, voire mieux, un
grave de dispersion du score peut démontrer une appréciation globale du produit,
marque ou service..
Là encore, ça semble très empirique, et on peut se demander
quelle dimension représente l'échelle finale de score (c'est peut-être là qu'on peut construire des scores selon
différents dimensions).
J'ai récupéré un dictionnaire anglais que j'ai traduit par
Translator : il reste des corrections à faire.
Enfin, il existe
autre source d'informations du vécu subjectif et émotionnel du patient, et
non verbale cette fois :
L’expression non verbale du visage et du corps (peur, colère,
dégout, surprise, tristesse, joie...) mais c'est un autre sujet.
Aucun commentaire:
Enregistrer un commentaire