Analyse textuelle et sémantique
La partie Analyse textuelle et sémantique permet de traiter des questions ouvertes et des textes issus de sources externes (internet, réseaux sociaux,…). Les méthodes et technologies d’analyse de Sphinx iQ2 permettent d’effectuer différents types de traitements, au travers de trois protocoles. Tous ces protocoles vont vous aider à repérer rapidement les thématiques et à comprendre le sens du corpus étudié.
- Protocole d’Exploration
Permet de prendre connaissance du corpus de manière détaillée et de « fouiller le texte » très rapidement en bénéficiant de toutes les ressources de l’analyse lexicale, sémantique et statistique.
- Protocole de Codification
Permet la construction automatique ou manuelle d’une grille de thématique permettant de coder un corpus. La codification permet de classer les observations selon leurs thématiques et d’en extraire des données statistiques.
- Protocole de Synthèse
Propose différentes synthèses permettant d’expliquer de quoi parle le texte (concepts), de quelle manière on en parle (opinions positives / négatives), et quelle est l’influence d’un contexte donné. Ces synthèses permettent de prendre rapidement connaissance des thématiques et orientations principales du corpus, en très peu de temps et avec peu d’efforts.
Gestion multilingue : Les fonctionnalités lemmatisation, orientations, sentiments sont utilisables en anglais (NB : toutes les observations doivent être en anglais).
Découvrez les différents environnements de l'analyse textuelle et sémantique
Trouvez ici un glossaire des termes utilisés dans le cadre de l'analyse textuelle.
Généralités
- La lemmatisation est le procédé consistant à ramener les différentes formes d'un même mot à sa forme canonique ou lemme (singulier, masculin pour les noms et adjectifs ; infinitif pour les verbes). Il est à la base de l'analyse lexicale qui conduit à prendre connaissance d'un texte à partir de son lexique. Mais un mot peut avoir plusieurs significations différentes (polysémie) et une même signification correspondre à différents mots (synonymie).
- L'analyse sémantique permet de dépasser cet écueil en définissant les conditions nécessaires pour passer du lexique au sens (idée, concept,...). Elle fait appel aux notions de thésaurus, d'ontologie ou dictionnaire et de réseau sémantique.
- Un thésaurus définit un ensemble de significations, idées / concepts et les organise suivant une nomenclature arborescente qui va du général au particulier.
- Une ontologie ou un dictionnaire est un ensemble d'éléments qui définissent une notion. Ici, il s'agit d'un ensemble de mots (sous leur forme lemmatisée) qui renvoie à une signification et donc une feuille du thésaurus.
- Un réseau sémantique est un ensemble de relations entre éléments signifiants (mot d'un corpus ou signification d'un thésaurus) conduisant à préciser le sens de ces éléments en fonctions des éléments auxquels ils se trouvent reliés. Ainsi le mot avocat renvoie à une signification différente selon qu'il est associé à "salade", "manger", "assaisonnement" ou qu'il est relié à "tribunal", "juge", "droit".
- Un sentiment est une phrase ou un segment de phrase caractérisé par : son type (conseil, jugement, sentiment, opinion), sa catégorie (recommandation, suggestion, évaluation, peur…), son intensité (1 à 3), son orientation (positive, négative)
- La variable de contexte permet de comprendre les différences entre les répondants. Elle permet de segmenter le corpus selon plusieurs catégories, comme l’âge, le sexe, ou son département / service ou autre. Elle doit être une variable fermée unique ou fermée échelle.
- La variable de signature permet d’identifier l'origine du texte. Elle met en évidence des caractéristiques de la personne qui s’exprime. Il est possible de sélectionner plusieurs variables de signature pour une même analyse.
- La longueur correspond au nombre de mots de la réponse, sans prendre en compte les mots-outils.
- La richesse est le nombre de mots différents dans une réponse.
- La banalité est une moyenne de fréquence des mots dans le corpus. Plus les mots sont fréquents plus la banalité sera forte
L’accès aux différents protocoles d’analyse textuelle et sémantique peut se faire de trois manières différentes :
- Depuis le panneau d'accueil,
- Sélectionnez un protocole en fonction des traitements que vous souhaitez réaliser (Synthèse, Codification, Exploration).
Depuis le bandeau, onglet Accueil :
- Depuis l’environnement de travail d’un des protocoles,
- Dans le bandeau, cliquez sur l’onglet Accueil,
- Cliquez sur le bouton correspondant au protocole souhaité (Exploration, Codification, Synthèse), dans le groupe Protocole.
Depuis les icônes de lancement rapide :
- Depuis l’environnement de travail d’un des protocoles,
- Dans la barre de titre du logiciel (tout en haut de l’écran), cliquez sur l’icône correspondant au protocole souhaité (Exploration, Codification, Synthèse).
Le bandeau de la partie Analyse textuelle est composé de trois onglets communs à tous les protocoles : Accueil, Données, Affichage.
D’autres onglets s’affichent selon le protocole d’analyse et sont décrits dans les parties relatives à ces protocoles : Corpus, Analyse de contenu, Synthèses.
Accueil
L'onglet Accueil regroupe les fonctions les plus fréquemment utilisées dans l'environnement d’analyse textuelle et sémantique.
- Le groupe Accès directs comprend des fonctions permettant d'ouvrir le panneau d'accueil ou d'autres environnements.
- Le groupe Protocoles permet de naviguer rapidement entre les différents protocoles d’analyse textuelle et sémantique (Exploration, Codification, Synthèse).
- Le bouton Changer permet de sélectionner une autre variable texte à analyser.
- Le groupe Presse-papier propose les fonctions couper, copier, coller.
- Le groupe Lexique permet d'afficher et d'éditer le lexique des mots ou des concepts.
- Le groupe Exporter permet d’exporter une analyse textuelle vers la suite Microsoft Office ou au format PDF.
- Le groupe Edition permet de lancer une recherche dans le corpus étudié.
Données
L’onglet Données permet la gestion des analyses, l’exploration des données et la création de variables lexicales.
- Le groupe Analyse permet de sélectionner une variable de contexte et une ou plusieurs variables de signature.
- Le groupe Exploration permet de visualiser le verbatim et l'analyse des sentiments (opinions positives ou négatives) du texte.
- Le groupe Indicateurs permet de créer de nouvelles variables lexicales à partir de l’analyse lexicale.
- Le groupe Transformer permet d’éclater l’enquête en changeant d’unité statistique.
Affichage
L’onglet Affichage permet de gérer l'affichage des différents éléments et leur disposition à l'écran.
Le groupe Afficher sert à choisir les éléments qui apparaîtront à l’écran dans le panneau latéral gauche (lexique, strates, langues).
Le groupe Disposition permet de sélectionner l’affichage normal ou plein écran.