Retour vers la page d'accueil
Vers ICAR
Accueil > Confection > Alignement
Imprimer

Alignement

Définition

Le terme d’alignement désigne l’association d’un ensemble de données avec un autre.
Dans le domaine des corpus oraux, le terme d’alignement concerne l’association d’un segment de données « secondaires » numérisées – notamment des transcriptions – aux données « primaires » qui lui correspondent : un signal audio, vidéo, textuel, etc. numérisé. Les relations entre ces ensembles de données, ainsi que leur nature, peuvent varier considérablement.

Finalité des procédures d’alignement

Le recours à des outils d’alignement a été central pour le développement des différentes approches linguistiques basées sur des données audio et vidéo. En effet, ils visent à créer un lien direct entre l’audition / visualisation du signal et les notations. Ils constituent ainsi des outils de transcription, d’analyse et d’édition de données, en facilitant la précision de ces opérations et en en favorisant le contrôle intersubjectif.

Outils d’alignement utilisés pour des corpus oraux

La réalisation d’alignements de ce type présuppose donc un outillage informatique, c’est-à-dire un logiciel comportant un lecteur de signal audio ou vidéo couplé avec un éditeur de texte. Ces logiciels permettent de ‘découper’ le signal en segments au moyen de balises identifiant des points temporels sur le signal complet. Les segments ainsi définis peuvent être associés – c’est-à-dire alignés – avec des segments de notation, issus des logiciels de transcription (images d’écrans de transcriptions alignées).
Dans la majorité des cas, l’alignement est réalisé manuellement sur les corpus en cours de constitution. Il est toutefois possible d’aligner ex post des corpus déjà transcrits sur un support papier ou informatique.
Dans tous les cas, l’alignement est une opération qui implique un coût élevé en temps de travail.

Parmi les logiciels intéressants à ce propos, citons les suivants :


Phonétique segmentale
et supra-segmentale

Praat (description du logiciel)
Winpitch (lien vers le site de l'éditeur)


 Phénomènes non verbaux

Signstream (lien vers le site de l'éditeur)
Elan (description du logiciel)
Anvil (description du logiciel)

Morphologie et syntaxe

Shoebox (lien vers le site de l'éditeur)
TreeTagger (lien vers le site de l'éditeur)
Cordial (lien vers le site de l'éditeur)
Clan (description du logiciel)

Logiciels multifonctionnels (et analyse en pragmatique au sens large du terme)

Clan (description du logiciel)
Elan (description du logiciel)
Anvil (description du logiciel)
Exmaralda (description du logiciel)
TASX (description du logiciel)
Transana (description du logiciel)

Autres logiciels (non catégorisés et non décrits)

Annotate : http://registry.dfki.de/sections.php3?f_mainsection=8&f_section=43&f_sy
ATLAS  : http://www.mpi.nl/ISLE/documents/papers/ide-brew-lrec00.pdf
Audiamus  : http://www.linguistics.unimelb.edu.au/thieberger/audiamus.htm
Callisto : http://registry.dfki.de/sections.php3?f_mainsection=8&f_section=43&f_system=434
Ellogon : http://registry.dfki.de/sections.php3?f_mainsection=8&f_section=43&f_system=381
EUDICO : http://www.mpi.nl/ISLE/documents/papers/brugman%20-%20Eudico%20paper.pdf
FIELD : http://emeld.org/tools/field/beta/field-intro.html
IBM MPEG-7 Annotation Tool : http://www.alphaworks.ibm.com/aw.nsf/techs/videoannex
Onze Miner : http://www.ling.canterbury.ac.nz/jen/onzeminer/
MediaTagger  : http://www.mpi.nl/world/tg/CAVA/mt/MTandDB.html
Systemic Coder  : http://www.wagsoft.com/Coder/index.html
HIAT-DOS : http://www.daf.uni-muenchen.de/HIAT/HIAT.HTM
Transcriber : http://trans.sourceforge.net/en/features.php
Videograph : http://www.ipn.uni-kiel.de/aktuell/videograph/enhtmStart.htm

Pour un tableau de comparaison entre les logiciels cliquer ici. Une version PDF du document est également disponible en téléchargement.

Les pratiques d’alignement sont décrites précisément dans les manuels suivants :

· Manuel Praat INITIATION
· Manuel Praat Transcription ICOR
· Manuel Clan INITIATION
· Manuel Clan Transcription ICOR


Alignement de corpus audio et vidéo pour CLAPI

Les choix suivants ont guidé les opérations d’alignement pour la base CLAPI :

a) Les corpus anciens sont alignés ex post avec une application CLAPI, spécifiquement développé par le groupe ICOR pour le traitement de données dans CLAPI (cf. par exemple les corpus "Dame de Caluire", "Mode"). L’alignement prend comme entrée tout type de document texte (.doc, .txt, etc.), présuppose une préparation des documents incluant l’insertion manuelle d’un timecode (échelle : une minute pour un extrait de 7 minutes, deux minutes pour une heure) et donne lieu à un format XML comportant des balises pour un nombre restreint de catégories analytiques (Baliser). Les transcriptions des corpus patrimoniaux sont ainsi accessibles aux analyses et requêtes, les résultats étant affichés avec le signal correspondant (on parle d’affichage statique : lecture en temps réel des segments de signal et affichage statique de l ’extrait de transcription correspondant).

b) Les nouveaux corpus sont le plus souvent transcrits directement dans les logiciels d’alignement Praat, Clan et Elan, en respectant les spécifications de la Convention ICOR, éventuellement complétées par des spécifications particulières liées au logiciel d’alignement ou définies par le transcripteur (cf. par ex. les corpus PMJ, TP de Sciences). L’alignement des nouveaux corpus de CLAPI est réalisé en fonction d’une segmentation du signal en productions vocales / verbales (PV). Les transcriptions des nouveaux corpus sont ainsi affichées avec le signal par le biais d'un affichage dynamique : affichage du signal en temps réel et surlignage déroulant, segment par segment, sur la transcription. La précision de ces alignements dépend de la précision du transcripteur et de la taille des segments alignés : normalement au dixième de seconde près pour des segments d’une taille allant de quelques dixièmes de seconde à plusieurs secondes.

Le développement d’outils de conversion permettant le libre flux entre le format XML .icor et les formats propriétaires des divers logiciels d’alignement est actuellement en cours (Convertir).

A l’heure actuelle, l’application "Analyse et requêtes" (Outils) permet d’accéder, sans condition d’accès, à des extraits représentatifs de la diversité des interactions et aux transcriptions soumises à droit d’accès. Des exemples de transcriptions, alignés avec les différents logiciels, sont disponibles dans la partie "Feuilleter" de la plate-forme CLAPI.

 

Pour citer cette page : groupe ICOR 2006, titre de la page, site CORINTE
http://icar.univ-lyon2.fr/projets/corinte/