Retour vers la page d'accueil
Vers ICAR
Accueil > Confection
Imprimer

Confection

Une fois recueillies sur le terrain, les données audio ou vidéo ne sont pas directement exploitables : elles doivent subir une série d'opérations qui en font des objets d'analyse et permettent leur traitement informatique.

Ces opérations comprennent plusieurs étapes fondamentales :

- la numérisation : afin de pouvoir être lues, transcrites, annotées et alignées, les données primaires doivent être numérisées dans des formats informatiques adaptés à leur exploitation et à leur stockage.

- l’anonymisation : elle vise à effacer ou à remplacer les informations qui pourraient permettre d’identifier les locuteurs enregistrés dans les données primaires comme dans les données secondaires. L’anonymisation est une opération délicate, régie par des principes qui permettent à la fois de respecter le droit de la personne et de préserver l’objet d’étude

- la transcription : les informations accessibles dans les données primaires sont représentées sous forme de notations textuelles, rendant compte notamment de la temporalité des phénomènes. Cette opération, régie par différents principes et conventions, est essentielle dans la mesure où les requêtes automatisées sont aujourd'hui effectuées à partir de la transcription alignée avec le signal audio/vidéo.

- l’alignement : la transcription ne saurait avoir de sens indépendamment de sa source, le signal. Cette relation étroite entre la donnée primaire et la donnée secondaire est garantie par l’alignement du texte et du signal, à l’aide de balises temporelles.

- la conversion : la question de compatibilité et d’interopérabilité des formats est centrale pour les opérations successivement effectuées sur les corpus. Ces opérations nécessitent l'utilisation de différents logiciels qui souvent ont leur propre format, ce qui rend les conversions indispensables.

 

Pour citer cette page : groupe ICOR 2006, titre de la page, site CORINTE
http://icar.univ-lyon2.fr/projets/corinte/