Retour vers la page d'accueil
Vers ICAR
Accueil > Standardisation
Imprimer

Standardisation

Pour garantir l'interopérabilité des métadonnées :

- un export des données en Dublin Core/OLAC à des fins d'archivage est disponible avec la fonction 'Consulter les métadonnées en Dublin Core/OLAC'; elle concerne les corpus, les enregistrements et les transcriptions avec la quinzaine de descripteurs régis par la norme
- un export des données en TEI (P5) permettant de décrire l'ensemble des métadonnées est disponible avec la fonction 'Consulter les métadonnées en TEI(P5)'

Pour garantir l'interopérabilité des transcriptions :

- un export de la transcription est disponible avec la fonction 'Exporter la transcription en TEI (P5)'

 

Caractéristiques de l'export en TEI

Les principales différences entre le balisage propre à CLAPI (cf Balisage des transcriptions) et celui proposé en TEI portent actuellement sur les points suivants :

1. Les pauses

En TEI, une pause est soit courte, soit longue, soit moyenne, soit quantifiée et apparaît en tant qu'événement.
Dans CLAPI, une pause quantifiée est elle aussi soit courte soit longue, selon un paramètre 'seuil de pause' propre à une transcription donnée, pour effectuer des requêtes fines (pause courte/pause longue). Par ailleurs, la représentation graphique de la pause est conservée en plus de l'événement 'pause' pour être affichée quand les résultats sont présentés à l'utilisateur, mais aussi pour permettre des requêtes précises sur la forme (..) par exemple.

2. Forme d'origine dans la transcription

Par souci de respecter au plus près le travail du transcripteur, les tokens ainsi que les phénomènes seront toujours affichés dans leur représentation graphique d'origine, dans les résultats des outils. Par exemple, si on rencontre le token eu::::h dans une transcription, on sera bien sûr capable de rapprocher cette attestation lors d'une requête sur le token générique euh mais on affichera les résultats en conservant le forme originale eu::::h. En TEI, on utilisera la balise <orig reg="euh">eu::::h</orig>

3. Chevauchement pendant la production d'un token

Pour certaines transcriptions, le chevauchement est indiqué de manière très précise à l'intérieur d'un token sou[lever, en TEI il sera ramené avant le token mais la forme d'origine sera conservée lors de l'affichage des résultats pour ne pas appauvrir la transcription

4. Alignement des chevauchements

Dans certaines transcriptions, le transcripteur aligne physiquement le signe de chevauchement au moyen avec le caractère 'espace' pour le placer dans la même "colonne" des tours de parole. Clapi a donc défini une balise pour restituer cet alignements avec des espaces dans une police de caractères non proportionnelle pour éviter les distorsions.

En TEI, un tel alignement sera traduit par des balises de type ancres (anchor) avec une propriété synch pour les synchroniser car nous ne disposons pas toujours du timecode de chaque chevauchement. Clapi extrapolera ainsi la représentations graphique des chevauchements pour reconnaître les segments chevauchants des segments chevauchés et pouvoir les associer et produire les balises de TEI correspondantes.

5. Descriptions, commentaires, gestes...

Le découpage tel qu'il est effectué dans la TEI pose des problèmes dans le domaine de l'interaction où les gestes sont définis de manière très fine. Pour le moment, il a été choisi de placer l'ensemble des descriptions dans la même balise "desc" plutôt que d'introduire des erreurs par un choix arbitraire qui serait par définition faux.

 

 

Pour citer cette page : groupe ICOR 2006, titre de la page, site CORINTE
http://icar.univ-lyon2.fr/projets/corinte/