Retour vers la page d'accueil
Vers ICAR
Accueil > Intégration > Décrire le corpus > Composition
Imprimer

La composition d'un corpus

– les enregistrements (audio ou vidéo), parfois accompagnés d'éléments prélevés dans la situation (documents produits ou utilisés par les participants) : ce sont les données primaires ;

– les représentations réalisées de ces données primaires, notamment les différentes formes de transcriptions, accompagnées de leurs conventions de transcription ; éventuellement, les notes de terrain du collecteur : ce sont des données secondaires.
La conception d'une base de données a conduit à créer et à définir deux autres entités qu'il importe de définir précisément (chacune d'entre elles étant susceptible, dans certains contextes, d'être désignée par le terme " corpus "). Ces entités construites à partir de l'objet source qu'est le corpus tel qu'il est défini ci-dessus sont : les unités documentaires de la base CLAPI ; les pièces archivées dans la médiathèque CLAPI.
On distinguera donc clairement a) le corpus et b) les entités matérialisées et instanciées dans les banques de données et dans les archives. Ces dernières (les unités documentaires de la base CLAPI ; les pièces archivées dans la médiathèque CLAPI) ne sont pas nécessairement organisées par rapport à la définition du corpus donnée ci-dessus, et ne doivent pas être confondues avec elle.
Les sous-corpus ou collections (c'est-à-dire les sous-ensemble de corpus constitués à des fins de recherche et en réponse à une question particulière, qui dans certains champs de recherche sont, eux aussi, appelés "corpus") ne sont pas répertoriés dans la base, ni identifiés en tant que corpus.

– L'unité documentaire simple
Dans la base CLAPI, l'unité documentaire simple comprend le corpus (objet source) et deux autres types d'éléments :

a) des éléments obligatoires :

- une grille de descripteurs (descripteurs CLAPI consultables en ligne);
- les conventions de transcription ;
- une bibliographie des études effectuées sur ce corpus.

b) des éléments facultatifs

- un échantillon des données primaires et des données secondaires, en accès libre
- un extrait plus conséquent des données primaires et des données secondaires, non téléchargeable mais requêtable librement

L'architecture d'un corpus peut être représentée comme suit :

 

 
 

Pour citer cette page : groupe ICOR 2006, titre de la page, site CORINTE
http://icar.univ-lyon2.fr/projets/corinte/