Abstract
Dans cet article, nous présentons et discutons de notre méthodologie pour la constitution d’un « petit corpus » comparatif de narration orale en occitan. Il s’agit d’un « petit corpus » nouveau et unique, dans une langue minorisée, ce qui soulève un certain nombre de défis particuliers : la complexité des rapports entre l’écrit et l’oral dans la pratique du conte d’une part, et d’autre part, de nombreuses difficultés méthodologiques (variations diatopique, diachronique et sociolinguistique ; absence de données numérisées ; outils de traitement automatique des langues en cours de développement). Cet article propose non seulement une méthodologie pour la constitution d’un corpus permettant d’explorer divers degrés d’oralité, mais contribue aussi plus globalement au débat sur la problématique des « petits corpus » pour les langues minorisées.