Abstract
Notre expérience de constitution d’une base de données orale (au sein du Groupe aixois de recherches en syntaxe) nous a servi à constituer, à la fin des années 90, une base de données d’écrits scolaires manuscrits (élèves de 5 à 11 ans). L’article rend compte des questions inhérentes à la constitution d’un tel corpus : du recueil de données à leur transcription et à leur édition. Si les méthodes d’analyse de l’oral peuvent résoudre certains des problèmes rencontrés, elles ne peuvent le faire sur l’ensemble des textes. En effet, les écrits des élèves comportent des spécificités linguistiques qui interrogent les conventions de transcription et des décisions sont à discuter au sein de la communauté scientifique, comme nous le montrerons en nous appuyant sur des textes de jeunes élèves (6 à 8 ans).