Results for ' corpus, français, annotation, disfluences, vieillissement'

993 found
Order:
  1.  9
    Disfluencies and language aging. New corpora and tools for exploring spoken French in the VALIBEL database.Catherine T. Bolly, George Christodoulides & Anne Catherine Simon - 2016 - Corpus 15.
    Après avoir fait l’état des lieux de la base de données VALIBEL en la situant dans son contexte institutionnel, nous mettons en exergue dans cet article quelques possibilités d’investigation qu’offre la base en regard de ses évolutions récentes. Une attention particulière est portée à l’outillage des corpus en termes de disfluences (avec le programme DisMo) et à l’étude du vieillissement langagier (liée au corpus Corpage). Nous concluons en montrant en quoi l’enrichissement constant de la base (en outillage et en (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  2.  11
    Profiterole : un corpus morpho-syntaxique et syntaxique de français médiéval.Sophie Grobol Prévost - 2024 - Corpus 25.
    Le projet ANR Profiterole avait pour objectifs la constitution de ressources pour le français médiéval (9e-15e s.) : un corpus annoté en (morpho-)syntaxe et des lexiques, la conception d'analyseurs syntaxiques pour le français médiéval, le développement d’outils de diffusion et d’analyse textométrique de l’annotation syntaxique dans le contexte de la plateforme TXM, et, enfin, la modélisation de certains aspects syntaxiques de l’évolution du français. Nous commençons par décrire la constitution du corpus Profiterole en termes de choix de textes, genres et (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  3.  7
    La BFM 2022 : un corpus pour les recherches diachroniques en français médiéval et au-delà.Alexei Guillot-Barbance Lavrentiev - 2024 - Corpus 25.
    La Base de français médiéval (BFM) fait partie des corpus de français médiéval (9e-15e s.) les plus anciens et les plus utilisés par les linguistes diachroniciens et plus largement par tous ceux qui s’intéressent à l’histoire du français. Elle est le fruit d’une collaboration entre linguistes-philologues et spécialistes de la méthode textométrique implémentée dans la plateforme TXM. L’article présente un état des lieux du corpus BFM2022 focalisé sur la représentativité et l’interopérabilité des données. Il illustre l’apport des outils numériques pour (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  4.  2
    Syntactic Annotation of Old French Text Corpora.Achim Stein - 2008 - Corpus 7.
    Dans un premier temps, cette contribution fournit une présentation rapide des corpus médiévaux, principalement pour l’anglais et le français, en relation avec des projets d’annotation centrés sur l’annotation syntaxique. La seconde partie traite des aspects spécifiques de l’annotation syntaxique pour les textes d’ancien français et s’intéresse particulièrement aux interactions entre la préannotation automatique et les outils d’annotation manuelle.
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  5.  5
    Syntactic Annotation of Old French Text Corpora.Achim Stein - 2008 - Corpus 7.
    Dans un premier temps, cette contribution fournit une présentation rapide des corpus médiévaux, principalement pour l’anglais et le français, en relation avec des projets d’annotation centrés sur l’annotation syntaxique. La seconde partie traite des aspects spécifiques de l’annotation syntaxique pour les textes d’ancien français et s’intéresse particulièrement aux interactions entre la préannotation automatique et les outils d’annotation manuelle.
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  6.  15
    Le corpus PhraséoRoChe : les défis de l’établissement des textes et de l’hétérogénéité des états de la langue.Corinne Kraif Denoyelle - 2024 - Corpus 25.
    Le corpus PhraséoRoChe se centre sur le roman de chevalerie de langue française écrit en prose. Il rassemble des textes issus d’œuvres produites entre le XIIIe siècle et le XVIIe siècle, période bornée par la naissance et la disparition de ce genre textuel. Pour permettre des interrogations par le lecteur d’aujourd’hui d’un corpus outillé embrassant une diachronie aussi longue, il faut faire des choix concernant l’évolution de la langue, non seulement en traitant le décalage entre le français contemporain et la (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  7.  8
    Un corpus pour l’analyse de la variation et du changement linguistique.France Martineau - 2008 - Corpus 7.
    Cet article offre une réflexion sur la constitution de corpus pour l’analyse de la variation et du changement morphosyntaxique. Le Corpus MCVF (Modéliser le changement : les voies du français) est structuré de façon à permettre l’analyse de la variation morphosyntaxique, à travers plusieurs périodes historiques, tout en tenant compte, dans une certaine mesure, de facteurs sociolinguistiques comme la distribution sociale et régionale. Les principes qui sous-tendent la sélection des textes et leur annotation morphosyntaxique sont d’abord présentés. L’intérêt d’un corpus (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   4 citations  
  8.  10
    Vers l’annotation discursive de textes d’élèves.Claudine Garcia-Debanc, Lydia-Mai Ho-Dac, Myriam Bras & Josette Rebeyrolle - 2017 - Corpus 16.
    La contribution se propose de mettre en évidence les problèmes épistémologiques et méthodologiques posés par l’annotation discursive de productions écrites d’élèves et les choix techniques qu’implique sa mise en œuvre. Dans un premier temps, l’article montre l’intérêt scientifique de la constitution de « grands » corpus scolaires rassemblant plusieurs centaines de textes d’élèves d’école primaire et de collège de niveaux scolaires différents répondant à une même consigne. L’unicité de la consigne permet de comparer les productions en vue d’élaborer une cartographie (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  9.  8
    Annotation de textes d’états de langue anciens : pour le redéploiement de l’existant.Adam Kraif Renwick - 2024 - Corpus 25.
    Dans le cadre de la construction du corpus PhraseoRoChe, un corpus diachronique rassemblant des romans de chevalerie du 13e au 17e siècle, cet article s’intéresse aux performances de différents analyseurs (étiqueteurs, lemmatiseurs, parseurs en dépendances) entrainés sur des états de langue connexes allant de l’ancien français au moyen français et au français moderne. Nous étudions ainsi la possibilité d’étendre ces analyseurs au-delà des états de langues précis sur lesquels ils ont été entrainés, en s’appuyant notamment sur les divergences entre analyseurs (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  10.  7
    Du corpus littéraire au corpus linguistique : dématérialisation, restructuration, lectures rhizomatiques et analyses linguistiques des manuscrits.Thomas Lebarbé - 2009 - Corpus 8:221-239.
    L’auteur, responsable des aspects informatiques et linguistiques du projet « Manuscrits de Stendhal en ligne », décrit le processus de constitution d’un corpus, au sens linguistique du terme, dans le cadre d’une collaboration fortement interdisciplinaire. Il montre dans quelle mesure ce type de collaboration permet de construire un ensemble documentaire répondant aux besoins des chercheurs en littérature tout en apportant un matériau langagier riche et inédit pour le linguiste. Subséquemment, ce n’est pas l’objet de l’étude qui définit le corpus à (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  11.  18
    Un corpus pour l'analyse de la variation et du changement linguistique.France Martineau - 2008 - Corpus 7.
    Cet article offre une réflexion sur la constitution de corpus pour l’analyse de la variation et du changement morphosyntaxique. Le Corpus MCVF (Modéliser le changement : les voies du français) est structuré de façon à permettre l’analyse de la variation morphosyntaxique, à travers plusieurs périodes historiques, tout en tenant compte, dans une certaine mesure, de facteurs sociolinguistiques comme la distribution sociale et régionale. Les principes qui sous-tendent la sélection des textes et leur annotation morphosyntaxique sont d’abord présentés. L’intérêt d’un corpus (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  12.  19
    Du corpus littéraire au corpus linguistique : dématérialisation, restructuration, lectures rhizomatiques et analyses linguistiques des manuscrits.Thomas Lebarbé - 2009 - Corpus 8:221-239.
    L’auteur, responsable des aspects informatiques et linguistiques du projet « Manuscrits de Stendhal en ligne », décrit le processus de constitution d’un corpus, au sens linguistique du terme, dans le cadre d’une collaboration fortement interdisciplinaire. Il montre dans quelle mesure ce type de collaboration permet de construire un ensemble documentaire répondant aux besoins des chercheurs en littérature tout en apportant un matériau langagier riche et inédit pour le linguiste. Subséquemment, ce n’est pas l’objet de l’étude qui définit le corpus à (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  13.  7
    The ORFEO project: a study corpus for contemporary French.Christophe Benzitoun, Jeanne-Marie Debaisieux & Henri-José Deulofeu - 2016 - Corpus 15.
    L’article présente le projet ORFEO (outils pour l’étude du Français écrit et oral). Ce projet a consisté à rassembler 4M de mots de Français oral et 6M de mots d’écrit à partir de ressources existantes. Les ressources orales ont été unifiées dans un format trs et alignées avec les fichiers sons au phonème. Les corpus sont présentés avec des métadonnées qui permettent de constituer des sous-corpus d’étude. Les données orales ont été segmentées et annotées en POS et relations de dépendance (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  14.  6
    A construção de corpus de larga escala da fala bilíngue de crianças e da fala bilíngue dirigida à criança, anotado e alinhado aos arquivos de áudio: desafios, soluções e implicações para a pesquisa.Alex Lưu, Pasha Koval, Sophia A. Malamud & Irina Y. Dubinina - 2022 - Bakhtiniana 17 (4):223-261.
    ABSTRACT The BiRCh Project (The Corpus of Bilingual Russian Child Speech) involves collecting a longitudinal audio corpus of Russian spoken by children and their families in Russia, Ukraine, Germany, the U.S., and Canada. We are building a large-scale corpus based on a subset of this data, the “Parsed and Audio-aligned Corpus of Bilingual Russian Child and Child-directed Speech (BiRCh)” with two basic components: (1) 1-million-word transcripts which are time-aligned with the audio speech signal and fully textsearchable, and (2) a 500K-word (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  15.  5
    From speech archive to reference corpus: the spoken Swiss French database (OFROM).Mathieu Avanzi, Marie-José Béguelin & Federica Diémoz - 2016 - Corpus 15.
    La base de données orales de français de Suisse romande (OFROM) contient des transcriptions d’enregistrements auxquels ont participé des locuteurs nés et vivant en Suisse. Elle a été créée par des linguistes soucieux de documenter les usages oraux du français en Suisse romande, et de combler ainsi le retard dans la description des usages oraux de la langue parlée dans cette partie de la francophonie, notamment sur le plan du lexique, de la syntaxe et de la phonologie. La base de (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  16.  4
    La prédication seconde détachée en position initiale en anglais et en français.Agnès Celle & Laure Lansari - 2014 - Corpus 13:129-163.
    Nous étudions dans cet article les différentes formes de prédication seconde détachée en position initiale dans un corpus comparable composé de textes d’économie en anglais et en français. Ce corpus a été annoté sous le logiciel Analec. L’enjeu est de montrer en quoi un même phénomène syntaxique est exploité, sur le plan discursif, de façon divergente dans chacune des deux langues. Une étude qualitative et quantitative des prédications secondes du corpus montre que la prédication seconde prend le plus souvent la (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  17.  11
    Creating a Large-Scale Audio-Aligned Parsed Corpus of Bilingual Russian Child and Child-Directed Speech (BiRCh): Challenges, Solutions, and Implications for Research.Alex Lưu, Pasha Koval, Sophia A. Malamud & Irina Y. Dubinina - 2022 - Bakhtiniana 17 (4):223-261.
    RESUMO O projeto BiRCh (The Corpus of Bilingual Russian Child Speech, Corpus de fala de crianças bilíngues em russo) envolve a construção de um corpus longitudinal composto de gravações de fala em russo produzida por crianças e suas famílias na Rússia, Ucrânia, Alemanha, EUA e Canadá. Estamos construindo um corpus de larga escala com base no conjunto dessas gravações, o ‘Parsed and Audio-aligned Corpus of Bilingual Russian Child and Child-directed Speech (BiRCh)’, com os dois componentes básicos: (1) as transcrições de (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  18.  9
    De l’entorse à la norme à l’atypicité typique : Retour sur un corpus de SMS de sourds et ses métadonnées.Michel Otell - 2019 - Corela. Cognition, Représentation, Langage 27 (HS).
    Cet article revient sur un corpus de conversations par SMS entre des personnes sourdes qui présentent un bilinguisme entre le français et la Langue des Signes Française. Ce regard rétrospectif sur ce corpus, notamment sur les motifs de son cadrage, l’enquête de terrain préalable à sa collecte, le protocole de collecte en tant que telle, ou le défi que constitue son annotation, permet de discuter des avantages et des limites des positionnements qualitatifs et quantitatifs en amont de la constitution du (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  19.  25
    Elaboration d'une base de données d'exemples de structures comparatives : de la grille d'annotation au système d'interrogation.Frédérique Melanie-Becquet & Catherine Fuchs - 2011 - Corpus 10:273-295.
    Le présent article retrace les étapes qui ont présidé à l’élaboration d’une base de données d’exemples de structures à subordonnées comparatives du français. Ce travail a été réalisé dans le cadre du projet « Structures à Subordonnées Comparatives du français » (SCF). Piloté par le laboratoire LaTTiCe sous la direction de C. Fuchs, ce projet a réuni des membres de quatre laboratoires français : B. Combettes et A. Kuyumcuyan (ATILF, Nancy), C. Guimier (CRISCO, Caen), N. Fournier et M. Morinièr..
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  20.  9
    Elaboration d’une base de données d’exemples de structures comparatives : de la grille d’annotation au système d’interrogation.Frédérique Mélanie-Becquet & Catherine Fuchs - 2011 - Corpus 10:273-295.
    Le présent article retrace les étapes qui ont présidé à l’élaboration d’une base de données d’exemples de structures à subordonnées comparatives du français. Ce travail a été réalisé dans le cadre du projet « Structures à Subordonnées Comparatives du français » (SCF). Piloté par le laboratoire LaTTiCe sous la direction de C. Fuchs, ce projet a réuni des membres de quatre laboratoires français : B. Combettes et A. Kuyumcuyan (ATILF, Nancy), C. Guimier (CRISCO, Caen), N. Fournier et M. Morinièr...
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  21.  8
    Corpus informatisés de français médiéval : contraintes sur leur constitution et spécificités de leurs apports.Sophie Prévost - 2008 - Corpus 7.
    Corpus informatisés de français médiéval : contraintes sur leur constitution et spécificités de leurs apports Partant du constat que le linguiste médiéviste ne peut que travailler sur corpus, cet article envisage les contraintes spécifiques qui pèsent sur la constitution de ces corpus, désormais numériques, en particulier en ce qui concerne leur représentativité. La nature de l’étude et la perspective temporelle (synchronique ou diachronique) sont deux facteurs décisifs. Sont ensuite envisagés les apports des corpus, enrichis ou non, tant du point de (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  22.  21
    Corpus informatisés de français médiéval : contraintes sur leur constitution et spécificités de leurs apports.Sophie Prévost - 2008 - Corpus 7:35-64.
    Corpus informatisés de français médiéval : contraintes sur leur constitution et spécificités de leurs apports Partant du constat que le linguiste médiéviste ne peut que travailler sur corpus, cet article envisage les contraintes spécifiques qui pèsent sur la constitution de ces corpus, désormais numériques, en particulier en ce qui concerne leur représentativité. La nature de l’étude et la perspective temporelle (synchronique ou diachronique) sont deux facteurs décisifs. Sont ensuite envisagés les apports des corpus, enrichis ou non, tant du point de (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  23.  20
    Corpus de langue des signes : situer les biais des méthodes d'annotation et d'analyse.Annelies Braffort, Emilie Chételat-Pelé & Jérémie Segouat - 2011 - Corpus 10 (10):25-40.
    Cet article propose un tour d’horizon de différents types de biais que l’on peut rencontrer dans les études basées sur l’annotation de corpus vidéo de langue des signes. En tâchant de situer objectivement les choix effectués et les biais potentiels à chaque étape, nous décrivons les méthodologies que nous avons mises en place dans trois études, portant respectivement sur la synchronisation des composantes corporelles, le mouvement des sourcils et les clignements des yeux, puis la coarticulation.
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  24.  15
    The Corpus de français parlé au Québec (CFPQ) and the Language of Informal Conversation. An Example of Data Mining Based on a Lexical-Semantic Examination of the Sequence je sais pas.Gaétane Dostie - 2016 - Corpus 15.
    Cet article présente le contexte général ayant conduit à l’élaboration du Corpus de français parlé au Québec (CFPQ) et les principes méthodologiques ayant présidé à sa confection. Il illustre ensuite l’intérêt que représente cette ressource documentaire pour l’étude de la langue parlée en contexte informel par le biais d’un examen lexico-sémantique de la séquence je sais pas. L’intérêt pour cette séquence vient d’abord d’un constat : celle-ci est particulièrement fréquente dans le corpus pris comme cible. En effet, elle y occupe (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  25.  7
    Un corpus de SMS français : 88milSMS. Synthèse et usages.Rachel Panckhurst, Cédric Lopez & Mathieu Roche - 2020 - Corpus 20.
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  26.  32
    Lexicographie du français médiéval et corpus informatisé : le traitement lexicographique de verbes d'opinion et de connaissance à partir du corpus du DMF.Corinne Féron - 2008 - Corpus 7.
    Le Dictionnaire du moyen français est fondé en grande partie sur un vaste corpus informatisé. Le but de cet article est d’examiner de façon concrète l’atout que représente l’exploration d’un tel corpus pour la rédaction d’articles concernant des verbes fréquents et polysémiques (croire, cuider, penser, savoir, connaitre). L’accent est mis sur deux fonctionnalités offertes par Frantext : l’étude de voisinage et la recherche de cooccurrences, qui permettent au rédacteur d’affiner la description des unités lexicales traitées ; moyennant une phase de (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  27.  5
    Lexicographie du français médiéval et corpus informatisé : le traitement lexicographique de verbes d’opinion et de connaissance à partir du corpus du DMF.Corinne Féron - 2008 - Corpus 7.
    Le Dictionnaire du moyen français est fondé en grande partie sur un vaste corpus informatisé. Le but de cet article est d’examiner de façon concrète l’atout que représente l’exploration d’un tel corpus pour la rédaction d’articles concernant des verbes fréquents et polysémiques (croire, cuider, penser, savoir, connaitre). L’accent est mis sur deux fonctionnalités offertes par Frantext : l’étude de voisinage et la recherche de cooccurrences, qui permettent au rédacteur d’affiner la description des unités lexicales traitées ; moyennant une phase de (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  28.  8
    Le schwa en français : pourquoi des corpus?Jacques Durand & Julien Eychenne - 2004 - Corpus 3.
    L’objectif principal que nous poursuivons dans cet article est de montrer que pour un phénomène aussi complexe que le schwa, qui ne se laisse pas appréhender de manière triviale, la constitution de corpus s’appuyant sur une méthodologie rigoureuse et explicite est un élément indispensable de la construction des objets phonologiques. A cette fin, nous nous concentrons sur l’étude de la position finale, et plus spécifiquement de l’opposition /Cə#/ vs /C#/, à la lumière de trois enquêtes du projet « Phonologie du (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   2 citations  
  29.  12
    Le schwa en français : pourquoi des corpus ?Jacques Durand & Julien Eychenne - 2004 - Corpus 3.
    L’objectif principal que nous poursuivons dans cet article est de montrer que pour un phénomène aussi complexe que le schwa, qui ne se laisse pas appréhender de manière triviale, la constitution de corpus s’appuyant sur une méthodologie rigoureuse et explicite est un élément indispensable de la construction des objets phonologiques. A cette fin, nous nous concentrons sur l’étude de la position finale, et plus spécifiquement de l’opposition /Cə#/ vs /C#/, à la lumière de trois enquêtes du projet « Phonologie du (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  30.  21
    Elaboration d'un corpus morphophonologique : l'épenthèse consonantique à la frontière suffixale en français.Claudine Pagliano - 2004 - Corpus 3.
    Cet article présente les différentes étapes nécessaires à la construction d'un corpus visant l'étude des épenthèses consonantiques entre radicaux et suffixes en français, depuis le rassemblement des données brutes jusqu'au corpus final, débarrassé des termes dont la consonne candidate s'est avérée ne pas être épenthétique. Ce faisant, il montre les limites d'une extraction automatique des termes dérivés dans ce cadre morphophonologique. Enfin, il souligne le rôle d'un corpus raisonné dans la progression de l'analyse et la nécessaire interaction entre empirie et (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  31.  4
    Elaboration d'un corpus morphophonologique : l'épenthèse consonantique à la frontière suffixale en français.Claudine Pagliano - 2004 - Corpus 3.
    Cet article présente les différentes étapes nécessaires à la construction d'un corpus visant l'étude des épenthèses consonantiques entre radicaux et suffixes en français, depuis le rassemblement des données brutes jusqu'au corpus final, débarrassé des termes dont la consonne candidate s'est avérée ne pas être épenthétique. Ce faisant, il montre les limites d'une extraction automatique des termes dérivés dans ce cadre morphophonologique. Enfin, il souligne le rôle d'un corpus raisonné dans la progression de l'analyse et la nécessaire interaction entre empirie et (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  32.  11
    Réduction des segments en français spontané :apports des grands corpus et du traitement automatique de la parole.Yaru Wu & Martine Adda-Decker - 2021 - Corpus 22.
    Ce travail sur la réduction segmentale (c.-à-d. la suppression ou réduction temporelle de segments) en français spontané nous a permis de proposer une méthode de recherche pour les études en linguistique, ainsi que d’apporter des connaissances sur la propension à la réduction des segments à l’oral. Cette méthode, appelée méthode ascendante, nous permet de travailler sans hypothèse spécifique sur la réduction. Les résultats suggèrent que les liquides, les glides et la fricative voisée /v/ sont plus facilement réduites que les autres (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  33.  18
    Constitution et exploitation des corpus d'ancien et de moyen français.Céline Guillot, Serge Heiden, Alexei Lavrentiev & Christiane Marchello-Nizia - 2008 - Corpus 7.
    1. Introduction Ce numéro spécial dédié aux corpus d’ancien et moyen français, à leur constitution et à leur exploitation, vient après bien d’autres numéros de revues présentantl’usage des corpus en linguistique depuis une dizaine d’années. Mais celui-ci est spécifiquement consacré aux corpus concernant les périodes les plus anciennes de la langue, c’est-à-dire aux formes et pratiques linguistiques qui sont les plus différentes de ce que connaît et pratique le locuteur moderne, et pour lesque..
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  34.  9
    Constitution et exploitation des corpus d'ancien et de moyen français.Céline Guillot, Serge Heiden, Alexei Lavrentiev & Christiane Marchello-Nizia - 2008 - Corpus 7.
    1. Introduction Ce numéro spécial dédié aux corpus d’ancien et moyen français, à leur constitution et à leur exploitation, vient après bien d’autres numéros de revues présentantl’usage des corpus en linguistique depuis une dizaine d’années. Mais celui-ci est spécifiquement consacré aux corpus concernant les périodes les plus anciennes de la langue, c’est-à-dire aux formes et pratiques linguistiques qui sont les plus différentes de ce que connaît et pratique le locuteur moderne, et pour lesque...
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  35.  7
    The contribution of oral corpora to the description of grammaticalization phenomena: what do we learn from the Corpus de français parlé à Bruxelles (CFPB) on aller + infinitive periphrases.Emmanuelle Dister Labeau - 2016 - Corpus 15.
    En considérant les occurrences orales de différents emplois de la périphrase en aller + infinitif décrits par Bres et Labeau (2012a), cet article illustre la contribution positive des corpus oraux, et particulièrement du nouveau Corpus de français parlé à Bruxelles (CFPB) – au rassemblement d’occurrences authentiques de phénomènes linguistiques peu étudiés, au test de leurs descriptions théoriques, mais aussi à l’enrichissement de celles-ci.
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  36.  7
    Les éléments attributifs en position initiale en allemand et leurs équivalents en français – étude de corpus contrastive.Séverine Adam & Cécile Delettres - 2014 - Corpus 13:165-190.
    Les structures attributives en tête d’énoncé sont courantes et variées en allemand. Si une projection d’éléments en fonction d’attribut n’est pas envisageable telle quelle en français, compte tenu des contraintes syntaxiques et positionnelles propres à cette langue, la comparaison entreprise nous a permis de constater que l’on peut malgré tout trouver en position initiale les mêmes contenus sémantiques remplissant des fonctions textuelles similaires, mais présentant d’importantes différences avec les structures allemandes – différences en termes de fréquence et surtout en termes (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  37.  11
    Apports du TAL à la constitution et à l’exploitation d’un corpus scolaire au travers du développement d’un outil d’annotation orthographique.Claire Wolfarth, Claude Ponton & Corinne Totereau - 2017 - Corpus 16.
    Le travail présenté dans cet article s’inscrit dans une recherche qui a pour but la constitution d’un corpus scolaire et le développement d’un outil d’aide à son exploitation à partir de l’annotation de phénomènes linguistiques saillants. Nous nous concentrerons ici sur les écrits produits en fin de classe de CP par des scripteurs encore débutants. L’objet de ce travail est d’explorer les possibilités qu’offre le traitement automatique des langues pour appréhender ces écrits particulièrement éloignés de la norme. L’hypothèse est que (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  38.  24
    Constitution et exploitation d'un corpus de français parlé parisien.Sonia Branca-Rosoff, Serge Fleury, Florence Lefeuvre & Matthew Pires - 2011 - Corpus 10:81-98.
    Le but de cet article est double. Il s’agit d’abord d’introduire un nouveau corpus de français oral numérisé, accessible sans restriction sur le web. CFPP2000 (Corpus du français parlé parisien des années 2000), qui comporte actuellement 500 000 mots alignés à l’oral au tour de parole, est constitué par un ensemble d’interviews conversationnelles sur les quartiers de Paris d’une à deux heures qui ont été réalisées en dyades ou le plus souvent en triades. L’article envisage l’influence pour la constitution du (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  39.  11
    Constitution et exploitation d’un corpus de français parlé parisien.Sonia Branca-Rosoff, Serge Fleury, Florence Lefeuvre & Matthew Pires - 2011 - Corpus 10:81-98.
    Le but de cet article est double. Il s’agit d’abord d’introduire un nouveau corpus de français oral numérisé, accessible sans restriction sur le web. CFPP2000 (Corpus du français parlé parisien des années 2000), qui comporte actuellement 500 000 mots alignés à l’oral au tour de parole, est constitué par un ensemble d’interviews conversationnelles sur les quartiers de Paris d’une à deux heures qui ont été réalisées en dyades ou le plus souvent en triades. L’article envisage l’influence pour la constitution du (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  40.  56
    Forme et fonction de la périphérie gauche dans un corpus oral multigenres annoté.Laurence J. Martin, Liesbeth Degand & Anne-Catherine Simon - 2014 - Corpus 13:243-265.
    La présente contribution propose une étude de la périphérie gauche au sein d’un corpus oral multigenres, représentant douze activités de communication orale, annoté syntaxiquement et prosodiquement. La segmentation discursive du corpus en unités de base du discours (BDU) résulte d’une coïncidence entre unités syntaxiques et prosodiques, correspondant à des encodages linguistiques distincts mais complémentaires. Partant du postulat selon lequel ces unités discursives remplissent une fonction cognitive dans la planification et l’interprétation du discours, nous nous intéressons à l’étude de leur périphérie (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   2 citations  
  41.  6
    Os princípios da Escola Fonológica de São Petersburgo para a elaboração de corpora de fala.Pavel Skrelin, Tatiana Kachkovskaia, Daniil Kocharov, Vera Evdokimova & Uliana Kochetkova - 2023 - Bakhtiniana 18 (2):205-226.
    ABSTRACT The paper discusses the main principles in designing and annotating speech corpora within the framework of the Saint Petersburg phonological school, and provides examples of using corpus data in phonetic research. One of the major principles that we follow is to analyse the speech material at all levels: from segmental to intonational, including speech disfluencies. During segmental phonetic annotation, we suggest listening to each speech sound in isolation (without knowing its context) and relying on spectrographic data. At the syllabic (...)
    No categories
    Direct download (4 more)  
     
    Export citation  
     
    Bookmark  
  42.  3
    Adaptation and validation of two annotation scales for assessing social skills in a corpus of multimodal collaborative interactions.Jennifer Hamet Bagnou, Elise Prigent, Jean-Claude Martin & Céline Clavel - 2022 - Frontiers in Psychology 13.
    ContextBehavioral observation scales are important for understanding and assessing social skills. In the context of collaborative problem-solving skills, considered essential in the 21st century, there are no validated scales in French that can be adapted to different CPS tasks. The aim of this study is to adapt and validate, by annotating a new video corpus of dyadic interactions that we have collected, two observational scales allowing us to qualitatively assess CPS skills: the Social Performance Rating Scale and the Social Skills (...)
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  43.  11
    Un « corpus de littéracie avancée : résultat et point de départ.Marie-Paule Jacques & Fanny Rinck - 2017 - Corpus 16.
    Le corpus de littéracie avancée réunit des écrits universitaires et professionnels produits par des étudiants du niveau Licence 1 au Master 2. Il contient actuellement 338 textes (+ d’1 million de mots) et est mis à disposition au format xml, assorti de métadonnées (niveau, discipline, genre, consigne d’écriture etc.). Il est à la fois un aboutissement et un point de départ dans le champ de la littéracie avancée : parce que l’enjeu n’est pas tant de constituer des corpus que de (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  44.  5
    L’emploi d’éléments initiaux dans quatre romans français contemporains. Comparaison avec un corpus de textes d’économie.Eva Havu - 2014 - Corpus 13:79-98.
    Notre article examine d’abord la possibilité d’occuper la zone préverbale par des éléments autres que le sujet et classe ces éléments d’après leur degré d’intégration dans une phrase « canonique ». Par la suite, les éléments initiaux apparaissant dans un corpus littéraire composé de quatre extraits de romans contemporains sont examinés d’après différents critères et les résultats sont brièvement comparés aux données globales d’un corpus de textes d’économie.
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  45. John of Scythopolis and the Dionysian Corpus: Annotating the Areopagite.Paul Rorem - 1998
    No categories
     
    Export citation  
     
    Bookmark   3 citations  
  46.  25
    Annotating Argument Schemes.Jacky Visser, John Lawrence, Chris Reed, Jean Wagemans & Douglas Walton - 2020 - Argumentation 35 (1):101-139.
    Argument schemes are abstractions substantiating the inferential connection between premise(s) and conclusion in argumentative communication. Identifying such conventional patterns of reasoning is essential to the interpretation and evaluation of argumentation. Whether studying argumentation from a theory-driven or data-driven perspective, insight into the actual use of argumentation in communicative practice is essential. Large and reliably annotated corpora of argumentative discourse to quantitatively provide such insight are few and far between. This is all the more true for argument scheme corpora, which tend (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark   6 citations  
  47.  8
    Annoter la polyphonie dans les textes : le cas des passages entre guillemets.Fanny Rinck & Agnès Tutin - 2007 - Corpus 6:79-100.
    Dans cet article, nous présentons une étude de faisabilité sur l’annotation des passages entre guillemets, phénomènes linguistiques polyphoniques qui résistent souvent à une lecture univoque et à un schéma d’annotation simplificateur. La faisabilité de l’annotation a été testée à travers une étude inter-annotateurs qui a montré, avec un accord pour 80% des annotations effectuées, que des valeurs stables (dénomination, citation, autonymie, commentaires modalisants) pouvaient être postulées. Les cas de désaccord, en partie inévitables face à la complexité du phénomène, peuvent être (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  48.  13
    Corpus and writing activity of dyslexic and dysorthographic adolescents in the framework of regular speech therapy.Agnès Witko & Florence Chenu - 2018 - Corpus 19.
    Selon l'étude européenne translinguistique Neurodys (Becker et al., 2013), la prévalence de la dyslexie touche entre 5 et 10% des enfants âgés de 8 à 12 ans. L’apprentissage du langage écrit revient à maîtriser conjointement ses deux versants : lecture et écriture. La présente étude vise l’analyse des processus d'écriture utilisés par des scripteurs dyslexiques (DL) et dysorthographiques (DO). Afin de favoriser les collaborations chercheurs-praticiens, comme le proposent Hayes et Berninger (2014), nous étudions les données chronométriques relatives à un corpus (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  49.  18
    Annoter la polyphonie dans les textes : le cas des passages entre guillemets.Fanny Rinck & Agnès Tutin - 2007 - Corpus 6:79-100.
    Dans cet article, nous présentons une étude de faisabilité sur l’annotation des passages entre guillemets, phénomènes linguistiques polyphoniques qui résistent souvent à une lecture univoque et à un schéma d’annotation simplificateur. La faisabilité de l’annotation a été testée à travers une étude inter-annotateurs qui a montré, avec un accord pour 80% des annotations effectuées, que des valeurs stables (dénomination, citation, autonymie, commentaires modalisants) pouvaient être postulées. Les cas de désaccord, en partie inévitables face à la complexité du phénomène, peuvent être (...)
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  50.  6
    Le français écrit : transcription et édition. Le cas des textes scolaires.Marie-Noëlle Roubaud - 2017 - Corpus 16.
    Notre expérience de constitution d’une base de données orale (au sein du Groupe aixois de recherches en syntaxe) nous a servi à constituer, à la fin des années 90, une base de données d’écrits scolaires manuscrits (élèves de 5 à 11 ans). L’article rend compte des questions inhérentes à la constitution d’un tel corpus : du recueil de données à leur transcription et à leur édition. Si les méthodes d’analyse de l’oral peuvent résoudre certains des problèmes rencontrés, elles ne peuvent (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
1 — 50 / 993