Results for ' étiquetage morphosyntaxique'

19 found
Order:
  1.  8
    Enjeux des corpus bilingues en diachronie longue : l’exemple du projet MICLE.Mathieu Goux - 2024 - Corpus 25.
    La multiplication des très grands corpus en linguistique historique a entraîné des discussions nombreuses sur les procédures d’annotation et les métadonnées associées, notamment concernant les questions relevant de l’étiquetage morphosyntaxique et de la tokenisation. D’autres sujets cruciaux, en revanche, semblent moins abordés, comme la question de la découpe en propositions ou en « phrases » des données linguistiques, la préservation des informations philologiques ou, encore, la question de l’encodage et des formats de données. Notre contribution explore ces thématiques (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  2.  9
    Annotation de textes d’états de langue anciens : pour le redéploiement de l’existant.Adam Kraif Renwick - 2024 - Corpus 25.
    Dans le cadre de la construction du corpus PhraseoRoChe, un corpus diachronique rassemblant des romans de chevalerie du 13e au 17e siècle, cet article s’intéresse aux performances de différents analyseurs (étiqueteurs, lemmatiseurs, parseurs en dépendances) entrainés sur des états de langue connexes allant de l’ancien français au moyen français et au français moderne. Nous étudions ainsi la possibilité d’étendre ces analyseurs au-delà des états de langues précis sur lesquels ils ont été entrainés, en s’appuyant notamment sur les divergences entre analyseurs (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  3.  8
    Un corpus pour l’analyse de la variation et du changement linguistique.France Martineau - 2008 - Corpus 7.
    Cet article offre une réflexion sur la constitution de corpus pour l’analyse de la variation et du changement morphosyntaxique. Le Corpus MCVF (Modéliser le changement : les voies du français) est structuré de façon à permettre l’analyse de la variation morphosyntaxique, à travers plusieurs périodes historiques, tout en tenant compte, dans une certaine mesure, de facteurs sociolinguistiques comme la distribution sociale et régionale. Les principes qui sous-tendent la sélection des textes et leur annotation morphosyntaxique sont d’abord présentés. (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   4 citations  
  4.  18
    Un corpus pour l'analyse de la variation et du changement linguistique.France Martineau - 2008 - Corpus 7.
    Cet article offre une réflexion sur la constitution de corpus pour l’analyse de la variation et du changement morphosyntaxique. Le Corpus MCVF (Modéliser le changement : les voies du français) est structuré de façon à permettre l’analyse de la variation morphosyntaxique, à travers plusieurs périodes historiques, tout en tenant compte, dans une certaine mesure, de facteurs sociolinguistiques comme la distribution sociale et régionale. Les principes qui sous-tendent la sélection des textes et leur annotation morphosyntaxique sont d’abord présentés. (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  5.  13
    Introducing New French Child Data: Thoughts on Their Gathering and Coding.Katérina Palasis - 2010 - Corpus 9:33-51.
    De nouvelles données enfantines pour l’étude du français : réflexions autour de leur collecte et de leur étiquetage.Cet article propose une réflexion autour d’un certain nombre de questions importantes auxquelles un chercheur doit répondre lorsqu’il construit son corpus en vue de recherches sur l’acquisition du langage. Dans ce cadre, deux étapes sont notamment discutées : la collecte des données (choix des informateurs, nombre, représentativité, etc.) et l’étiquetage de ces données, le but étant pour le chercheur de proposer une (...)
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  6.  4
    Introducing New French Child Data: Thoughts on Their Gathering and Coding.Katérina Palasis - 2010 - Corpus 9:33-51.
    De nouvelles données enfantines pour l’étude du français : réflexions autour de leur collecte et de leur étiquetage.Cet article propose une réflexion autour d’un certain nombre de questions importantes auxquelles un chercheur doit répondre lorsqu’il construit son corpus en vue de recherches sur l’acquisition du langage. Dans ce cadre, deux étapes sont notamment discutées : la collecte des données (choix des informateurs, nombre, représentativité, etc.) et l’étiquetage de ces données, le but étant pour le chercheur de proposer une (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  7.  15
    Le corpus PhraséoRoChe : les défis de l’établissement des textes et de l’hétérogénéité des états de la langue.Corinne Kraif Denoyelle - 2024 - Corpus 25.
    Le corpus PhraséoRoChe se centre sur le roman de chevalerie de langue française écrit en prose. Il rassemble des textes issus d’œuvres produites entre le XIIIe siècle et le XVIIe siècle, période bornée par la naissance et la disparition de ce genre textuel. Pour permettre des interrogations par le lecteur d’aujourd’hui d’un corpus outillé embrassant une diachronie aussi longue, il faut faire des choix concernant l’évolution de la langue, non seulement en traitant le décalage entre le français contemporain et la (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  8.  3
    Morpho-syntaxe sémantique des nominaux propres.Manon Philippe - forthcoming - Corela. Cognition, Représentation, Langage.
    Cet article étudie les délimitations morphosyntaxiques des noms propres en s’inspirant de la sémantique de la syntaxe. Les propriétés typographiques, morphologiques et syntaxiques des noms propres sont mises en lien et se répondent parfois iconiquement afin de faire émerger une nouvelle description des noms propres en tant que nominaux – et non plus simples noms ou syntagmes nominaux. Les noms propres sont des unités de rang « nominal » qui cherchent à intégrer des formes potentiellement marginales au sein du domaine (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  9.  19
    La contribution des cooccurrences de deuxième ordre à l'analyse sémantique.Ann Bertels & Dirk Speelman - 2012 - Corpus 11.
    Cet article montre ce que la cooccurrence peut nous apprendre sur la monosémie et comment on peut exploiter l’analyse des cooccurrences de deuxième ordre pour quantifier l’analyse sémantique. Les analyses sont conduites sur un corpus technique (1,7 million d’occurrences) relevant du domaine spécialisé des machines-outils pour l’usinage des métaux. Dans cet article, nous expliquons la méthodologie adoptée pour déterminer le degré de monosémie d’un mot technique à partir de l’analyse du recoupement de ses cooccurrences de deuxième ordre. Dans le but (...)
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  10.  6
    La contribution des cooccurrences de deuxième ordre à l’analyse sémantique.Ann Bertels & Dirk Speelman - 2012 - Corpus 11.
    Cet article montre ce que la cooccurrence peut nous apprendre sur la monosémie et comment on peut exploiter l’analyse des cooccurrences de deuxième ordre pour quantifier l’analyse sémantique. Les analyses sont conduites sur un corpus technique (1,7 million d’occurrences) relevant du domaine spécialisé des machines-outils pour l’usinage des métaux. Dans cet article, nous expliquons la méthodologie adoptée pour déterminer le degré de monosémie d’un mot technique à partir de l’analyse du recoupement de ses cooccurrences de deuxième ordre. Dans le but (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  11.  16
    Intertexte générique et interprétation des actes de parole dans un corpus d'émissions de plateaux télévisées.Nicolas Desquinabo - 2007 - Corpus 6:127-152.
    Cet article propose deux mises à l’épreuve d’une modélisation du rôle du contexte dans l’interprétation des actes de parole. Selon notre modèle, les processus interprétatifs se déroulent généralement à partir d’hypothèses contextuelles sur le genre de discours pratiqué par le ou les énonciateur(s) du texte. Ces hypothèses sont activées à l’aide d’indices pluri-sémiotiques péritextuels et textuels. Un intertexte générique est alors mobilisé et oriente les processus interprétatifs, en particulier s’agissant de l’attribution des valeurs illocutoires et interactives probables des actes de (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  12. Theory of Cognitive Distortions: Personalization.Paul Franceschi - 2007 - Journal de Thérapie Comportementale Et Cognitive 20 (2):51-55.
    In a previous paper (Compléments pour une théorie des distorsions cognitives, Journal de Thérapie Comportementale et Cognitive, 2007), we did present some elements aimed at contributing to a general theory of cognitive distortions. Based on the reference class, the duality and the system of taxa, these elements led to distinguish between the general cognitive distortions (dichotomous reasoning, disqualification of one pole, minimization, maximization) and the specific cognitive distortions (disqualifying the positive, selective abstraction, catastrophism). By also distinguishing between three levels of (...)
    Direct download  
     
    Export citation  
     
    Bookmark  
  13.  22
    Les clitiques sujets dans les variétés occitanes et francoprovençales italiennes.Leonardo M. Savoia & M. Rita Manzini - 2010 - Corpus 9:165-190.
    Dans cet article, nous examinerons quelques aspects de la syntaxe du sujet dans les dialectes occitans du Piémont occidental, dans les dialectes francoprovençaux du Piémont occidental et du Val d’Aoste, y compris les parlers de Celle di Faeto (francoprovençal) dans les Pouilles et de Guardia Piemontese (occitan) en Calabre : l’existence de clitiques sujets, l’absence de l’accord entre verbe et sujet post-posé, l’inversion du verbe et du clitique sujet dans les constructions interrogatives. Toutes ces propriétés morphosyntaxiques qui apparaissent dans les (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  14.  9
    Corpus, classes and collection in Conversation Analysis.Michel de Fornel & Maud Verdier - 2018 - Corpus 18.
    Les vingt dernières années ont vu l’apparition d’une convergence forte entre une démarche appliquée se consacrant à la création de corpus de grande taille, à leur codage et à leur étiquetage, et diverses théories linguistiques dont les analyses reposent sur de tels corpus. Pour l’analyse de conversation (ou linguistique interactionnelle) une telle convergence ne semble pas possible, car son approche est qualitative et s’appuie sur de « petits » corpus. De plus, un examen approfondi du contexte social des interactions (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  15.  8
    Intertexte générique et interprétation des actes de parole dans un corpus d’émissions de plateaux télévisées.Nicolas Desquinabo - 2007 - Corpus 6:127-152.
    Cet article propose deux mises à l’épreuve d’une modélisation du rôle du contexte dans l’interprétation des actes de parole. Selon notre modèle, les processus interprétatifs se déroulent généralement à partir d’hypothèses contextuelles sur le genre de discours pratiqué par le ou les énonciateur(s) du texte. Ces hypothèses sont activées à l’aide d’indices pluri-sémiotiques péritextuels et textuels. Un intertexte générique est alors mobilisé et oriente les processus interprétatifs, en particulier s’agissant de l’attribution des valeurs illocutoires et interactives probables des actes de (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  16.  5
    L'introduction de la traçabilité dans la filière de la viande bovine.Céline Granjou - 2003 - Cahiers Internationaux de Sociologie 115 (2):327-342.
    La traçabilité, définie par la norme Iso 8402 comme « l'aptitude à retrouver l'historique, l'utilisation ou la localisation d'une entité au moyen d'identifications enregistrées » implique une forme de surenchérissement technique dans les modes de production : visant à créer une confiance fondée sur la preuve du respect de certaines normes techniques codifiant les procédures de fabrication, elle nous éloigne par là même encore plus d'un mode de production artisanal, soumis aux aléas et aux défauts inhérents à la reproduction humaine (...)
    No categories
    Direct download (6 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  17.  9
    Les clitiques sujets dans les variétés occitanes et francoprovençales italiennes.Leonardo M. Savoia & M. Rita Manzini - 2010 - Corpus 9:165-190.
    Dans cet article, nous examinerons quelques aspects de la syntaxe du sujet dans les dialectes occitans du Piémont occidental, dans les dialectes francoprovençaux du Piémont occidental et du Val d’Aoste, y compris les parlers de Celle di Faeto (francoprovençal) dans les Pouilles et de Guardia Piemontese (occitan) en Calabre : l’existence de clitiques sujets, l’absence de l’accord entre verbe et sujet post-posé, l’inversion du verbe et du clitique sujet dans les constructions interrogatives. Toutes ces propriétés morphosyntaxiques qui apparaissent dans les (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  18.  22
    La quête du Graal et la réalité numérique.Claire Serp, Anne Laurent, Mathieu Roche & Maguelonne Teisseire - 2008 - Corpus 7.
    Cet article présente un processus de fouille de données afin d’extraire des connaissances associées au motif de la parenté et de la famille dans un corpus en ancien français de la première moitié du XIIIe siècle. Après une numérisation puis un prétraitement des données fondé sur des techniques de TAL (Traitement Automatique du Langage), il a été procédé à une extraction de motifs séquentiels (enchaînements de voisinages de mots liés à la thématique traitée). Dans cet article, nous présentons les problèmes (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  19.  8
    La quête du Graal et la réalité numérique.Claire Serp, Anne Laurent, Mathieu Roche & Maguelonne Teisseire - 2008 - Corpus 7.
    Cet article présente un processus de fouille de données afin d’extraire des connaissances associées au motif de la parenté et de la famille dans un corpus en ancien français de la première moitié du XIIIe siècle. Après une numérisation puis un prétraitement des données fondé sur des techniques de TAL (Traitement Automatique du Langage), il a été procédé à une extraction de motifs séquentiels (enchaînements de voisinages de mots liés à la thématique traitée). Dans cet article, nous présentons les problèmes (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark