Results for ' diachronie, linguistique outillée, linguistique de corpus, format, annotation syntaxique'

1000+ found
Order:
  1.  8
    Enjeux des corpus bilingues en diachronie longue : l’exemple du projet MICLE.Mathieu Goux - 2024 - Corpus 25.
    La multiplication des très grands corpus en linguistique historique a entraîné des discussions nombreuses sur les procédures d’annotation et les métadonnées associées, notamment concernant les questions relevant de l’étiquetage morphosyntaxique et de la tokenisation. D’autres sujets cruciaux, en revanche, semblent moins abordés, comme la question de la découpe en propositions ou en « phrases » des données linguistiques, la préservation des informations philologiques ou, encore, la question de l’encodage et des formats de données. Notre contribution explore ces thématiques (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  2.  8
    Un corpus pour l’analyse de la variation et du changement linguistique.France Martineau - 2008 - Corpus 7.
    Cet article offre une réflexion sur la constitution de corpus pour l’analyse de la variation et du changement morphosyntaxique. Le Corpus MCVF (Modéliser le changement : les voies du français) est structuré de façon à permettre l’analyse de la variation morphosyntaxique, à travers plusieurs périodes historiques, tout en tenant compte, dans une certaine mesure, de facteurs sociolinguistiques comme la distribution sociale et régionale. Les principes qui sous-tendent la sélection des textes et leur annotation morphosyntaxique sont d’abord présentés. L’intérêt d’un (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   4 citations  
  3.  18
    Un corpus pour l'analyse de la variation et du changement linguistique.France Martineau - 2008 - Corpus 7.
    Cet article offre une réflexion sur la constitution de corpus pour l’analyse de la variation et du changement morphosyntaxique. Le Corpus MCVF (Modéliser le changement : les voies du français) est structuré de façon à permettre l’analyse de la variation morphosyntaxique, à travers plusieurs périodes historiques, tout en tenant compte, dans une certaine mesure, de facteurs sociolinguistiques comme la distribution sociale et régionale. Les principes qui sous-tendent la sélection des textes et leur annotation morphosyntaxique sont d’abord présentés. L’intérêt d’un (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  4.  56
    Forme et fonction de la périphérie gauche dans un corpus oral multigenres annoté.Laurence J. Martin, Liesbeth Degand & Anne-Catherine Simon - 2014 - Corpus 13:243-265.
    La présente contribution propose une étude de la périphérie gauche au sein d’un corpus oral multigenres, représentant douze activités de communication orale, annoté syntaxiquement et prosodiquement. La segmentation discursive du corpus en unités de base du discours (BDU) résulte d’une coïncidence entre unités syntaxiques et prosodiques, correspondant à des encodages linguistiques distincts mais complémentaires. Partant du postulat selon lequel ces unités discursives remplissent une fonction cognitive dans la planification et l’interprétation du discours, nous nous intéressons à l’étude de leur périphérie (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   2 citations  
  5.  9
    La constitution de corpus en diachronie longue : méthodologies, objectifs et exploitations linguistiques et stylistiques.Julie Kraif Sorba - 2024 - Corpus 25.
    Depuis plusieurs décennies, la numérisation des textes anciens et les progrès du TAL pour les traiter et les interroger ont largement modifié nos habitudes de travail. Il est désormais possible d’obtenir des données quantitatives massives qui affinent notre perception des phénomènes linguistiques et stylistiques dans des corpus écrits dans des états de langue anciens. Les corpus numériques créés depuis maintenant près d’un quart de siècle permettent d’envisager plus facilement la dynamique du...
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  6.  15
    Le corpus PhraséoRoChe : les défis de l’établissement des textes et de l’hétérogénéité des états de la langue.Corinne Kraif Denoyelle - 2024 - Corpus 25.
    Le corpus PhraséoRoChe se centre sur le roman de chevalerie de langue française écrit en prose. Il rassemble des textes issus d’œuvres produites entre le XIIIe siècle et le XVIIe siècle, période bornée par la naissance et la disparition de ce genre textuel. Pour permettre des interrogations par le lecteur d’aujourd’hui d’un corpus outillé embrassant une diachronie aussi longue, il faut faire des choix concernant l’évolution de la langue, non seulement en traitant le décalage entre le français contemporain et la (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  7.  34
    Caractérisation des échanges entre patients et médecins : approche outillée d'un corpus de consultations médicales.Ludovic Tanguy, Cécile Fabre, Lydia-Mai Ho-Dac & Josette Rebeyrolle - 2011 - Corpus 10:137-154.
    Nous présentons une étude fondée sur un corpus de transcriptions de consultations médicales, dans le cadre d’un projet interdisciplinaire qui explore la question des inégalités sociales de santé. L’objet de cet article est de montrer comment, en tant que linguistes familiers du traitement outillé des corpus, nous avons choisi d’aborder ce matériau qui fait l’objet de questionnements disciplinaires complémentaires, et quels éléments de caractérisation spécifiques nous sommes en mesure d’apporter en réponse à une demande émanant de la sphère médicale.
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  8.  5
    Caractérisation des échanges entre patients et médecins : approche outillée d’un corpus de consultations médicales.Ludovic Tanguy, Cécile Fabre, Lydia-Mai Ho-Dac & Josette Rebeyrolle - 2011 - Corpus 10:137-154.
    Nous présentons une étude fondée sur un corpus de transcriptions de consultations médicales, dans le cadre d’un projet interdisciplinaire qui explore la question des inégalités sociales de santé. L’objet de cet article est de montrer comment, en tant que linguistes familiers du traitement outillé des corpus, nous avons choisi d’aborder ce matériau qui fait l’objet de questionnements disciplinaires complémentaires, et quels éléments de caractérisation spécifiques nous sommes en mesure d’apporter en réponse à une demande émanant de la sphère médicale.
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  9.  11
    Constitution d’un grand corpus d’écrits émergents et novices : principes et méthodes.Sarah De Vogüé, Natacha Espinoza, Brigitte Garcia, Marie Perini, Frédérique Sitri & Marzena Watorek - 2017 - Corpus 16.
    Constitution d’un grand corpus d’écrits émergents et novices : principes et méthodes Cette contribution propose une réflexion sur la construction d’un vaste corpus d’écrits qui permet d’approfondir notre compréhension des processus en jeu dans l’accès à la littératie dans sa diversité, au travers de la pluralité des genres et des types discursifs qui la constituent et chez des apprenants de profils divers : enfants/adultes, langue 1 / langue 2, entendants/sourds. La réflexion sur la mise en place de ce corpus s’inscrit (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  10.  21
    What predicts productivity? Theory meets individuals.Hendrik De Smet - 2020 - Cognitive Linguistics 31 (2):251-278.
    Because they involve individual-level cognitive processes, psychological explanations of linguistic phenomena are in principle testable against individual behaviour. The present study draws on patterns of individual variation in corpus data to test explanations of productivity. Linguistic patterns are predicted to become more productive with higher type frequencies and lower token frequencies. This is because the formation of abstract mental representations is encouraged by varied types but counteracted by automation of high-frequency types. The predictions are tested for English -ly and -ness-derivation, (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   5 citations  
  11.  19
    Du corpus littéraire au corpus linguistique : dématérialisation, restructuration, lectures rhizomatiques et analyses linguistiques des manuscrits.Thomas Lebarbé - 2009 - Corpus 8:221-239.
    L’auteur, responsable des aspects informatiques et linguistiques du projet « Manuscrits de Stendhal en ligne », décrit le processus de constitution d’un corpus, au sens linguistique du terme, dans le cadre d’une collaboration fortement interdisciplinaire. Il montre dans quelle mesure ce type de collaboration permet de construire un ensemble documentaire répondant aux besoins des chercheurs en littérature tout en apportant un matériau langagier riche et inédit pour le linguiste. Subséquemment, ce n’est pas l’objet de l’étude qui définit le corpus (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  12.  7
    Du corpus littéraire au corpus linguistique : dématérialisation, restructuration, lectures rhizomatiques et analyses linguistiques des manuscrits.Thomas Lebarbé - 2009 - Corpus 8:221-239.
    L’auteur, responsable des aspects informatiques et linguistiques du projet « Manuscrits de Stendhal en ligne », décrit le processus de constitution d’un corpus, au sens linguistique du terme, dans le cadre d’une collaboration fortement interdisciplinaire. Il montre dans quelle mesure ce type de collaboration permet de construire un ensemble documentaire répondant aux besoins des chercheurs en littérature tout en apportant un matériau langagier riche et inédit pour le linguiste. Subséquemment, ce n’est pas l’objet de l’étude qui définit le corpus (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  13.  8
    Annoter la polyphonie dans les textes : le cas des passages entre guillemets.Fanny Rinck & Agnès Tutin - 2007 - Corpus 6:79-100.
    Dans cet article, nous présentons une étude de faisabilité sur l’annotation des passages entre guillemets, phénomènes linguistiques polyphoniques qui résistent souvent à une lecture univoque et à un schéma d’annotation simplificateur. La faisabilité de l’annotation a été testée à travers une étude inter-annotateurs qui a montré, avec un accord pour 80% des annotations effectuées, que des valeurs stables (dénomination, citation, autonymie, commentaires modalisants) pouvaient être postulées. Les cas de désaccord, en partie inévitables face à la complexité du (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  14.  18
    Annoter la polyphonie dans les textes : le cas des passages entre guillemets.Fanny Rinck & Agnès Tutin - 2007 - Corpus 6:79-100.
    Dans cet article, nous présentons une étude de faisabilité sur l’annotation des passages entre guillemets, phénomènes linguistiques polyphoniques qui résistent souvent à une lecture univoque et à un schéma d’annotation simplificateur. La faisabilité de l’annotation a été testée à travers une étude inter-annotateurs qui a montré, avec un accord pour 80% des annotations effectuées, que des valeurs stables (dénomination, citation, autonymie, commentaires modalisants) pouvaient être postulées. Les cas de désaccord, en partie inévitables face à la complexité du (...)
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  15.  8
    Les corpus numériques pour la didactique des langues : de la formation des enseignants à l’élaboration de dispositifs d’apprentissage.Simona Gaillat Ruggia - 2023 - Corpus 24.
    L’apprentissage des langues étrangères et les méthodes employées dans l’enseignement des langues connaissent une véritable révolution numérique. Du fait de l’accessibilité et de l’ubiquité des données, de nombreuses expérimentations sont mises en place afin de confronter les apprenants aux langues cibles. Les données linguistiques organisées en corpus permettent de mettre en regard formes et contextes afin de favoriser la réflexion métalinguistique nécessaire au processus d’acquisition. Dans...
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  16.  5
    Eléments initiaux : combinaisons et schémas préférentiels dans un corpus d’articles scientifiques.Frédérique Mélanie-Becquet & Sophie Prevost - 2014 - Corpus 13:29-60.
    La présente contribution s’attache à l’étude, dans un corpus d’articles scientifiques en sciences humaines, de la zone préverbale, c’est-à-dire des éléments initiaux (EI) et du sujet préverbal. Il s’agit de déterminer les combinaisons attestées des différents EI (11 catégories définies par des critères sémantiques et morpho-syntaxiques) en relation avec la nature du sujet. L’étude permet tout d’abord de déterminer que les séquences sans EI (sujet initial) excèdent celles avec EI, et que, parmi ces dernières, celles avec un seul EI sont, (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  17.  11
    Vers un outillage informatique optimisé pour corpus langagiers oraux en vue d’une exploitation textométrique : le cas des interrogatives partielles dans ESLO.Flora Badin, Loïc Liégeois, Gabriel Thiberge & Christophe Parisse - 2021 - Corpus 22.
    Pour répondre aux problématiques engendrées par la diffusion de plus en plus massive des corpus linguistiques et à l’hétérogénéité de leurs formats, nous proposons une méthode permettant de prendre en main des corpus langagiers oraux et de les convertir dans un format permettant leur exploitation outillée. Pour cette recherche, le corpus ESLO nous sert d’exemple par sa licence de diffusion, son format, son volume et ses atouts sociolinguistiques et diachroniques. Notre travail se fonde sur la compilation de ce corpus pour (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  18.  9
    Chaînes de référence dans le corpus Democrat : une analyse en diachronie longue.Frédéric Glikman Landragin - 2024 - Corpus 25.
    Le corpus Democrat, annoté en expressions référentielles et en chaînes de référence, est paru fin 2019 et a déjà fait l’objet de plusieurs études. Trois ans plus tard, on constate qu’il manque encore des statistiques sur l’ensemble du corpus, et des analyses qui tiennent compte des données à la fois d’un point de vue global – fréquence d’apparition de phénomènes, par ex. – et d’un point de vue local, avec la remise en perspective des annotations dans leur contexte textuel. Cet (...)
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  19.  11
    Profiterole : un corpus morpho-syntaxique et syntaxique de français médiéval.Sophie Grobol Prévost - 2024 - Corpus 25.
    Le projet ANR Profiterole avait pour objectifs la constitution de ressources pour le français médiéval (9e-15e s.) : un corpus annoté en (morpho-)syntaxe et des lexiques, la conception d'analyseurs syntaxiques pour le français médiéval, le développement d’outils de diffusion et d’analyse textométrique de l’annotation syntaxique dans le contexte de la plateforme TXM, et, enfin, la modélisation de certains aspects syntaxiques de l’évolution du français. Nous commençons par décrire la constitution du corpus Profiterole en termes de choix de textes, (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  20.  11
    Un « corpus de littéracie avancée : résultat et point de départ.Marie-Paule Jacques & Fanny Rinck - 2017 - Corpus 16.
    Le corpus de littéracie avancée réunit des écrits universitaires et professionnels produits par des étudiants du niveau Licence 1 au Master 2. Il contient actuellement 338 textes (+ d’1 million de mots) et est mis à disposition au format xml, assorti de métadonnées (niveau, discipline, genre, consigne d’écriture etc.). Il est à la fois un aboutissement et un point de départ dans le champ de la littéracie avancée : parce que l’enjeu n’est pas tant de constituer des corpus que de (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  21.  9
    Un corpus multimodal pour étudier les interactions par visioconférence pour le développement des compétences techno-pédagogiques en didactique des langues et formation de formateurs.Marco Holt Cappellini - 2023 - Corpus 24.
    This article aims to describe the construction and annotation of a multimodal and multilingual (French, English, and Mandarin Chinese) corpus for the study of second language acquisition and professional development in language teaching. The corpus was built within a research project whose main objective is to determine which techno-semio-pedagogical competencies are developed informally and which ones require formal training. In this paper, we explain the theoretical framework adopted, characterized by an ecological approach to the interactive environment. We subsequently illustrate (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  22. Linguistique de corpus philosophiques: l'exemple de Deleuze.Sylvain Loiseau & François Rastier - 2011 - In Patrice Maniglier (ed.), Le moment philosophique des années 1960 en France. Paris: Presses universitaires de France. pp. 73--93.
     
    Export citation  
     
    Bookmark  
  23.  10
    Cartographie des émotions: propositions linguistiques et sociolinguistiques.Fabienne H. Baider & Georgeta Cislaru (eds.) - 2013 - Paris: Presses Sorbonne nouvelle.
    La linguistique se penche sur les émotions afin de décrire les moyens langagiers de les exprimer ou de les représenter, tant au niveau de la structure de la langue que de l'interaction dans le discours. Par là même, elle met en exergue l'ubiquité des émotions dans le langage. Les contributions du volume Cartographie des émotions s'attachent à mettre à plat les liens entre langues et émotions. Elles cherchent à catégoriser, délimiter, appréhender les affects pour mieux comprendre les enjeux linguistiques (...)
    Direct download  
     
    Export citation  
     
    Bookmark  
  24.  3
    Traitement des lexies d’émotion dans les corpus et les applications d’EmoBase.Sascha Diwersy, Vannina Goossens, Anke Grutschus, Beate Kern, Olivier Kraif, Elena Melnikova & Iva Novakova - 2014 - Corpus 13:269-293.
    Cet article détaille la méthodologie mise en place dans le projet EMOLEX qui a abouti à la mise à disposition de corpus multilingues, d’interfaces d’interrogation et d’analyse de ces corpus ainsi que d’applications permettant d’exploiter les analyses linguistiques portant sur le lexique des affects dans cinq langues européennes.
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  25.  10
    Vers l’annotation discursive de textes d’élèves.Claudine Garcia-Debanc, Lydia-Mai Ho-Dac, Myriam Bras & Josette Rebeyrolle - 2017 - Corpus 16.
    La contribution se propose de mettre en évidence les problèmes épistémologiques et méthodologiques posés par l’annotation discursive de productions écrites d’élèves et les choix techniques qu’implique sa mise en œuvre. Dans un premier temps, l’article montre l’intérêt scientifique de la constitution de « grands » corpus scolaires rassemblant plusieurs centaines de textes d’élèves d’école primaire et de collège de niveaux scolaires différents répondant à une même consigne. L’unicité de la consigne permet de comparer les productions en vue d’élaborer une (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  26.  32
    Les atlas linguistiques sont-ils des corpus?Esther Baiwir & Pascale Renders - 2013 - Corpus 12:27-37.
    Les atlas linguistiques sont-ils des corpus? Nous voudrions ici montrer pourquoi certains atlas ne sont pas des corpus et comment leur informatisation pourrait, néanmoins, permettre de les exploiter comme tels. Le questionnement auquel font écho ces lignes est celui de la possibilité d’une informatisation de l’Atlas linguistique de la Wallonie (ALW), envisagée dans un premier temps comme l’intégration d’échantillons des publications dans des bases de données, exploitables via une interface de consultation en ligne. Ce travail consisterait à réduire la (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  27.  15
    Les enjeux de l’emploi communautaire de motifs séquenciels en analyse du discours.Pascale Mounier - 2018 - Corela. Cognition, Représentation, Langage.
    La linguistique de corpus a fait avancer ces dernières années l’étude du cliché linguistique en mettant au point des techniques de repérage et de calcul de fréquence de suites syntaxiques à classes de mots identiques. Ce qu’elle appelle le « motif séquenciel » peut trouver une pertinence en analyse du discours en particulier quand il sert de révélateur d’un langage communautaire forgé par des locuteurs en relation idéologique. C’est ce que confirme la présence de motifs séquenciels à lexèmes (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  28.  9
    De l’entorse à la norme à l’atypicité typique : Retour sur un corpus de SMS de sourds et ses métadonnées.Michel Otell - 2019 - Corela. Cognition, Représentation, Langage 27 (HS).
    Cet article revient sur un corpus de conversations par SMS entre des personnes sourdes qui présentent un bilinguisme entre le français et la Langue des Signes Française. Ce regard rétrospectif sur ce corpus, notamment sur les motifs de son cadrage, l’enquête de terrain préalable à sa collecte, le protocole de collecte en tant que telle, ou le défi que constitue son annotation, permet de discuter des avantages et des limites des positionnements qualitatifs et quantitatifs en amont de la constitution (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  29.  8
    Corpus, classes and collection in Conversation Analysis.Michel de Fornel & Maud Verdier - 2018 - Corpus 18.
    Les vingt dernières années ont vu l’apparition d’une convergence forte entre une démarche appliquée se consacrant à la création de corpus de grande taille, à leur codage et à leur étiquetage, et diverses théories linguistiques dont les analyses reposent sur de tels corpus. Pour l’analyse de conversation (ou linguistique interactionnelle) une telle convergence ne semble pas possible, car son approche est qualitative et s’appuie sur de « petits » corpus. De plus, un examen approfondi du contexte social des interactions (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  30. Notre analyse a pour but de présenter certains problèmes concernant la traduction des expressions" figées". Les ixpn. ZAfii. OYVi,{$ iql, habituellement appe-lées" idiomatiques", sont des phrases dont le sens. [REVIEW]Problemes Lexico-Syntaxiques de Traduction - 1985 - Contrastes: Revue de l'Association Pour le Developpement des Études Contrastives 10:129.
    No categories
     
    Export citation  
     
    Bookmark  
  31.  5
    Syntactic Annotation of Old French Text Corpora.Achim Stein - 2008 - Corpus 7.
    Dans un premier temps, cette contribution fournit une présentation rapide des corpus médiévaux, principalement pour l’anglais et le français, en relation avec des projets d’annotation centrés sur l’annotation syntaxique. La seconde partie traite des aspects spécifiques de l’annotation syntaxique pour les textes d’ancien français et s’intéresse particulièrement aux interactions entre la préannotation automatique et les outils d’annotation manuelle.
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  32.  11
    Apports du TAL à la constitution et à l’exploitation d’un corpus scolaire au travers du développement d’un outil d’annotation orthographique.Claire Wolfarth, Claude Ponton & Corinne Totereau - 2017 - Corpus 16.
    Le travail présenté dans cet article s’inscrit dans une recherche qui a pour but la constitution d’un corpus scolaire et le développement d’un outil d’aide à son exploitation à partir de l’annotation de phénomènes linguistiques saillants. Nous nous concentrerons ici sur les écrits produits en fin de classe de CP par des scripteurs encore débutants. L’objet de ce travail est d’explorer les possibilités qu’offre le traitement automatique des langues pour appréhender ces écrits particulièrement éloignés de la norme. L’hypothèse est (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  33.  8
    Semiology: in the light of Saussure’ words.Rossana De Angelis - 2022 - Semiotica 2022 (244):131-144.
    What does Saussure really mean by “semiology”? This is the question we try to answer in this text. In fact, reading his writings and notes, we realize that Saussure uses the term “semiology” in different contexts and with different meanings. So the notion of “semiology” issued from his works is more complex than it seems because it undergoes several transformations throughout the development of Saussurian thought. The term “semiology” never appears in the texts published during in his lifetime, but we (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  34.  20
    Corpus de langue des signes : situer les biais des méthodes d'annotation et d'analyse.Annelies Braffort, Emilie Chételat-Pelé & Jérémie Segouat - 2011 - Corpus 10 (10):25-40.
    Cet article propose un tour d’horizon de différents types de biais que l’on peut rencontrer dans les études basées sur l’annotation de corpus vidéo de langue des signes. En tâchant de situer objectivement les choix effectués et les biais potentiels à chaque étape, nous décrivons les méthodologies que nous avons mises en place dans trois études, portant respectivement sur la synchronisation des composantes corporelles, le mouvement des sourcils et les clignements des yeux, puis la coarticulation.
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  35.  2
    Syntactic Annotation of Old French Text Corpora.Achim Stein - 2008 - Corpus 7.
    Dans un premier temps, cette contribution fournit une présentation rapide des corpus médiévaux, principalement pour l’anglais et le français, en relation avec des projets d’annotation centrés sur l’annotation syntaxique. La seconde partie traite des aspects spécifiques de l’annotation syntaxique pour les textes d’ancien français et s’intéresse particulièrement aux interactions entre la préannotation automatique et les outils d’annotation manuelle.
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  36.  17
    La Grammaire dialectale de l'espagnol à travers le Corpus oral et sonore de l'espagnol rural (coser, Corpus oral y sonoro del español rural).Inés Fernández-Ordóñez - 2010 - Corpus 9:81-114.
    Le Corpus oral et sonore de l’espagnol rural(COSER) est un corpus d’enquêtes orales qui a pour but l’étude de la grammaire dialectale dans la péninsule ibérique. Dans cet article, les caractéristiques du COSER et la méthodologie suivie sont décrites et comparées à celles des atlas pour ce qui concerne la recherche sur la grammaire dialectale. Grâce au COSER, de nombreux aspects syntaxiques peu connus ou totalement ignorés des dialectes espagnols ont pu être étudiés, tels que plusieurs paradigmes pronominaux, la substitution (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  37.  11
    Nathalie Garric, Julien Longhi (dir.). — L’analyse linguistique de corpus discursifs. Des théories aux prat.Sylvie Mellet - 2010 - Corpus 9:302-308.
    Ce recueil d’articles fait suite à une journée d’étude organisée à Tours en janvier 2008 et qui avait pour objectif de décrire comment le discours, appréhendé à travers des études de corpus, devient un lieu majeur de l’analyse linguistique et un observatoire de certains faits langagiers susceptibles d’être théorisés comme phénomènes sociaux. Les cadres théoriques sollicités sont variés, mais relèvent tous peu ou prou à la fois du courant énonciativiste francophone et de l’école française de l...
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  38.  11
    La Grammaire dialectale de l’espagnol à travers le Corpus oral et sonore de l’espagnol rural (coser, Corpus oral y sonoro del español rural).Inés Fernández-Ordóñez - 2010 - Corpus 9:81-114.
    Le Corpus oral et sonore de l’espagnol rural(COSER) est un corpus d’enquêtes orales qui a pour but l’étude de la grammaire dialectale dans la péninsule ibérique. Dans cet article, les caractéristiques du COSER et la méthodologie suivie sont décrites et comparées à celles des atlas pour ce qui concerne la recherche sur la grammaire dialectale. Grâce au COSER, de nombreux aspects syntaxiques peu connus ou totalement ignorés des dialectes espagnols ont pu être étudiés, tels que plusieurs paradigmes pronominaux, la substitution (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  39. “Identifying Phrasal Connectives in Italian Using Quantitative Methods”.Edoardo Zamuner, Fabio Tamburini & Cristiana de Sanctis - 2002 - In Stefania Nuccorini (ed.), Phrases and Phraseology – Data and Descriptions. Peter Lang Verlag.
    In recent decades, the analysis of phraseology has made use of the exploration of large corpora as a source of quantitative information about language. This paper intends to present the main lines of work in progress based on this empirical approach to linguistic analysis. In particular, we focus our attention on some problems relating to the morpho-syntactic annotation of corpora. The CORIS/CODIS corpus of contemporary written Italian, developed at CILTA – University of Bologna (Rossini Favretti 2000; Rossini Favretti, Tamburini, (...)
    Direct download  
     
    Export citation  
     
    Bookmark  
  40.  6
    History of mediæval philosophy.Maurice Marie Charles Joseph de Wulf & Ernest Charles Messenger - 1935 - New York [etc.]: Longmans, Green and co.. Edited by Ernest C. Messenger.
    This book has been considered by academicians and scholars of great significance and value to literature. This forms a part of the knowledge base for future generations. So that the book is never forgotten we have represented this book in a print format as the same form as it was originally first published. Hence any marks or annotations seen are left intentionally to preserve its true nature.
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  41.  14
    Les enjeux de l’emploi communautaire de motifs séquenciels en analyse du discours.Pascale Mounier - 2018 - Corela. Cognition, Représentation, Langage.
    La linguistique de corpus a fait avancer ces dernières années l’étude du cliché linguistique en mettant au point des techniques de repérage et de calcul de fréquence de suites syntaxiques à classes de mots identiques. Ce qu’elle appelle le « motif séquenciel » peut trouver une pertinence en analyse du discours en particulier quand il sert de révélateur d’un langage communautaire forgé par des locuteurs en relation idéologique. C’est ce que confirme la présence de motifs séquenciels à lexèmes (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  42.  18
    Marcel Cori, Sophie David, Jacqueline LÉon (dir.). — Langages n°171 « Construction des faits en linguistique : la place des corpus ». Paris : Larousse, septembre 2008, 132 pages. [REVIEW]Sylvie Mellet - 2009 - Corpus 8.
    Cette livraison de la revue Langages semble avoir un objectif éditorial officiel, affiché dans son titre, consistant à porter un regard réflexif et critique sur les apports et les limites des (grands) corpus à divers domaines de l’analyse linguistique, et un objectif profond, moins immédiatement perceptible mais sans doute premier dans l’esprit des coordinateurs et particulièrement de Marcel Cori, consistant à remettre à sa juste place la linguistique de corpus accusée d’avoir des ambitions h..
    No categories
    Direct download  
     
    Export citation  
     
    Bookmark  
  43.  12
    Constitution d’un corpus plurilingue en sociolinguistique historique : objectifs, méthodologie et défis.Carole Werner - 2024 - Corpus 25.
    Cet article présente et discute la méthodologie de construction d’un corpus plurilingue en diachronie longue (1681-1914). Puisqu’il n’existait pas de corpus alsacien significatif, un important travail de construction d’un corpus significatif a été mené afin de constituer un corpus documentant les contacts linguistiques dans les écrits des locuteurs-scripteurs alsaciens. Cette tâche a présenté un certain nombre de défis méthodologiques causés par le contact des langues, la variation sociolinguistique et diachronique, le manque de sources primaires et de documents numérisés. Parmi ces (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  44.  8
    Exploring corpus of tweets: from computer processing to complex discursive analysis.Julien Longhi - 2020 - Corpus 20.
    Cet article synthétise les acquis et développements issus de projets de recherche menés depuis 2013 à propos de l’analyse d’un type particulier de données CMC (Computer-mediated communication) : les tweets politiques. Après une caractérisation de ce genre de discours, et des problématiques soulevées, l’article développe les enjeux de l’exploration des corpus de ce genre ; l’appréhension et la constitution de ces données sociales en corpus ; la production de résultats scientifiques, et la mise en place de différents types d’exploration de (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  45.  28
    Nathalie Garric, Julien Longhi (dir.). — L'analyse linguistique de corpus discursifs. Des théories aux pratiques, des pratiques aux théories. Numéro des Cahiers du Laboratoire de Recherche sur le Langage. Clermont-Ferrand : Presses universitaires Blaise-Pascal, 2009, 142 pages, 15 €. [REVIEW]Sylvie Mellet - 2010 - Corpus 9:302-308.
    Ce recueil d’articles fait suite à une journée d’étude organisée à Tours en janvier 2008 et qui avait pour objectif de décrire comment le discours, appréhendé à travers des études de corpus, devient un lieu majeur de l’analyse linguistique et un observatoire de certains faits langagiers susceptibles d’être théorisés comme phénomènes sociaux. Les cadres théoriques sollicités sont variés, mais relèvent tous peu ou prou à la fois du courant énonciativiste francophone et de l’école française de l..
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  46.  10
    On Magic: An Arabic critical edition and English translation of Epistle 52, Part 1.Godefroid de Callataÿ & Bruno Halflants (eds.) - 2011 - Oxford: Oxford University Press.
    The Ikhwan al-Safa (Brethren of Purity), the anonymous adepts of a tenth-century esoteric fraternity based in Basra and Baghdad, hold an eminent position in the history of science and philosophy in Islam due to the wide reception and assimilation of their monumental encyclopaedia, the Rasa'il Ikhwan al-Safa (Epistles of the Brethren of Purity). This compendium contains fifty-two epistles offering synoptic accounts of the classical sciences and philosophies of the age; divided into four classificatory parts, it treats themes in mathematics, logic, (...)
    Direct download  
     
    Export citation  
     
    Bookmark  
  47.  7
    La BFM 2022 : un corpus pour les recherches diachroniques en français médiéval et au-delà.Alexei Guillot-Barbance Lavrentiev - 2024 - Corpus 25.
    La Base de français médiéval (BFM) fait partie des corpus de français médiéval (9e-15e s.) les plus anciens et les plus utilisés par les linguistes diachroniciens et plus largement par tous ceux qui s’intéressent à l’histoire du français. Elle est le fruit d’une collaboration entre linguistes-philologues et spécialistes de la méthode textométrique implémentée dans la plateforme TXM. L’article présente un état des lieux du corpus BFM2022 focalisé sur la représentativité et l’interopérabilité des données. Il illustre l’apport des outils numériques pour (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  48.  8
    Constitution et usage de corpus en linguistique berbère : introduction.Sabrina Bendjaballah & Samir Ben Si Saïd - 2015 - Corpus 14.
    Ce numéro de la revue CORPUS est consacré au domaine berbère, l’une des branches de la famille afro-asiatique, et en particulier à la constitution et aux usages de corpus en linguistique berbère. Certains aspects de la structure grammaticale des langues berbères ainsi que de leur diversité étant encore peu connus, l’objectif général de ce volume est de faire progresser notre connaissance de la (micro)variation dans la famille berbère. Tout d’abord, il importe de garder à l’esprit que les lang...
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  49.  12
    Linguistique du corpus pour les variétés à faible densité. Langues minoritaires et enquêtes morphologiques basées sur corpus.Livio Gaeta, Marco Angster, Raffaele Cioffi & Marco Bellante - 2022 - Corpus 23.
    Corpus linguistics grew up in the domain of written (and literary) varieties, while its recent methodological revolution is due to the computer-assisted capacity of elaborating massive amounts of text data. On the other hand, the so-called ‘low-density varieties’, including spoken varieties as well as varieties spoken in minority communities, have been confined to a rather marginal role. Among others, this is due to the technical problems connected to the scarce degree of normalization in linguistic –including graphemic– terms, as well as (...)
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  50.  12
    The diachronic evolution of artistic terminology in translation. Building a parallel corpus of Giorgio Vasari’s Le Vite.Valeria Henkel Zotti - 2024 - Corpus 25.
    This article describes the methods involved in building a diachronic multilingual corpus devoted to Fine Arts, beginning with G. Vasari's Lives of the most excellent Italian architects, sculptors and painters (1568) as the fundamental source text in the field of Art History. Attention is given to automatic pre-alignment, the special proofreading protocol and segmentation rules developed to allow multilingual and/or diachronic alignment of multiple texts, and the difficulties inherent in annotating a multilingual database. A case study is offered, comparing the (...)
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
1 — 50 / 1000