4 found
Order:
  1.  19
    Les corpus de la communication médiée par les réseaux : une introduction.Céline Poudat, Ciara R. Wigham & Loïc Liégeois - 2020 - Corpus 20.
    Si le développement du web a rendu accessibles des masses de données numériques, facilitant la collecte de textes et le développement de corpus, il a également donné naissance à de nouveaux genres qui défient les représentations, les méthodes et les grilles d’analyses développées jusqu’à présent. Ainsi a-t-on vu apparaître des corpus assez éloignés des premiers corpus écrits traditionnels, regroupés sous la bannière de la CMR (Communication Médiée par les Réseaux / Computer-Mediated Communica...
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  2.  62
    Variation sociolinguistique et réseau social : constitution et traitement d’un corpus de données orales massives1.Aurélie Nardy, Hélène Bouchet, Isabelle Rousset, Loïc Liégeois, Laurence Buson, Céline Dugua & Jean-Pierre Chevrot - 2021 - Corpus 22.
    Nous présentons une étude originale en cours visant la compréhension des relations entre variations sociolinguistiques et réseau social. Sa démarche empirique repose sur le recueil de données sociales et langagières massives et longitudinales au sein d’une école maternelle. Environ 200 individus (enfants et adultes) sont équipés une semaine par mois pendant 3 ans de capteurs qui enregistrent en continu à la fois leurs interactions verbales et leurs contacts sociaux. Dans cet article, à visée principalement méthodologique, nous exposons les dispositifs mis (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  3.  16
    Vers un outillage informatique optimisé pour corpus langagiers oraux en vue d’une exploitation textométrique : le cas des interrogatives partielles dans ESLO.Flora Badin, Loïc Liégeois, Gabriel Thiberge & Christophe Parisse - 2021 - Corpus 22.
    Pour répondre aux problématiques engendrées par la diffusion de plus en plus massive des corpus linguistiques et à l’hétérogénéité de leurs formats, nous proposons une méthode permettant de prendre en main des corpus langagiers oraux et de les convertir dans un format permettant leur exploitation outillée. Pour cette recherche, le corpus ESLO nous sert d’exemple par sa licence de diffusion, son format, son volume et ses atouts sociolinguistiques et diachroniques. Notre travail se fonde sur la compilation de ce corpus pour (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  4.  2
    Des bruits dans mon corpus : des données à réduire au silence, à atténuer ou à écouter attentivement?Loïc Liégeois - 2025 - Corpus 26 (26).
    In the field of NLP, “noise” is a notion with many different meanings. This is also true in fields of linguistics in which the analysis of ecological data is central.In studies involving corpus linguistic methods, noise management is an essential process for data collection, data structuration and data analysis. Paradoxically, this step is almost never developed, or completely ignored.In this paper, we propose to focus on the management of noise during the various stages classically defined in the processing of an (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark