Discours numériques et approches outillées : quelques réflexions sur les apports des métadonnées


Abstract


This paper examines the role of metadata and annotations in the analysis of digital corpora by linguistic analysis tools. The present study is grounded in a discursive approach to the analysis of linguistic data. This conceptual framework determines both the concept of the corpus adopted for the study and the methodological principles guiding its exploration. The structuring of the corpus through metadata represents a pivotal juncture between the digital constitution of the material observed and the way in which it can be explored by means of corpus analysis tools. The paper initially addresses the methodological transformations, and the epistemological implications produced by digital resources. The evolving conceptualization of empirical data and the nature of the objects of study are also highlighted. A typology of metadata is then proposed, based on two main parameters: the different types of information they represent, on the one hand, and the characteristics of the data, on the other. Specific focus is directed towards the digital discourses of Web 2.0.

Keywords: corpus; digital discourse; corpus analysis tools; corpus structure; annotations

References


Adam J.-M. 1997, Unités rédactionnelles et genres discursifs : cadre général pour une approche de la presse écrite, in « Pratiques » 94 [1], pp. 3 18.

Bibié L. 2019, Utilisation de ok sur Twitter, entre (re)présentation de soi et stabilisation énonciative, in « Lexique » 25, pp. 57 75.

Cagninelli C. 2022, Positionnements discursifs dans le débat public sur la fin de vie : variations génériques entre (inter)subjectivité et interdiscursivité, Thèse de doctorat, Università di Modena e Reggio Emilia/CY Cergy Paris Université, Modena.

Cagninelli C. 2023, Corpus et observables discursifs : quelle(s) articulation(s) entre réflexion épistémologique et exigences méthodologiques ? Quelques considérations à partir d’un cas concret d’application, communication présentée au Colloque jeunes chercheuses et chercheurs de R2DIP 2023, Observables, observant.es, observés : construire et analyser des objets en analyse du discours, 18 et 19 décembre, CY Cergy Paris Université.

Cagninelli C. 2024, Effets rhétoriques de l’augmentation énonciative des discours numériques. Le cas des “retweets avec citation”, in « Lingue e Linguaggi » 62, pp. 205 226.

Cagninelli C. sous évaluation, Genres de discours et hétérogénéités en corpus. Une approche méthodologique des variations intra- et intergénériques.

Cagninelli C. et Taglioli M. 2022, Visaneco [Computer software].

Charaudeau P. 2011, Les médias et l’information. L’impossible transparence du discours, De Boeck Université, Bruxelles.

Condamines A. 2005, Linguistique de corpus et terminologie, in « Langages » 157 [1], pp. 36 47.

Condamines A. 2022, Présentation, in « Éla. Études de linguistique appliquée » 208 [4], pp. 391 394.

Constantin de Chanay H. et Ferron S. 2017, Introduction, in « Le discours et la langue. Revue de linguistique française et d’analyse du discours » 9 [2], pp. 7-19.

Cori M., David S. et Léon J. 2008, Présentation : éléments de réflexion sur la place des corpus en linguistique, in « Langages » 171 [3], pp. 5 11.

Culioli A. 1968, La formalisation en linguistique, in « Cahiers pour l’analyse » 9, pp. 106-109.

Dalbera J.-Ph. 2002, Le corpus entre données, analyse et théorie, in « Corpus » 1. http://journals.openedition.org/corpus/10

Duteil-Mougel C. 2006, Groupements de textes et corpus : point de vue linguiste, in Duteil-Mougel C. et Foulquié B. (éds.), Actes du Colloque international et école d’été « Corpus en Lettres et Sciences sociales – Des documents numériques à l'interprétation », pp. 205-216.

Garric N. et Longhi J. 2012, L’analyse de corpus face à l’hétérogénéité des données : d’une difficulté méthodologique à une nécessité épistémologique, in « Langages » 187 [3], pp. 3 11.

Garric N. 2012, Construire et maîtriser l’hétérogénéité par la variation des données, des corpus et des méthodes, in « Langages » 187 [3], pp. 73 92.

Kerbrat-Orecchioni C. 2017, « Observable » et « observer » en sciences du langage, in « Le discours et la langue. Revue de linguistique française et d’analyse du discours » 9 [2], pp. 21-45.

Longhi J. 2018, Du discours comme champ au corpus comme terrain : contribution méthodologique à l’analyse sémantique du discours, L’Harmattan, Paris.

Longhi J. 2020, Explorer des corpus de tweets : du traitement informatique à l’analyse discursive complexe, in « Corpus » 20. http://journals.openedition.org/corpus/4567

Longhi J. 2021, Du corpus réflexif au corpus réfléchi : la plateforme #Idéo2017 pour extraire contextuellement les pratiques citationnelles et analyser la circulation des discours politiques sur Twitter, in « Le discours et la langue. Revue de linguistique française et d’analyse du discours » 12 [2], pp. 99 113.

Longhi J. et Sarfati G.-E. 2018, Conception du corpus et méthodologie d’analyse : Pour un renouvellement de l’analyse des discours institutionnels et politiques, in « Semiotica » 223, pp. 87 110.

Maingueneau D. 2014, Discours et analyse du discours : une introduction, A. Colin, Paris.

Mayaffre D. 2002, L’Herméneutique numérique, in « L’Astrolabe. Recherche littéraire et Informatique », numéro spécial, pp. 151 161. .

Mayaffre D. 2005, Rôle et place des corpus en linguistique : réflexions introductives, in « Actes des Journées d’Etude TOUlousaines JETOU 2005 », pp. 5 17

Mayaffre D. 2010, Corpus et web-corpus. Réflexion sur la corporalité numérique, in « Cahiers de praxématique » 54 55, pp. 233 248.

Moirand S. 2007, Les discours de la presse quotidienne : observer, analyser, comprendre, Presses universitaires de France, Paris.

Née É. et Fleury S. 2017, Constituer un corpus en trois scénarios, in Née É. (éd.), Méthodes et outils informatiques pour l’analyse des discours, Presses universitaires de Rennes, Rennes, pp. 63-101.

Neveu F. 2016, Observatoires et observables en linguistique française, in « Le français moderne – Revue de linguistique française » 84 [1], pp. 1-12

Paveau M.-A. 2013, Analyse discursive des réseaux sociaux numériques [Dictionnaire]. Technologies discursives. Consulté à l’adresse https://doi.org/10.58079/uowy

Paveau M.-A. 2015, Ce qui s’écrit dans les univers numériques. Matières technolangagières et formes technodiscursives, in « Itinéraires » 2014 1. http://journals.openedition.org/itineraires/2313

Paveau M.-A. 2017, L’analyse du discours numérique : dictionnaire des formes et des pratiques, Hermann, Paris.

Pincemin B. 1999, Construire et utiliser un corpus : le point de vue d’une sémantique textuelle interprétative, in Condamines A., Péry-Woodley M.-P. et Fabre C. (éds), Atelier Corpus et TAL : pour une réflexion méthodologique (TALN 99), Cargèse, pp. 26-36.

Pincemin B. 2012, Hétérogénéité des corpus et textométrie, in « Langages » 187 [3], pp. 13-26.

Pincemin B. 2020, La textométrie en question, in « Le français moderne – Revue de linguistique française » 88 [1], pp. 26-43.

Poudat C. et Landragin F. 2017, Explorer des données textuelles : méthodes – pratiques – outils, De Boeck supérieur, Louvain-la-Neuve.

Rastier F. 2001, Sémiotique et sciences de la culture, in « Linx » [En ligne] 44. http://journals.openedition.org/linx/1058

Rastier F. 2011, La mesure et le grain. Sémantique de corpus, H. Champion, Paris.


Full Text: PDF

Refbacks

  • There are currently no refbacks.
کاغذ a4

Creative Commons License
This work is licensed under a Creative Commons Attribuzione - Non commerciale - Non opere derivate 3.0 Italia License.