125 39 28MB
French Pages 335 [336] Year 2023
Phraséologie et terminologie
Beihefte zur Zeitschrift für romanische Philologie
Herausgegeben von Éva Buchi, Claudia Polzin-Haumann, Elton Prifti und Wolfgang Schweickard
Band 480
Phraséologie et terminologie Édité par Paolo Frassi
Volume publié avec le concours de l’Università di Verona – Dipartimento di Lingue e Letterature Straniere et du Ministère de la Culture
Ce volume adopte le système d’évaluation de la double lecture en aveugle (double blind peer review)
ISBN 978-3-11-074959-5 e-ISBN (PDF) 978-3-11-074985-4 e-ISBN (EPUB) 978-3-11-074989-2 ISSN 0084-5396 Library of Congress Control Number: 2023936491 Bibliographic information published by the Deutsche Nationalbibliothek The Deutsche Nationalbibliothek lists this publication in the Deutsche Nationalbibliografie; detailed bibliographic data are available on the internet at http://dnb.dnb.de. © 2023 Walter de Gruyter GmbH, Berlin/Boston Typesetting: Integra Software Services Pvt. Ltd. Printing and binding: CPI books GmbH, Leck www.degruyter.com
Table des matières Paolo Frassi Introduction
1
Valérie Delavigne Terme, phraséologie, discours. Une approche socioterminologique
7
Maria Francesca Bonadonna Phraséologie et enseignement du français commercial. Un parcours historique à travers les méthodologies de FLE 27 Maria Teresa Zanola La formation des phrasèmes terminologiques entre diachronie et variation 47 Delphine-Anne Rousseau Phrasèmes terminologiques et collocations technolectales
59
Alain Polguère Les modificateurs redondants et leur rôle en terminologie. De l’amour physique aux masques de protection 83 Jingrao Li, Agnès Tutin Quels traitements pour la phraséologie scientifique transdisciplinaire dans une perspective d’aide à la rédaction ?
105
Daniela Liliana Dincă, Chiara Preite Présence et traitement des collocations verbales dans les vocabulaires juridiques français 131 Michela Tonti Le phraséoterme à la confluence de la langue naturelle, de la langue de spécialité et des néoformations. « Ajustement cosmétique », « injonction de diversité », « fonction contrôle gestion garde-fou » et bien d’autres 151
VI
Table des matières
Ping-Hsueh Chen, Rui Yan Les constructions Verbe causatif + Nom dans les textes institutionnels. Approche contrastive (français/chinois) 189 Éric André Poirier Dispositif empirique semi-automatique de découverte des expressions multilexémiques et des patrons phraséologiques à partir d’un corpus parallèle de traduction spécialisée 215 Silvia Calvi, Patrick Drouin, Paolo Frassi Acquisition (semi)-automatique des collocations terminologiques. Exploration dans le domaine du droit du commerce international
239
Federica Vezzani Vers une méthodologie pour l’extraction et la classification automatiques des collocations terminologiques verbales en langue médicale 259 Nicoletta Armentano Traits définitoires et configurations actantielles dans la fiche terminologique DIACOM-fr. Une étude de cas dans le domaine du commerce international 279 Claudia Cagninelli Du développement durable à la transition écologique dans les tweets. Des phraséotermes concurrents du domaine écologique ? 305
Paolo Frassi
Introduction Ce volume s’inscrit dans le cadre du projet d’envergure Les Humanités Numériques appliquées aux langues et littératures étrangères (Département des Langues et Littératures Étrangères, Université de Vérone), qui a obtenu un financement de presque six millions d’euros de la part du Ministère italien de l’Éducation Nationale, de l’Université et de la Recherche. Il s’agit d’un projet de cinq ans (2018–2022) dans lequel les humanités numériques se déclinent, dans leurs multiples fonctions, dans plusieurs domaines, notamment la littérature et la philologie, la linguistique et la didactique des langues. Nous représentons ici le versant linguistique de ce projet, appelé PaLC-DH, qui fédère plusieurs sous-projets, dont le projet DIACOM-fr, qui nous voit impliqués dans la constitution d’une base de données terminologique concernant le domaine du commerce international. Cette base de données se configure comme un réseau terminologique qui sera disponible en ligne, en libre accès. La mise en ligne de la base de données DIACOM-fr n’est que l’aboutissement d’un projet qui prévoit un certain nombre d’étapes intermédiaires : la constitution d’un corpus et la mise en place d’un outil qui en permette la consultation ; l’extraction automatique de termes simples et complexes ; la mise en réseau/représentation de ces termes dans une base de données terminologique. C’est à partir des réflexions partagées au sein de notre équipe qu’on a ressenti l’exigence d’explorer un certain nombre de questions concernant les unités phraséologiques en terminologie ; ces questions concernaient particulièrement l’identification, la description terminographique et la représentation d’unités terminologiques multilexémiques qui partagent les mêmes propriétés formelles que les unités phraséologiques ou phrasèmes (notamment les locutions et les collocations). Il existe un grand nombre d’études sur les unités phraséologiques relevant de la langue générale (voir, par exemple : Bally 1909 ; Sechehaye 1921 ; Fiala 1987 ; Misri 1987 ; Danlos 1988 ; Gréciano 1993 ; Nunberg/Sag/Wasow 1994 ; Gross 1996 ; Fiala/Lafon/Piguet 1997 ; Martins-Baltar 1997 ; Moon 1998 ; Tollis 2001 ; Lamiroy 2003 ; 2016 ; Langlotz 2006 ; Blumenthal/Mejri 2008 ; Granger/Paquot 2008 ; Anscombre/Mejri 2011 ; Legallois/Tutin 2013 ; Mel’čuk 2013 ; González Rey 2015 ; Polguère 2015 ; Klein/Lamiroy 2016 ; Pausé 2017) ; on en retrouve également un nombre conséquent en langue de spécialité (voir, par exemple, Galinski 1990 ; Cabré 1992 ; De Bessé 1992 ; Lainé/Pavel/ Boileau 1992 ; Rousseau 1993 ; Pavel 1993a ; 1993b ; Gouadec 1993 ; 1994 ; Candel 1995 ; L’Homme 1995 ; 2000 ; 2004 ; 2009 ; Barkema 1996 ; Montero Martínez/García de Quesada/Fuertes Olivera 2002 ; Drouin 2003 ; Vittoz 2005 ; Pecman 2012 ; Tutin/Grosshttps://doi.org/10.1515/9783110749854-001
2
Paolo Frassi
mann 2013 ; Rosembaum 2016 ; Abreu 2018 ; Jacques/Tutin 2018 ; Zanola 2018 ; Frassi/ Calvi/Humbley 2020). La question de l’existence d’unités phraséologiques en terminologie n’est pas anodine : les unités terminologiques multilexémiques sont omniprésentes en langue de spécialité et s’apparentent à – ou se confondent avec – des unités phraséologiques de type locution (par exemple, dans le domaine du marketing : marge arrière, point de vente, marché intérieur) ou de type collocation (par exemple, toujours dans le domaine du marketing : attitude positive, performance objective). À notre connaissance, aucune méthode systématisée pour le classement des unités phraséologiques en langue de spécialité, reposant sur des critères syntacticosémantiques spécifiques ou partiellement partagés avec ceux communément en usage dans la langue générale, ne fait encore l’unanimité chez les terminologues et les terminographes. Pour cette raison, hormis quelques rares cas (ex. : Termium ; DiCoEnviro ; DiCoInfo) répertoriant des collocations, la plupart des bases de données terminologiques actuellement disponibles se bornent à présenter les unités multilexémiques comme des termes complexes, sans aller plus loin dans la proposition d’un typage qui pourrait être discrétisant. L’objectif de ce volume est de réunir des études dans le domaine de la phraséologie et de la terminologie afin de partager des réflexions au sujet des propriétés syntactico-sémantiques des unités multilexémiques de type phrasèmes – notamment les locutions et les collocations – qui peuplent les langues de spécialité. Les études qui suivent abordent la question sous plusieurs versants et selon des perspectives diversifiées. Nous proposons, d’entrée de jeu, la réflexion de Valérie Delavigne sur les « objets phraséologiques » selon une approche socioterminologique qui nous fournit l’ampleur du paradigme désignationnel par lequel ces mêmes objets se déclinent. Nous poursuivons par la présentation, de la part de Maria Francesca Bonadonna, des principales méthodes d’enseignement des phrasèmes se succédant au fil des siècles, avec une attention particulière pour l’enseignement du FLE en domaine de spécialité, notamment le commerce international. L’étude de Maria Teresa Zanola s’intéresse aux principaux enjeux des phrasèmes terminologiques dans une perspective diachronique à partir d’un ensemble de données issues du domaine des mathématiques et du domaine monétaire : elle se propose de mettre en évidence les degrés de variation existant dans les systèmes du figement terminologique. C’est toujours dans une perspective diachronique que les concepts de phrasème terminologique, collocation technolectale et phraséologisme sont définis à partir de l’analyse de données provenant de la terminologie musicale dans l’article de Delphine-Anne Rousseau.
Introduction
3
La contribution d’Alain Polguère se concentre sur un type particulier de collocations, celles à modificateur redondant, qui explique la raison d’être, pour ainsi dire, d’un certain nombre d’unités terminologiques, sans négliger leur modélisation lexicographique à travers une exemplification proposée au sein des modèles appelés Systèmes Lexicaux. La phraséologie scientifique transdisciplinaire est au cœur de l’étude de Jingrao Li et Agnès Tutin : à partir de la base phraséologique constituée au sein du LIDILEM (Université Grenoble Alpes), les auteurs décrivent trois types d’accès (onomasiologique, sémasiologique et par traduction) à leur outil d’aide à la rédaction. Daniela Liliana Dincă et Chiara Preite s’occupent de quelques aspects des collocations verbales dans le domaine juridique : à partir des deux classes d’objets et , elles nous offrent un panorama du traitement de ces unités phraséologiques dans quelques ouvrages lexicographiques français. L’article de Michela Tonti se propose de fournir une analyse empirique de la phraséologie dans le domaine de la comptabilité, à partir d’une extraction effectuée ad hoc et une comparaison d’un corpus de référence de grande envergure. Les données multilexémiques sont analysées pour leur saillance terminologique ainsi que du point de vue de leur apport à la néologie terminologique. Un autre type d’unités phraséologiques, à savoir les constructions verbe causatif + nom, fait l’objet de l’étude de Ping-Hsueh Chen et Rui Yan. Les auteurs proposent une analyse contrastive français/chinois, selon les trois perpectives syntaxique, sémantique et pragmatique, de ces constructions à partir d’un ensemble de données issues du domaine institutionnel, notamment du corpus de l’ONU. Éric André Porier illustre le fonctionnement d’un dispositif empirique semiautomatique de découverte des expressions multilexémiques dans le cadre d’un ensemble de données provenant de textes de loi du Québec traduits du français à l’anglais en vigueur le 4 juillet 2018. L’extraction des unités phraséologiques fait également l’objet de l’étude de Silvia Calvi, Patrick Drouin et Paolo Frassi, qui se propose d’illustrer une méthode semi-automatique d’extraction de collocations terminologiques à partir du corpus DIACOM-fr, notamment le sous-corpus du droit du commerce international (Département des Langues, Université de Vérone). Federica Vezzani propose une méthode pour l’extraction et le classement automatique des collocations verbales dans le domaine médical, à travers la description des phases de prétraitement du corpus spécialisé, d’extraction automatique, de formulation de la vérité terrain et d’entraînement et validation d’un système automatique performant pour la langue française. C’est dans la pratique terminographique que nous convoie l’étude de Nicoletta Armentano : sur la base de son expérience de rédaction de fiches terminologiques au
4
Paolo Frassi
sein du projet DIACOM-fr, elle étale les principaux enjeux et problèmes du travail du terminographe à travers la présentation de plusieurs cas ayant posé problème. L’ouvrage s’achève sur le profilage lexico-discursif des deux unités phraséologiques du domaine écologique – développement durable et transition écologique – par Claudia Cagninelli. Plus particulièrement, à partir de leur emploi sur Twitter, ces deux phraséotermes sont passés au peigne fin des analyses sémantique et pragmatique.
Bibliographie Abreu, Sabrina Pereira de, Considerações sobre a natureza colocacional e locucional de sintagmas terminológicos, ReDILLeT 1:2 (2018), https://revistas.unc.edu.ar/index.php/ReDILLeT/article/ view/22266 [dernière consultation : 26.11.2021]. Anscombre, Jean-Claude/Mejri, Salah (edd.), Le figement linguistique. La parole entravée, Paris, Champion, 2011. Bally, Charles, Traité de stylistique française, Genève/Paris, Georg & Cie/Klincksieck, 1909. Barkema, Henk, Idiomaticity and terminology. Multi-dimensional descriptive model, Studia Linguistica 50:2 (1996), 125–160. Blumenthal, Peter/Mejri, Salah (edd.), Les séquences figées. Entre langue et discours, Stuttgart, Franz Steiner Verlag, 2008. Cabré, Maria Teresa, La terminologia. La teoria, els mètodes, les aplications, Barcelona, Empúries, 1992. Candel, Danielle, Locutions en langues de spécialité, Cahiers du français contemporain 2 (1995), 151–173. Danlos, Laurence (ed.), Les expressions figées, Langages 90 (1988). De Bessé, Bruno (ed.), Phraséologie et terminologie en traduction et en interprétation. Actes du colloque international de Genève, octobre 1991, Terminologie et traduction 2:3 (1992). Drouin, Patrick, Term extraction using non-technical corpora as a point of leverage, Terminology 9:1 (2003), 99–117. Fiala, Pierre, Pour une approche discursive de la phraséologie. Remarques en vrac sur la locutionalité et quelques points de vue qui s’y rapportent, sans doute, Langage et société 42 (1987), 27–44. Fiala, Pierre/Lafon, Pierre/Piguet, Marie-France (edd.), La locution. Entre lexique, syntaxe et pragmatique, Paris, Klincksieck, 1997. Frassi, Paolo/Calvi, Silvia/Humbley, John, Fouilles de textes et repérage d’unités phraséologiques, in : Terminologie & ontologie. Théories et applications. Actes de la conférence TOTh 2019, Chambéry, Éditions de l'Université Savoie Mont Blanc, 2020, 321–338. Galinski, Christian, Terminology and phraseology, Terminology science and research 1:1/2 (1990), 70–86. González Rey, Isabel, La phraséologie du français, Toulouse, Presses universitaires du Midi, 2015. Gouadec, Daniel, Extraction, description, gestion et exploitation des entités phraséologiques, Terminologies nouvelles 10 (1993), 83–91. Gouadec, Daniel (ed.), Terminologie et phraséologie. Acteurs et aménageurs. Actes de la 2e université d’automne en terminologie, Rennes, 20–25 septembre, Paris, La Maison du Dictionnaire, 1994.
Introduction
5
Granger, Sylviane/Paquot, Magali (edd.), Phraseology. An interdisciplinary perspective, Amsterdam/ Philadelphia, John Benjamins Publishing, 2008. Gréciano, Gertrud, Vers une modélisation phraséologique. Acquis et projets d’EUROPHRAS, Terminologies nouvelles 10 (1993), 16–22. Gross, Gaston, Les expressions figées en français. Noms composés et autres locutions, Paris, Ophrys, 1996. Jacques, Marie-Paule/Tutin, Agnès (edd.), Lexique transversal et formules discursives des sciences humaines, Londres, ISTE Éditions, 2018. Klein, Jean René/Lamiroy, Béatrice, Le figement : unité et diversité. Collocations, expressions figées, phrases situationnelles, proverbes, L’information grammaticale 148 (2016), 15–20. Lainé, Claude/Pavel, Silvia/Boileau, Monique, La phraséologie, nouvelle composante de la recherche terminologique. Travaux du module canadien du Rint, L’actualité terminologique 25:3 (1992), 5–9. Lamiroy, Béatrice, Les notions linguistiques de figement et de contrainte, Lingvisticæ Investigationes 26:1 (2003), 1–14. Lamiroy, Béatrice, How to tell a collocation from an idiom ?, in : Giacomini, Laura/Orlandi, Adriana (edd.), Defining collocations for lexicographic purposes. From linguistic theory to lexicographic practice, Bern, Peter Lang, 2016, 123–151. Langlotz, Andreas, Idiomatic creativity. A cognitive-linguistic model of idiom-representation and idiomvariation in English, Amsterdam/Philadelphia, John Benjamins Publishing, 2006. Legallois, Dominique/Tutin, Agnès, Présentation. Vers une extension du domaine de la phraséologie, Langages 189:1 (2013), 3–25. L’Homme, Marie-Claude, Processing word combinations in existing term banks, Terminology 2:1 (1995), 141–162. L’Homme, Marie-Claude, Understanding specialized lexical combinations, Terminology, 6:1 (2000), 89–109. L’Homme, Marie-Claude, La terminologie. Principes et techniques, Montréal, Les Presses universitaires de Montréal, 2004. L’Homme, Marie-Claude, A methodology for describing collocations in a specialised dictionary, in : Nielsen, Sandro/Tarp, Sven (edd.), Lexicography in the 21st century, Amsterdam, John Benjamins, 2009, 237–256. Martins-Baltar, Michel (ed.), La locution entre langue et usages, Fontenay Saint-Cloud, ENS Éditions, 1997. Mel’čuk, Igor, Tout ce que nous voulions savoir sur les phrasèmes, mais. . ., Cahiers de lexicologie 102:1 (2013), 129–149. Misri, Georges, Approches du figement linguistique. Critères et tendances, La linguistique 23:2 (1987), 71–85. Montero Martínez, Silvia/García de Quesada, Mercedes/Fuertes Olivera, Pedro A., Terminological phrasemes in OntoTerm®. A new theoretical and practical approach, Terminology 8:2 (2002), 177–206. Moon, Rosamund, Fixed expressions and idioms in English. A corpus-based approach, Oxford, Oxford University Press, 1998. Nunberg, Geoffrey/Sag, Ivan A./Wasow, Thomas, Idioms, Language 70:3 (1994), 491–538. Pausé, Marie-Sophie, Structure lexico-syntaxique des locutions et incidence sur leur combinatoire, Thèse de doctorat, Nancy, ATILF-CNRS/Université de Lorraine, 2017. Pavel, Silvia, La phraséologie en langues de spécialité. Méthodologie de consignation dans les vocabulaires terminologiques, Terminologies nouvelles 10 (1993), 67–82 (=1993a).
6
Paolo Frassi
Pavel, Silvia, Vers une méthode de recherche phraséologique en langue de spécialité, L’actualité terminologique 26:2 (1993), 9–13 (=1993b). Pecman, Mojca, Étude lexicographique et discursive des collocations en vue de leur intégration dans une base de données terminologiques, The journal of specialised tranlation (JoSTrans) 18 (2012), 113–138. Polguère, Alain, Non compositionnalité. Ce sont toujours les locutions faibles qui trinquent, Verbum 37:2 (2015), 257–280. Rosembaum Franková, Lucia, Phrasèmes spécialisés dans les textes économiques, Cahiers de lexicologie 108:1 (2016), 43–57. Rousseau, Louis-Jean, Terminologie et phraséologie, deux composantes indissociables des langues de spécialité, Terminologies nouvelles 10 (1993), 9–12. Sechehaye, Albert, Locutions et composés, Journal de psychologie normale et pathologique 18 (1921), 654–675. Tollis, Francis (ed.), La locution et la périphrase du lexique à la grammaire, Paris, L’Harmattan, 2001. Tutin, Agnès/Grossmann, Francis (edd.), L’écrit scientifique : du lexique au discours. Autour de Scientext, Rennes, Presses Universitaires de Rennes, 2013. Vittoz, Marie-Berthe, Les locutions en discours. Vers un inventaire de formes idiomatiques dans la langue des affaires Français-Italien, Alessandria, Edizione dell’Orso, 2005. Zanola, Maria Teresa, Che cos’è la terminologia, Roma, Carocci, 2018.
Valérie Delavigne
Terme, phraséologie, discours Une approche socioterminologique Résumé : Depuis les premières réflexions sur la phraséologie en terminologie dans les années 1980, le champ s’est remarquablement développé. Au-delà des termes, les discours spécialisés actualisent divers types de solidarités lexicales récurrentes, dont le statut n’est pas toujours clair. Le repérage terminologique ébauché ici permet de mesurer l’ampleur du paradigme désignationnel de ces « objets phraséologiques ». Nous en évoquons quatre types repérés dans nos corpus, de nature différente, des termes complexes aux routines discursives, en passant par les collocations et les formules qui constituent les environnements linguistiques des termes, et cherchons à rendre compte de leurs usages et à en saisir les modalités de circulation dans une perspective d’appropriation terminologique. Mots-clés : objet phraséologique, terme complexe, collocation formule, routine discursive, variation Abstract: Since the first reflections on phraseology in terminology in the 1980s, the field has developed remarkably. Beyond terms, specialised discourses actualise various types of recurrent lexical solidarities, whose status is not always clear. The terminological mapping outlined here makes it possible to measure the extent of the designational paradigm of these ‘phraseological objects’. The four types of phraseological objects identified in our corpus have different natures, from complex terms to discursive routines, including collocations and formulas that constitute the linguistic environments of the terms. We seek to account for their use and to understand the modalities of their circulation in a perspective of terminological appropriation. Keywords: phraseological object, complex term, collocation, formula, discursive routine, variation
https://doi.org/10.1515/9783110749854-002
8
Valérie Delavigne
1 Introduction Les discours spécialisés se caractérisent par la mise en œuvre de terminologies spécifiques à une pratique sociale située. Ils se distinguent par l’usage de termes, unités lexicales à la définition stabilisée dans des communautés discursives données, au mode de formation particulier et au statut sémiotique spécifié par les normes en vigueur (ISO 704 et 1087). Si l’on envisage les termes dans leurs fonctionnements langagiers, la problématique du « mot juste » (Mortureux 1994) se trouve reliée de facto à la question des genres discursifs, des situations, voire des thèmes abordés. Analyser le fonctionnement des termes invite à les mettre en relation avec la diversité des discours dans lesquels ils apparaissent et leurs différents modes de circulation, de réception et d’interprétation. Marqueurs de connaissance, marqueurs de savoir-faire, marqueurs identitaires : la fonction sociolinguistique des termes, loin d’être à négliger, détermine leurs conditions d’apparition. Elle pousse à ne plus opposer la « langue générale », bien rarement définie, à des « langues de spécialité » pour repenser le système dans sa globalité en fonction des usages et donc, des discours spécialisés, ce qu’a mis en évidence notamment la socioterminologie (Gaudin 2003). Au-delà des termes, les discours spécialisés actualisent divers types de solidarités lexicales récurrentes, dont le statut n’est pas toujours clair. Si, à l’aube des années 2000, on pouvait faire le constat d’un manque d’études sur la phraséologie, les bibliographies sur le thème sont aujourd’hui copieuses. Depuis plusieurs années, nombre d’études linguistiques se penchent sur le préfabriqué dans la langue, le « déjà-là », « prêt à parler » ou « prêt à écrire », « motifs », « routines » et autres « formules », séquences plus ou moins figées impliquant divers niveaux linguistiques qui sollicitent à la fois le lexique, la syntaxe, la sémantique, dont l’appel au colloque s’est fait l’écho (Misri 1987 ; Krieg-Planque 2009 ; Legallois/ Tutin 2013 ; Née et al. 2016 ; Sitri/Tutin 2016 ; Plane/Rondelli 2017). Les discours spécialisés ne dérogent pas aux règles de la langue : des séquences de nature variable, plus ou moins figées, y sont non seulement présentes, mais, dans certaines sphères d’activité, sont bien plus fréquentes que dans d’autres types de discours (Gautier 2004 ; 2018 ; Aussenac-Gilles/Condamines 2009 ; Pecman 2018). On y trouve aux côtés de termes complexes – parfois d’une longueur telle que la question de leur découpage se pose et que l’on peut se demander si on doit les identifier comme une ou plusieurs unités (Assal/Delavigne 1993) – des collocations et autres séquences phraséologiques, terminologiques ou non, qui permettent d’instancier les termes. Certains aspects syntagmatiques relèvent-ils de la phraséologie et/ou de la terminologie ? Doivent-ils être considérés comme des unités terminologiques spécifiques ? Quel que soit ce statut, si on considère que le rôle essentiel
Terme, phraséologie, discours
9
des terminologies est leur fonctionnalité dans une communauté discursive donnée, ces associations privilégiées doivent être repérées et décrites. Ces questions sont d’importance dès lors que l’on souhaite constituer une ressource terminologique quelle qu’elle soit, base de données, dictionnaire ou glossaire. Comment les repérer ? Sur quels critères les retenir ? Quelle place leur donner ? Comment les décrire ? Comment intégrer les variations repérées ? Car ce n’est plus seulement le « terme juste » qu’il s’agit de pointer, mais sa mise en discours qu’il convient de faciliter. Outre les aspects théoriques que ces questions engagent, elles se posent dans le cadre de deux projets, l’un en lien avec un programme d’information pour les patients atteints de cancer, l’autre à propos d’un ouvrage lexicographique autour de l’écologie. Dans des communications élargies qui dépassent les communautés discursives où les termes circulent d’ordinaire, ces formations préférentielles peuvent, à l’instar des termes, devenir un écueil qu’il convient de repérer et de décrire. Après avoir rappelé les variations de différents niveaux linguistiques des unités terminologiques, ce dont la terminologie de la phraséologie n’est pas exclue, nous ébaucherons un repérage terminologique qui permet de mesurer l’ampleur du paradigme désignationnel des « objets phraséologiques ». Nous évoquerons ensuite plusieurs types d’objets phraséologiques repérés en corpus : des termes complexes aux routines discursives, en passant par les collocations et les formules qui, s’ils ne constituent pas tous des « phraséotermes », constituent des environnements linguistiques immédiats des termes dont il convient de rendre compte.
2 De la variation dans les désignations On pourrait croire à l’invariance des terminologies. Cependant, le vocabulaire est parfois moins réglé que le sens commun ne l’imagine ou qu’on le présuppose. La variation est constitutive de toute pratique langagière, aussi terminologique soitelle, variation qui, nous rappelle la sociolinguistique, peut être de plusieurs ordres. La plus évidente peut-être, la variation diachronique car couplée au changement – Louis Guespin prenait plaisir à évoquer les « germes », « microbes » et autres « micro-organismes » du vocabulaire de la biologie (Guespin 1991) – révèle des alternances de formes et des évolutions de sens ; les autres types de variations (diatopiques, diastratiques, diaphasiques, diamésiques…) intéressent tout autant la terminologie dans la mesure où elles sont indispensables à la description des pratiques langagières en relation avec les communautés discursives qui les actualisent.
10
Valérie Delavigne
Dans les corpus se manifestent différentes économies de discours et les positionnements énonciatifs influent sur les unités à considérer comme termes. Le statut sémiotique de ces unités fluctue selon les discours et affecte la définition même de l’entité terminologique (Petit 2001). Rappelons avec Rastier (1995) que « le régime terminologique des textes varie selon les genres et les discours » : le terme, qui est avant tout une unité lexicale et non une « étiquette référentielle » (Kleiber 2002, 568) à l’instar d’un nom propre, ne peut être identifié comme unité terminologique que par sa valeur dans une situation donnée. Le constat de la variabilité est très vite mené et vient buter contre l’idéal d’univocité et de monoréférentialité d’une certaine terminologie. La terminologie de la phraséologie n’est pas en reste. Les linguistes sont familiers de ces phénomènes de polysémie et d’alternance de formes ; la chose est moins claire lorsqu’il est question de terminologie.
2.1 De la variation en terminologie La variation, difficilement contournable dès lors que l’on se penche sur des corpus – et qui n’est pas incompatible avec la notion de figement –, n’est en effet pas toujours prise en compte. La socioterminologie prend précisément pour objet la circulation des termes en synchronie et en diachronie sous l’angle de la variabilité de leurs usages sociaux, avec une dimension sociocritique : c’est avant tout une analyse de discours qui tente de mettre en lien usages des termes et enjeux de discours. La terminologie est de fait au cœur d’enjeux multiples, que ce soit des enjeux « mondains », autrement dit d’ordre social ou sociétal, ou épistémologiques, relatifs notamment à sa place dans les sciences du langage. Quels que soient les corpus, l’étude des termes et de leur circulation est indissociable de la prise en compte des besoins en présence. Selon les terrains, ceux-ci sont hétérogènes : description terminographique, création de ressources, aide à la traduction, aménagement linguistique, équipement terminologique, normalisation, politique linguistique, documentation, rédaction technique, management, recommandations pour les praticiens... Ils visent parfois des interventions sur la langue qui nécessitent de mettre en relation les langagiers dont la tâche est de compiler, décrire, traiter, planifier, créer des termes, et les usagers qui conçoivent, utilisent, traduisent, rédigent à l’aide de ces mêmes termes. La centration sur les usages contraint à prendre en compte la variété des formes qui circulent dans et entre les communautés discursives, en considérant le terme comme un signe linguistique doté d’un pouvoir d’action ou de connaissances, et non comme étiquette de concepts, tout en appréhendant les enjeux – parler
Terme, phraséologie, discours
11
de résidus radioactifs plutôt que de déchets radioactifs ne produit pas les mêmes effets sémantiques ; dans le milieu hospitalier, un lit peut être tantôt un meuble, tantôt une unité comptable en fonction du point de vue. Les termes peuvent être ainsi replacés dans leurs conditions d’apparition, de circulation et d’interprétation, ce qui n’est pas sans susciter quelques difficultés lorsqu’il s’agit ensuite de produire des ressources terminologiques en y intégrant ces données. Au-delà des enjeux descriptifs, glottonomiques et sociocritiques, la terminologie porte des enjeux épistémologiques pour la discipline en particulier et pour les sciences du langage en général. En se penchant sur les discours spécialisés sur des terrains variés, la terminologie cherche à mieux connaître ces discours et les usages terminologiques, et informe sur les fonctionnements différentiels de la langue comme système. La terminologie bouscule les concepts installés/productifs à tous les niveaux linguistiques (le niveau lexical n’est pas le seul concerné). Sur le plan méthodologique, elle puise dans la linguistique interactionnelle, la linguistique de corpus et l’analyse de discours pour saisir les usages des dénominations et leurs dimensions sociales et culturelles.
2.2 De la variation des objets phraséologiques Le constat de la variation de la terminologie phraséologique n’est plus à faire : des termes complexes aux locutions et autres expressions figées ou idiomatiques, la profusion est patente. Le trait définitoire déterminant, ou en tout cas prototypique, est le figement, plus ou moins prononcé. La langue est souvent rebelle aux tentatives de classification. On peut néanmoins tenter d’y voir un peu plus clair par un rapide relevé terminologique. Rapide, car la bibliographie sur le thème, constituée en corpus, est copieuse et le domaine foisonnant : le tournant du XXIe siècle a produit une multiplication d’études sur la phraséologie dont certaines ont été mentionnées en introduction et auxquelles il faudrait ajouter d’abondantes publications en anglais que nous n’avons pas traitées dans le cadre de ce repérage. De nombreux auteurs, à l’instar de Dominique Legallois et Agnès Tutin, définissent la phraséologie comme un « domaine qui traite les séquences lexicales perçues comme préconstruites » (Legallois/Tutin 2013 ; c’est nous qui soulignons), domaine investi au-delà de la lexicologie par l’analyse textuelle, la syntaxe, la psycholinguistique... Autrement dit, la phraséologie, tout comme la terminologie, est définie à la fois comme l’étude des séquences préconstruites et ces séquences elles-mêmes. Ce sont ces dernières auxquelles nous nous intéressons ici. Une ébauche de la terminologie de la phraséologie à partir de ce corpus spécifique permet de prendre la mesure de l’ampleur du paradigme désignationnel :
12
Valérie Delavigne
Tableau 1 : Paradigme désignationnel de phraséologie : les objets phraséologiques. cliché colligation collocation construction collostruction énoncé lié entité phraséologique expression figée expression idiomatique figement formation syntagmatique formule idiotisme langage formulaire lexie complexe locution mot composé motif patron pattern phrasème phraséologisme phraséoterme polylexicalité routine segment répété semi-figement série phraséologique stéréotype phraséologique synapsie syntagme répété synthème tour syntaxique tournure unité indécomposable unité lexicale étendue (ULE) unité phraséologique vocabulaire combinatoire
Terme, phraséologie, discours
13
La liste, livrée par ordre alphabétique et réductible à notre corpus bibliographique, n’est assurément pas complète. Néanmoins, cette liste, dont les éléments sont à envisager comme voies d’entrée dans les ouvrages et les articles du corpus, autorise déjà quelques remarques. Certains éléments de ce paradigme terminologique – qui ne sont pas à considérer comme des synonymes – offrent des contours conceptuels peu délimités ; d’autres voient leur signification se chevaucher ; d’autres encore ne relèvent pas typiquement de la phraséologie. En bref, chaque terme mériterait à lui seul une description détaillée en étant replacé dans ses usages, replongé dans le corpus et éclairé par les modèles qui les convoque, description dans laquelle nous ne nous engagerons pas ici. Chaque terme doit en tout cas voir son sens précisé avant toute actualisation un peu sérieuse. Salah Mejri s’était déjà prêté à l’exercice terminologique (Mejri 2006). Par un bel exemple d’analyse diachronique, il a montré que le figement, quoiqu’inhérent aux langues naturelles, est un phénomène qui fut pendant longtemps mis de côté. Les différentes études qui l’ont sorti des limbes ont mis l’accent sur son importance dans le fonctionnement des langues, en montrant qu’il dépasse les aspects strictement lexicaux (Legallois/Tutin 2013, notamment). Cette lente maturation explique les flottements terminologiques : on repère en effet des indéterminations d’objet entre certains des termes repérés, soit par réassignation de sens ou nuances conceptuelles, soit par néologie. Or on sait que l’élaboration d’une notion ou d’un concept est liée à la dénomination qui lui est assignée (Humbley 2018). Le repérage terminologique met en évidence les différentes perspectives qui ont amené à doter l’une ou l’autre unité d’une définition plus clairement délimitée ou, au contraire, ont généré des chevauchements, témoignant ainsi au passage de l’importance de l’histoire des sciences du langage pour l’étude des vocabulaires, aussi métalinguistiques soient-ils. Ce constat conduit à devoir négocier le vocabulaire pour ajuster les sens à actualiser selon l’un ou l’autre ancrage épistémologique. C’est pour cette raison que nous préférons parler dans un premier temps d’« objets phraséologiques » pour référer à la collection terminologique ci-dessus. Nous risquons cette désignation accueillante pour ne pas nous engager à catégoriser trop rapidement des phénomènes certes en lien avec le figement, mais de nature différente. Car quoi qu’il en soit, c’est bien de la question du figement et de ses degrés dont il est question – puisque c’est affaire de continuum –, ou à tout le moins, la question de certaines régularités locales récurrentes, lexicales ou discursives. Le titre même d’un numéro de Langages, Vers une extension du domaine de la phraséologie, l’annonçait tout net. Dominique Legallois et Agnès Tutin précisent que « La phraséologie intègre désormais des objets d’étude très variés, allant des collocations aux séquences discursives en passant par la parémiologie, ou encore, les schémas syntaxiques » (2013). Les modèles linguistiques développent la notion de « principe phraséologique » qui marque le continuum entre liberté et fige-
14
Valérie Delavigne
ment. De façon générale, des collocations aux proverbes, des clichés aux formulaires, bien des degrés de solidarités peuvent être mis en évidence (Condamines/ Aussenac-Gilles 2003 ; Lamiroy/Klein 2005 ; Legallois et al. 2016, par exemple). Nous nous éloignons d’une définition du figement comme séquence polylexicale syntaxiquement figée et sémantiquement non compositionnelle comme propose le Dictionnaire de linguistique et des sciences du langage (Dubois et al. 1994) et suivrons plutôt la conclusion de Béatrice Lamiroy qui, à l’issue de sa tentative de définition du « figement », renonce à une définition fermée : « […] on doit se contenter d’une définition très générale selon laquelle une expression figée est une unité phraséologique constituée de plusieurs mots, contigus ou non, qui présentent un certain degré de figement sémantique, un certain degré de figement lexical et un certain degré de fixité morphosyntaxique » (Lamiroy 2008,13).
Cette définition plus souple, qui suppose un continuum entre séquences libres et séquences contraintes, correspond mieux aux observations menées sur nos corpus.
3 De la diversité des objets phraséologiques dans deux corpus Notre intérêt pour les objets phraséologiques est ancien ; il a été initié par Allal Assal qui, dans le cadre de sa thèse sur le vocabulaire des biotechnologies, travaillait à établir des critères de repérage et de découpage des unités terminologiques complexes (Assal 1992 ; Assal/Delavigne 1993). Par la suite, nous avons été conduite à regarder de plus près des phénomènes phraséologiques lors de descriptions terminologiques dans des corpus différents, de genres textuels hétérogènes issus de communautés discursives variées, l’un portant sur la cancérologie, l’autre sur l’environnement. Notre fil directeur relève de l’appropriation de connaissances par les usagers ; cette problématique est indissociable de la mise à disposition des termes et donc, d’un questionnement sur les objets phraséologiques. En effet, dans des communications élargies qui dépassent les communautés discursives où les termes circulent d’ordinaire, des formations préférentielles peuvent, à l’instar des termes, devenir un écueil : pour utiliser le terme perfusion, il peut être utile de savoir que la terminologie doit être posée, que des produits radioactifs émettent des rayonnements, ou qu’un élément peut être hautement radioactif. Ce type de séquences n’est pas une spécificité des discours spécialisés, mais fait partie des attributs qui les caractérisent. Ces séquences relèvent de différents niveaux de description linguistique. Notre objectif est d’esquisser un typage des objets repérés en corpus afin de déterminer ceux qui relèvent de la terminologie à
Terme, phraséologie, discours
15
proprement parler et ceux qui relèvent d’autres types d’association, tout en présentant une forte fréquence dans certains types de discours spécialisés. La fréquentation de nos corpus permet de repérer en effet différents types de séquences plus ou moins figées : des termes complexes, des collocations, des formules, des routines discursives, notamment. Prenons un exemple, extrait d’un de nos corpus : dans l’énoncé « on parle de ganglion sentinelle », ganglion sentinelle peut être considéré comme un terme à part entière, une collocation ou une unité phraséologique selon les critères que l’on se donne ; mais le statut de on parle de, forme récurrente, doit lui aussi être interrogé. Il s’agit donc de croiser terminologie et phraséologie à partir de ces corpus, et de se demander si l’on peut parler à chaque fois de phénomène phraséologique. Outre l’intérêt descriptif, on peut en voir au moins trois autres à se pencher sur la problématique de la phraséologie dans les discours spécialisés. – Une visée didactique (pas uniquement académique) d’appropriation des sociolectes et donc de ces éléments préfabriqués dans toutes leurs dimensions, y compris variationnelles ; – L’inclusion ou l’élaboration de ressources terminologiques idoines comme des outils d’aide à la rédaction dans le cadre de la rédactologie, ou des bases de données terminologiques (Beaudet/Clerc 2008 ; Granger/Paquot 2010 ; Pecman 2018 ; Tran/Falaise 2018 ; Delavigne 2022a) ; – Un intérêt épistémologique : comparer des genres textuels, repérer les régularités et les variations, autrement dit, se positionner entre langue et discours puisque ces objets phraséologiques mettent en œuvre des mécanismes inscrits en langue de différents niveaux (morphologiques, sémantiques, énonciatifs) et en discours (structuration, enchaînement…). Plusieurs types d’objets phraséologiques sont repérables dans nos corpus, dont certains ont déjà fait l’objet de descriptions approfondies. Nous en évoquerons quatre, de nature différente.
3.1 Des termes complexes Les phénomènes phraséologiques peuvent être abordés dans une première approche sous un angle purement terminologique, pourrait-on dire. La première trace de structures préfabriquées à laquelle nos deux corpus nous confrontent est en effet celle d’unités polylexicales spécifiques, généralement dénommées « termes complexes » en terminologie, autrement dit lexicalisées, qui ont pour caractéristique de s’opposer à des syntagmes libres (syntagmes de discours). Elles sont parfois assimilées à des « locutions », considérées comme sémantiquement non
16
Valérie Delavigne
compositionnelles (ce en quoi elles se distingueraient des « collocations »). La question est de décider de la terminologisation de ces unités, autrement dit, de les distinguer des syntagmes libres. L’identification des unités terminologiques complexes est une difficulté récurrente en terminologie : les critères disponibles pour mesurer le degré de lexicalisation de ces syntagmes ne sont pas toujours opératoires, et ce d’autant plus que ces structures sémiotiques complexes ne possèdent pas de marques morphosyntaxiques spécifiques et ne se soumettent que partiellement à des modèles prototypiques. Un ensemble de critères, d’efficacité variable, développés notamment dans une perspective de Traitement Automatique des Langues, permet de repérer ces combinaisons qui posent des questions de repérage, de délimitation, de cohésion. Du point de vue de leur forme, les unités terminologiques se laissent décrire grossièrement en deux types ; d’une part, les unités « simples », c'est-à-dire les lexies que l’on trouve entre deux blancs typographiques, du type cellule ou rayonnement, et d’autre part, les unités « complexes » composée graphiquement de deux ou plusieurs unités, comme les unités suivantes, parfois siglées : polymorphisme de fragments de restriction (RFLP) radiothérapie conformationnelle avec modulation d’intensité (RCMI) bronchopneumopathie chronique obstructive actinide mineur arrêt de tranche gaz à effet de serre (GES) déchet hautement radioactif
Certaines formes atypiques semblent peu conforme la morphosyntaxe habituelle du français : curiethérapie à bas débit de dose cancer bronchique non à petites cellules
voire actualisent des formes sémiotiques non alphabétiques : CO2 rayon β 5-fluoro-uracile
La « complexité » de ces unités tient à leur structure morphosyntaxique (plus ou moins figée) et sémantique (plus ou moins opaque). Sur le plan formel – le plus immédiatement perceptible –, nos exemples montrent une hétérogénéité de formes, parfois difficilement délimitables. Si le cotexte gauche d’une unité termino-
Terme, phraséologie, discours
17
logique complexe est facilement repérable, la limite du cotexte droit est parfois plus incertaine. Louis Guilbert en son temps s’était attaché à proposer des critères pour établir une ligne de partage nette entre syntagmes figés et syntagmes de discours ; ils se sont révélés inadéquats pour les syntagmes terminologiques. Des synapsies que décrivait Benveniste aux formes enchâssées, avec des soudures variées (trait d’union, apostrophe, préposition), la variation morphologique de ces syntagmes ne se laisse pas aisément décrire et ce, d’autant plus qu’ils présentent un degré de cohésion fluctuant, le terme étant fragmentable (le critère de blocage de certaines propriétés distributionnelles ne s’applique pas). C’est sans doute ce qui explique qu’ils se voient parfois assimilés à des collocations (voir infra). Paradoxalement, la polylexicalité comme trait caractéristique des termes complexes peut être elle-même remise en cause. En effet, certaines unités lexicales comme antibioprophylaxie présentent une agglutination de formants soudés qui pousse à se demander si ces unités doivent réellement être considérées comme des termes « simples » même si elles apparaissent comme telles sur le plan graphique. Et ce d’autant plus lorsque l’on voit des unités polylexicales comme examen anatomopathologique et examen anatocytomopathologique alterner avec les variants anatomocythopathologie, anatomopathologie, voire l’abréviatif anapath, en fonction du genre textuel. Dès lors, il apparaît douteux que le seul critère graphique soit suffisant pour écarter certaines unités de la catégorie « terme complexe ». Ces formes concaténées réclament donc de reconsidérer la polylexicalité comme trait définitoire des unités complexes et de se saisir plutôt d’une sémantique des morphèmes (Rastier et al. 1994). De la même façon, des morphèmes comme -antibio, -cardio, -algie -, chondro- se voient substitués à antibiotique, cœur, douleur et cartilage, parfois au sein du même discours, ce qui révèle un continuum bien plus qu’une stricte opposition entre terme simple et terme complexe. Nous ne dresserons pas un catalogue des divers critères que l’on trouve chez différents auteurs pour repérer les termes complexes (Gross 1996 ; Gautier 2004 notamment). En dehors du critère graphique que nous venons d’écarter, résumons rapidement : – Le critère de fréquence qui, là encore, est à relativiser car intimement lié aux objectifs d’élaboration du corpus. Quelle serait la fréquence minimale à prendre en compte ? Faut-il considérer au moins dans deux documents de genres différents ? Quelle est la part liée à un corpus oral vs un corpus écrit ? – Le critère taxinomique qui permet de considérer la façon dont une unité prend place dans un réseau lexical comme par exemple radiothérapie, radiothérapie conformationnelle, radiothérapie externe (Delavigne 2009) ;
18
–
–
– –
–
Valérie Delavigne
Le critère synonymique, autrement dit la présence d’un paradigme désignationnel, auquel nous sommes tout particulièrement attentive dans le cadre d’une analyse de la variation ; Le critère diachronique, qui permet de relever des formes parfois concurrentes au fil du temps, qui peuvent ensuite coexister (comme consultation d’annonce vs dispositif d’annonce mis en place en 2005) ; Un critère textuel, qui prend en compte l’apparition d’une forme à des lieux stratégiques (titre, introduction, conclusion, résumé) ; Et sans doute, le plus saillant, le critère sémantique, qui rappelle qu’un terme a avant tout pour raison d’être lié à un signifié borné dans une situation de discours particulière. Ce critère vise à repérer des paradigmes définitionnels, lexicographiques ou discursifs, ou des formes de référenciation (Alrashidi et al. 2018) ; Le critère épilinguistique, associé au précédent, qui relève du statut que les locuteurs accordent à l’unité considérée.
Une analyse critique des différents critères disponibles en révèle vite la fragilité dès lors qu’on les prend isolément ; c’est la conjonction de plusieurs d’entre eux qui constitue un indice de terminologisation. Quoi qu’il en soit, ce type d’unité pose les limites mêmes de l’unité lexicale en la reliant ipso facto à la phraséologie. En tant qu’unité figée relevant typiquement d’un phénomène syntagmatique, au degré de cohésion variable, elle en fait un cas particulier de phrasème que Gautier (2004) désigne par phraséoterme, terme que nous reprendrons à notre compte dans la mesure où il met précisément l’accent sur le continuum entre terme et phrasème, entre terminologie et phraséologie.
3.2 Des collocations Quel que soit le terme, simple ou complexe, sa raison d’être n’est pas de peupler les bases de données ou les dictionnaires, mais bien d’être utilisé en discours. Pour cela, il est nécessaire d’en connaître le « mode d’emploi » (Lerat 2007), autrement dit la façon dont le terme s’insère dans le tissu discursif : pour utiliser adéquatement un terme, savoir quels sont ses cooccurrents les plus habituels est indispensable. Certaines unités terminologiques présentent des solidarités lexicales récurrentes dans les corpus. Ces combinatoires syntagmatiques, plus ou moins prévisibles, se laissent repérer dans les cotextes des unités terminologiques (en gras dans nos exemples) :
Terme, phraséologie, discours
19
Un médicament est administré Une hormone est secrétée On va vous poser une perfusion On parle de réponse complète Le traitement a fait la preuve de son efficacité
ou, dans le domaine du nucléaire : Des produits radioactifs émettent des rayonnements L’Andra conditionne le combustible et la Cogema retraite les déchets radioactifs
Elles peuvent voir varier leur catégorie grammaticale : Le retraitement des déchets radioactifs L’administration du médicament
Un traitement textométrique fait rapidement émerger des corpus ce type de segments répétés. Ces associations de mots privilégiés, sans être nécessairement contigües, sont souvent regroupées sous l’étiquette de « collocations ». Cooccurrence lexicale privilégiée d’éléments linguistiques liés par une relation syntaxique ou sémantique de façon semi-contrainte, la définition de « collocation », issue de la lexicographie, est sujette à variation, tout comme ses désignations (cooccurrence, combinaison lexicale spécialisée, phraséologisme…). On trouvera chez différents auteurs (Tutin/Grossmann 2002 ; Tutin 2013 ; Melʹčuk 2013 par exemple) des tentatives de typologie des collocations. La frontière entre le préconstruit et le non construit n’est pas toujours nette, mettant ainsi l’accent sur le continuum. Comme le signalait Gross (1996), les critères ne sont guère décisifs, mais indiquent plutôt des degrés de figement. Les collocations se repèrent en corpus au voisinage plus ou moins proche des unités terminologiques : une unité, terminologique ou non, est liée à un terme.1 Si des patrons comme Nom-Adjectif, Nom-Syntagme prépositionnel, Verbe-Nom… apparaissent de façon itérative dans certains discours spécialisés, il est difficile de repérer des modèles prototypiques. Certains sont même inversibles : dans l’exemple « la Cogema retraite les déchets radioactifs », retraiter peut constituer tout aussi bien la base que le collocatif. En tant qu’unités qui tendent à apparaître ensemble, les collocations sont habituellement considérées comme un cas intermédiaire entre combinaisons libres et termes complexes. La différence même entre phraséoterme et collocation est parfois sujette à discussion, ce qui révèle un continuum qui ne laisse pas les frontières se dresser aisément. Ganglion sentinelle est-il une collocation ou un terme
Cette unité se voit souvent désignée comme la « base » de la collocation.
20
Valérie Delavigne
complexe alors qu’il répond à certains critères portant à le catégoriser comme l’une ou l’autre ? La distinction entre syntagmes discursifs et combinaisons terminologiques n’est pas toujours bien claire (Maniez 2002). Outre la variation grammaticale, trait caractéristique de certains collocatifs (administrer vs administration [d’un médicament]), une variation d’une autre nature émerge des corpus. On ne peut s’en étonner outre mesure puisque ces cooccurrences, entre contrainte et liberté, suscitent nécessairement des formes de variabilité. La variation que nous évoquons est à mettre en relation avec des communautés de discours et des genres textuels. Ainsi donner un médicament se repère-t-il plus fréquemment qu’administrer un médicament dans des corpus de discours de vulgarisation ou des forums médicaux. Dès lors, si l’on considère qu’administrer un médicament est une collocation terminologique, doit-on caractériser donner un médicament de la même manière ou comme une combinaison libre ? Faut-il voir donner un médicament comme une variante de genre ? En situation didactique ou traductologique, ces aspects sociolinguistiques ne sont sans doute pas inutiles. En fonction des besoins des usagers, ces objets phraséologiques peuvent faire l’objet de traitements différents : signaler la collocation donner un médicament n’est sans doute pas très utile à un francophone natif alors qu’il peut l’être pour un apprenant allophone. Quoiqu’il en soit, ces combinatoires privilégiées font partie intégrante de la terminologie et sont indispensables dans une perspective d’appropriation terminologique.
3.3 Des formules Une autre catégorie intermédiaire entre les semi-phrasèmes et les énoncés libres a attiré notre attention. Ce sont des séquences récurrentes comme « le risque zéro n’existe pas » ou « un nucléaire sans risque ». Ce type de séquences a été décrit et désigné par Alice Krieg-Planque comme « formule » à la suite de JeanPierre Faye, Marianne Ebel et Pierre Fiala. Elle définit la formule comme « un ensemble de formulations qui, du fait de leurs emplois à un moment donné et dans un espace public donné, cristallisent des enjeux politiques et sociaux que ces formulations contribuent dans le même temps à construire » (Krieg-Planque 2010). Ce concept développé dans une perspective d’analyse de discours intéresse tout à la fois la phraséologie comme exemple de combinatoire figée et la terminologie dans la mesure où les formules actualisent des termes et présentent, dans certains discours spécialisés, une constance remarquable quoique n’excluant pas la variation. Par exemple, Alice Krieg-Planque relève les différentes variations de l’unité développement durable, également présente dans notre corpus.
Terme, phraséologie, discours
21
Les formules font assurément partie du stock des objets phraséologiques spécialisés et constituent des outils révélateurs des usages et des enjeux de discours. Elles mettent en évidence les positionnements, voire les polémiques qui structurent un champ. La formule fait ainsi bouger les frontières entre le terminologique et le non terminologique, le lexical et le discursif, qui se fluidifient.
3.4 Des routines discursives Tous les objets phraséologiques repérés dans nos corpus ne relèvent pas de la terminologie stricto sensu, autrement dit de l’étude spécifique des termes. Néanmoins, en tant que faits de discours spécialisés, certains phénomènes non terminologiques combinatoires doivent être décrits. Reprenons l’exemple mentionné plus haut : « on parle de forme sporadique ». La structure métadiscursive caractéristique on parle de pointe vers une unité terminologique : forme sporadique. L’analyse textométrique de nos corpus met en évidence une surreprésentation de ce type de configuration, dont le rôle central a déjà été souligné dans les études sur la vulgarisation (Mortureux 1982 ; Jacobi 1987 ; 1999 ; Albertini/Belisle 1988). Ces régularités, de divers niveaux linguistiques, sollicitent à la fois le lexique, la syntaxe, la sémantique : on trouve des verbes (être, appeler, nommer, signifier, désigner…), des joncteurs (ou, soit…), des expressions (c’est-à-dire, autrement dit, en d’autres termes…), voire des marques typographiques (virgule, tirets ou parenthèses), qui constituent autant d’indices de didacticité (Moirand 1993), ou d’effets de didacticité. Au vu de la densité et de la récurrence de ces structures métalinguistiques, nous avons été amenée à y voir des « routines » discursives dans la perspective d’Émilie Née, Frédérique Sitri et Marie Veniard, à l’instar de la phraséologie scientifique (Tutin/Grossmann 2014 ; Pecman 2018 ; Delavigne 2020). La notion de « routine » a été définie comme « la mise en relation de séquences linguistiques récurrentes, partiellement figées […] avec des déterminations discursives et des fonctions textuelles propres à un genre ou une sphère d’activité (Née et al. 2014, 2119), articulée aux contraintes de genre dans une perspective d’analyse de discours. Les routines sont donc des objets phraséologiques qui se distinguent par leur récurrence et une fonction – sur notre corpus, la fonction métadiscursive à relier à la didacticité. Au-delà des « faits d’expression » de Bally (1909), ces configurations phraséologiques peuvent être considérées comme une sorte de « signature générique » des discours de vulgarisation. Ce sont autant de traces d’ergonomie discursive qui relèvent d’une phraséologie de genre (pour un approfondissement et une discussion, nous renvoyons à Delavigne 2022b).
22
Valérie Delavigne
La palette des objets phraséologiques repérés sur les corpus ne serait pas complète si nous n’évoquions d’autres types de segments récurrents que nous ne ferons que mentionner ici. L’exploitation textométrique des corpus permet aujourd’hui de mettre au jour des affinités entre unités lexicales d’autres types, comme des schémas lexico-grammaticaux ou des patterns qui entrent dans le continuum et structurent les discours spécialisés. Tout comme les séquences décrites supra, elles pourraient fort utilement être mises en avant dans le cadre d’une didactique de l’écriture de discours spécialisés.
4 De la variation en discours à l’intégration dans les ressources terminologiques Depuis les premières réflexions sur le thème de la phraséologie en terminologie dans les années 1980, le colloque organisé en 1991 par Bruno de Bessé, qui thématisait pour la première fois le rapport entre terminologie et phraséologie, et le numéro 10 de Terminologies nouvelles, sobrement intitulé Phraséologie, qui appelait en 1993 de ses vœux un plus grand nombre d’études sur le thème, le champ s’est remarquablement développé, que ce soit sur le plan méthodologique, descriptif, typologique ou applicatif. Le tournant numérique a ouvert des perspectives de recueil et de traitement de corpus, offrant aux travaux terminologiques des possibilités d’analyses au plus près des discours. Les outils de la linguistique de corpus ont ainsi permis de rendre compte des environnements linguistiques immédiats des termes. Ils ont mis en évidence la place importante de la combinatoire dans les discours spécialisés, ou plus ou moins spécialisés, contribuant à approfondir et à faire évoluer les questions de la syntagmatique phraséologique et montrant la portée épistémologique du figement. Ces aspects accordent à la phraséologie un régime particulier qui la place dans le continuum terme-discours. Étudier l’insertion des termes dans des matrices combinatoires permet de dépasser les aspects strictement terminologiques en reliant les unités terminologiques aux formes avec lesquelles elles sont le plus couramment utilisées. Abondantes dans les discours spécialisés et nécessaires aux interactions, ces unités linguistiques font désormais partie intégrante des analyses terminologiques, dépassant la vision d’un terme isolé à recenser. Les combinatoires en usage et leurs variations, intra ou interdiscursives, peuvent être ensuite rapportées aux genres textuels dans lesquels elles apparaissent. Cela permet d’approfondir dans le même temps la question des genres de discours spécialisés, peu développée. L’exploration de cette dimension phraséologique des discours spécialisés ramène ainsi la terminologie dans le giron de la (socio)linguistique sur deux plans : 1. l’étude des fonctionne-
Terme, phraséologie, discours
23
ments discursifs de la phraséologie dans ces situations langagières spécifiques qui sort la terminologie d’un centrage sur le concept ; 2. la prise en compte de la variation, souvent liée aux enjeux de discours, qui place ipso facto la terminologie dans les champs sociétaux, voire politiques. Le pas suivant est l’intégration de ces dimensions dans des ressources terminologiques dans une perspective « d’équipement » terminologique et phraséologique. C’est là un autre défi méthodologique.
Bibliographie Albertini, Jean-Marie/Belisle, Claire, Les fonctions de la vulgarisation scientifique et technique, in : Jacobi, Daniel/Schiele, Bernard (edd.), Vulgariser la science. Le procès de l’ignorance, Seyssel, Champ Vallon, 1988, 225–245. Alrashidi, Badriyah/Delavigne, Valérie/Gaudin, François, La référenciation des termes. Perspectives socioterminologiques, in : Roche, Christophe (ed.), Terminologie et ontologie. Théories et applications, Chambéry, Presses Universitaires Savoie Mont-Blanc, 2018, 35–50. Assal, Allal, Vocabulaire des biotechnologies. Une approche descriptive, Thèse de doctorat, Université de Rouen, 1992. Assal, Allal/Delavigne, Valérie, Le découpage des unités terminologiques complexes. Limites des critères linguistiques, in : Abrey, José Manuel (ed.), Les langues de spécialité : pratiques, outils, théories. Actes de la 4e Journée ERLA-GLAT, Université de Bretagne occidentale, Ecole nationale supérieure des télécommunications de Bretagne,1993, 175–193. Aussenac-Gilles, Nathalie/Condamines, Anne, Variation syntaxique et contextuelle dans la mise au point de patrons de relations sémantiques, in : Minel, Jean-Luc (ed.), Filtrage sémantique, Paris, Hermès/ Lavoisier, 2009, 115–149. Bally, Charles, Traité de stylistique française, Genève/Paris, Librairie Georg & Cie/Klincksieck, 1951 (1909). Beaudet, Céline/Clerc, Isabelle, L’enseignement de la rédaction professionnelle au Québec. Quels fondements disciplinaires ? Quelle reconnaissance institutionnelle ?, in : Alamargot, Denis/Beaudet, Céline/Bouchand, Jacques/Clerc, Isabelle (edd.), De la France au Québec. L’écriture dans tous ses états, Poitiers, 2008, http://wikindx.ens-lyon.fr/biblio_vst/index.php?action=list_LISTSOMERE SOURCES_CORE&method=collectionProcess&id=1683 [dernière consultation : 21.11.2021]. Condamines, Anne/Aussenac-Gilles, Nathalie, Corpus et terminologie, AS-34 ASSTICOT – RTP DOC STIC CNRS – Rapport d’activités, 2003. Delavigne, Valérie, Le terme et ses réseaux. Un outil pour l’appropriation terminologique, in : Terminologie et intelligence artificielle, Toulouse, 2009, http://www.irit.fr/TIA09/thekey/tdmconffr. html [dernière consultation : 21.11.2021]. Delavigne, Valérie, De l’(in)constance du métalinguistique dans un corpus de vulgarisation médicale, Corela HS-31 (2020), https://doi.org/10.4000/corela.11031. Delavigne, Valérie, Phraséologie et didacticité dans les discours de vulgarisation médicale. Une ergonomie discursive, in : Mariangela, Albano/Savatovsky, Dan (edd.), Phrasis. Repenser le figement. Enjeux et perspectives contrastives en phraséodidactique des langues, 2022 à paraître (=2022a).
24
Valérie Delavigne
Delavigne, Valérie, L’hospitalité des textes. Perspectives socioterminologiques, in : Clerc, Isabelle/Rey, Véronique (edd.), La communication écrite entre l’État et le citoyen. Défis numériques, perspectives rédactologiques, Québec, 2022 à paraître (=2022b). Dubois, Jean/Giacomo, Mathée/Guespin, Louis/Marcellesi, Jean-Baptiste/Marcellesi, Christiane/Mével, Jean-Pierre, Dictionnaire de linguistique et des sciences du langage, Paris, Larousse, 1994. Gaudin, François, Socioterminologie. Une approche sociolinguistique de la terminologie, Bruxelles, De Boeck/Duculot, 2003. Gautier, Laurent, Terme, phraséoterme, phrasème. Questions de délimitation en langue spécialisée, in : Hédi, Jatlaoui/Ezzedine, Majdoub/Salah, Mejri (edd.), Le continuum en linguistique, Sousse, Faculté des Lettres et Sciences Humaines de Sousse, 2004, 153–172. Gautier, Laurent (ed.), Figement et discours spécialisés, Berlin, Frank & Timme, 2018. Granger, Sylviane/Paquot, Magali, The Louvain EAP Dictionary (LEAD), in : Dykstra, Anne/Schoonheim, Tanneke (edd.), Proceedings of the XIV EURALEX International Congress, Leeuwarden, Friske Akademy, 2010, 321–326. Gross, Gaston, Les expressions figées en français. Noms composés et autres locutions, Gap, Ophrys, 1996. Guespin, Louis, La circulation terminologique et les rapports entre science, technique, production, Cahiers de linguistique sociale 18 (1991), 59–80. Humbley, John, La néologie terminologique, Limoges, Lambert-Lucas, 2018. Jacobi, Daniel, Textes et images de la vulgarisation scientifique, Berne/New York, Peter Lang, 1987. Jacobi, Daniel, La communication scientifique. Discours, figures, modèles, Grenoble, Presses Universitaires de Grenoble, 1999. Kleiber, Georges, Noms propres et noms communs. Un problème de dénomination, Meta. Journal des traducteurs/Meta. Translators’ journal 41 (2002), 567–589. Kocourek, Rostislav, La langue française de la technique et de la science. Vers une linguistique de la langue savante, Wiesbaden, Brandstetter, 21991. Krieg-Planque, Alice, La notion de formule en analyse du discours. Cadre théorique et méthodologique, Besançon, Presses Universitaires de Franche-Comté, 2009. Krieg-Planque, Alice, La formule « développement durable ». Un opérateur de neutralisation de la conflictualité, Langage et société 134 (2010), 5–29. Lamiroy, Béatrice, Le figement. À la recherche d’une définition, Zeitschrift für französische sprache und literatur 36 (2008), 85–99. Lamiroy, Béatrice/Klein, Jean René, Le problème central du figement est le semi-figement, Linx. Revue des linguistes de l’université Paris X-Nanterre 53 (2005), 135–154. Legallois, Dominique, La colligation : autre nom de la collocation grammaticale ou autre logique de la relation mutuelle entre syntaxe et sémantique ?, Corpus 11 (2012), 31–54. Legallois, Dominique/Charnois, Thierry/Poibeau, Thierry, Repérer les clichés dans les romans sentimentaux grâce à la méthode des « motifs », Lidil 53 (2016), 95–117. Legallois, Dominique/Tutin, Agnès, Présentation. Vers une extension du domaine de la phraséologie, Langages 189 (2013), 3–25. Lerat, Pierre, Vocabulaire du juriste débutant : décrypter la langue juridique, Paris, Ellipses, 2007. L’Homme, Marie-Claude, Le statut du verbe en langue de spécialité et sa description lexicographique, Cahiers de lexicologie 73 (1998), 61–84. Maniez, François, Distinguer les termes des collocations : étude sur corpus du patron « Adjectif–Nom » en anglais médical, in : Actes de la 9ème conférence sur le Traitement Automatique des Langues Naturelles, Nancy, ATALA, 2002, 344–349. Mejri, Salah, La terminologie du figement. Approche contrastive (français-arabe), Syntaxe et sémantique 7 (2006), 139–152.
Terme, phraséologie, discours
25
Melʹčuk, Igor, Tout ce que nous voulions savoir sur les phrasèmes, mais..., Cahiers de lexicologie 102 (2013), 129–149. Misri, Georges, Approches du figement linguistique. Critères et tendances, La Linguistique 23 (1987), 71–85. Moirand, Sophie, Autour de la notion de « didacticité », Les Carnets du Cediscor. Publication du Centre de recherches sur la didacticité des discours ordinaires 1 (1993), 9–20. Mortureux, Marie-Françoise, Paraphrase et métalangage dans le dialogue de vulgarisation, Langue française 53 (1982), 48–61. Mortureux, Marie-Françoise, Comment définir la propriété d’un mot, in : Moirand, Sophie/Abdelmadjid, Ali Bouacha/Beacco, Jean-Claude/Collinot, André (edd.), Parcours linguistiques de discours spécialisés, Berne/New York, Peter Lang, 1994, 3–10. Née, Émilie/Sitri, Frédérique/Veniard, Marie, Pour une approche des routines discursives dans les écrits professionnels, in : Congrès mondial de linguistique française, Paris, EDP Sciences, 2014, 2113–2124. Née, Émilie/Sitri, Frédérique/Veniard, Marie, Les routines, une catégorie pour l’analyse de discours. Le cas des rapports éducatifs, Lidil 53 (2016), 71–93. Pecman, Mojca, Langue et construction de connaisSENSes. Énergie lexico-discursive et potentiel sémiotique des sciences, Paris, L’Harmattan, 2018. Pesant, Ghislaine/Thibault, Estelle, Terminologie et coocurrence dans la langue du droit, Terminologies nouvelles 10 (1993), 23–35. Petit, Gérard, L’introuvable identité du terme technique, Revue française de linguistique appliquée 7 (2001), 63–79. Petit, Gérard, Le figement. Une asymptote pour la constitution des terminologie, in : Gautier, Laurent (ed.), Figement et discours spécialisés, Berlin, Frank & Timme, 2017, 27–56. Plane, Sylvie/Rondelli, Fabienne, Le déjà-là dans l’écriture : quel substrat pour quels (ré)emplois ?, Pratiques. Linguistique, littérature, didactique 173–174 (2017), https://doi.org/10.4000/pratiques. 3254. Rastier, François, Le terme. Entre ontologie et linguistique, La banque des mots 7 (1995), 35–65. Rastier, François/Cavazza, Marc/Abeillé, Anne, Sémantique pour l’analyse. De la linguistique à l’informatique, Paris, Masson, 1994. Sitri, Frédérique/Tutin, Agnès, Présentation, Lidil. Revue de linguistique et de didactique des langues 53 (2016), 5–18. Tran, Thi Thu Hoai/Falaise, Achille, Un dictionnaire basé sur corpus pour une aide à la rédaction universitaire, Lidil. Revue de linguistique et de didactique des langues 58 (2018), https://doi.org/ 10.4000/lidil.5378. Tutin, Agnès, Les collocations lexicales. Une relation essentiellement binaire définie par la relation prédicat-argument, Langages 189 (2013), 47–63. Tutin, Agnès/Grossmann, Francis, Collocations régulières et irrégulières. Esquisse de typologie du phénomène collocatif, Revue française de linguistique appliquée 7 (2002), 7–25. Tutin, Agnès/Grossmann, Francis (edd.), L’écrit scientifique. Du lexique au discours : autour de Scientext, Rennes, Presses universitaires de Rennes, 2014.
Maria Francesca Bonadonna
Phraséologie et enseignement du français commercial Un parcours historique à travers les méthodologies de FLE Résumé : Dans cette contribution, nous entendons réfléchir sur le statut de la phraséologie dans le cadre de l’enseignement du français spécialisé, en suivant l’évolution des principales méthodologies de FLE au fil du temps. Nous nous intéressons conjointement à la prise en compte de l’élément phraséologique dans un contexte didactique et au métalangage qui est adopté, en l’occurrence, lors de la présentation du matériel didactique dans les manuels de FLE. Notre intérêt porte, plus précisément, sur le français du domaine commercial, pour lequel il existe une tradition florissante de ressources didactiques à travers les siècles. Après l’illustration de notre cadre théorique, à savoir celui de la Lexicologie Explicative et Combinatoire, et de notre méthode d’analyse, nous examinons quelques étapes significatives au sein du parcours des méthodologies de FLE, à partir du Moyen Âge jusqu’à nos jours. Pour chaque étape, nous en décrivons les caractéristiques principales de même que des exemples tirés d’ouvrages didactiques, ce qui nous permet de dévoiler quelques tendances relevant du statut de la dimension phraséologique pour l’enseignement/apprentissage des termes. Mots-clés : didactique du FLE, histoire de l’enseignement des langues, manuel de FLE, commerce, lexique commercial Abstract: In this study, we reflect on the status of phraseology in relationship with teaching specialized French, by following the evolution over time of the main methodologies of FFL. We consider phraseology in a didactic context, as well as the metalanguage that is adopted for the presentation of teaching material in FFL textbooks. Our interest is more specifically directed at business French, which benefits from a flourishing tradition of teaching resources throughout the centuries. After describing our theoretical framework, namely that of Explanatory and Combinatorial Lexicology, and our methodology, we examine some significant stages in FFL methodologies, from the Middle Ages to our times. For each stage, we describe its main characteristics and some examples taken from textbooks, which allows us to reveal some trends relating to the status of the phraseological dimension for the teaching/learning of terms.
https://doi.org/10.1515/9783110749854-003
28
Maria Francesca Bonadonna
Keywords: FFL didactics, history of language teaching, FFL textbook, trade, commercial vocabulary
1 Introduction La prise en compte des unités terminologiques ne constitue pas une pratique récente dans le cadre de l’enseignement du français langue étrangère (dorénavant FLE). Bien au contraire, l’enseignement des termes a lieu depuis la période médiévale, lorsque la langue française, se targuant du statut de langue internationale en Europe en concurrence avec le latin, fait l’objet de cours et d’ouvrages à visée didactique dans des domaines de spécialité. Il s’agit, par exemple, du français juridique, pour lequel des cours sont donnés à l’université d’Oxford au XIVe et au XVe siècles (Huchon 2002, 118), et du français du commerce, appris depuis le XIVe siècle dans les Flandres, où des manuels de conversation français-flamand voient le jour à l’adresse des marchands et des commerçants (Germain 2018, 21 ; Zimont 2019). Nous nous penchons ici sur un aspect qui demeure, à notre connaissance, peu exploré, à savoir la place qu’occupe la phraséologie à l’intérieur de l’enseignement des termes au fil du temps. D’abord (§2), nous illustrons les notions de base relevant de la phraséologie au sein du cadre théorique de la Lexicologie Explicative et Combinatoire, de même que la méthode adoptée pour suivre la présence et/ou le traitement de l’aspect phraséologique dans l’enseignement des langues spécialisées. La section §3 présente des étapes significatives du parcours historique que la phraséologie occupe dans les pratiques et les méthodes didactiques qui se sont succédé à travers les siècles ; notre attention sera focalisée sur un domaine en particulier, celui du commerce, à propos duquel maintes ressources didactiques ont été produites au cours des siècles en raison de l’importance que la communication interlinguistique a, depuis toujours, revêtue dans le cadre des échanges commerciaux entre différents pays. Sans prétention d’exhaustivité, ce parcours chronologique nous permet de tirer quelques conclusions sur les tendances du statut didactique de la phraséologie en langue spécialisée tant du point de vue des contenus que du métalangage (§4).
2 Entités phraséologiques et méthode d’analyse L’intérêt de la phraséologie n’est plus à prouver dans le cadre des langues spécialisées ; les phénomènes phraséologiques peuvent intervenir de manière différente à l’intérieur des textes spécialisés, qui comportent tant de la « phraséologie géné-
Phraséologie et enseignement du français commercial
29
rale » que de la « phraséologie propre au type de discours et au domaine » (Lerat 2016, 86). C’est ce croisement des mécanismes caractérisant la langue générale, d’une part, et la langue spécialisée, d’autre part, qui serait à l’origine d’une « densité phraséologique » dans les discours spécialisés qui n’a pas d’égal (Mejri/Mejri 2020, 280). La richesse des questions touchant la phraséologie spécialisée s’accompagne de taxonomies fort différentes non seulement en ce qui concerne les types de phénomènes phraséologiques à considérer, mais aussi la métaterminologie appelée à désigner ces phénomènes. Dans cette contribution, nous adoptons le classement proposé par la Lexicologie Explicative et Combinatoire (Mel’čuk/Clas/Polguère 1995 ; Mel’čuk 2013), où le large éventail de phénomènes phraséologiques va sous l’appellation de phrasème. Les phrasèmes réunissent tous les énoncés multilexémiques non libres (Mel’čuk 2013, 2), qu’il est possible de classer en quatre types principaux sur la base de la nature des contraintes lexicales ou sémantico-lexicales :1 – les locutions, à savoir des phrasèmes lexicaux non compositionnels, comme par exemple manger la grenouille ; en fonction du degré d’opacité ou de transparence sémantique, les locutions sont distinguées davantage en locutions fortes, semi-compositionnelles et faibles ; – les collocations, qui sont des phrasèmes lexicaux compositionnels, par exemple gravement malade ; – les clichés, c’est-à-dire des phrasèmes sémantico-lexicaux compositionnels, par exemple Quel âge avez-vous ? ; – les pragmatèmes, c’est-à-dire des expressions lexicales dont l’usage est contraint par la situation d’emploi, par exemple défense de stationner. Notre intérêt portant sur les unités terminologiques, nous considérons que les termes complexes sont des locutions (Frassi 2020). Les locutions faibles, qui constituent l’écrasante majorité des termes, sont transparentes au niveau sémantique et reposent sur des étiquettes sémantiques récurrentes en fonction du domaine en question, comme le sémantisme ‘moyen’ dans le domaine du commerce : à titre d’exemple, le terme complexe commerce électronique est considéré comme une locution faible pouvant être paraphrasée comme ‘commerce qui se fait par internet’ (Ibidem). À partir de cette classification de la phraséologie, nous entendons examiner le statut des phrasèmes, en ce qui concerne plus particulièrement les unités terminologiques, à l’intérieur des ouvrages de FLE, dont nous allons ébaucher un parcours historique. Nous nous intéressons à deux aspects complémentaires :
Nous renvoyons aux études mentionnées pour plus de détails.
30
Maria Francesca Bonadonna
d’une part, aux types d’unités phraséologiques qui peuvent être détectées dans les manuels et les méthodes du français commercial ; d’autre part, nous nous questionnons sur le métalangage accompagnant la présentation de ces éléments phraséologiques aux apprenants. Nous nous appuyons sur deux catégories de sources historiques permettant de retracer l’histoire de l’enseignement des langues (Van Els/Knops 1988)2 : les études sur l’histoire de la didactique des langues et les ouvrages didactiques. En premier lieu, les études sur l’histoire de la didactique des langues (principalement Germain 1993, 2018 ; Kahn 2021 ; Puren 2012 ; Cuq/Gruca 2020 ; Riquois 2010) permettent d’isoler quelques-unes des principales tendances didactiques à propos de quatre macro-périodes : les premières expériences entre l’époque médiévale et le début de la Renaissance ; la méthode traditionnelle du XIXe au début du XXe siècle ; de nouveaux courants didactiques au XXe siècle, puis à partir du XXIe siècle. Pour chacune des périodes prises en compte, nous analysons un échantillon de publications didactiques relevant du français du commerce.
3 Termes et phraséologie dans les méthodologies de FLE 3.1 Les premières pratiques didactiques Depuis l’époque médiévale, l’apprentissage du français langue étrangère se répand en Europe à partir de l’Angleterre, où le français s’impose rapidement en tant que langue de la cour (Huchon 2002, 64). C’est en ancien et en moyen français que les premières expériences d’enseignement du lexique sont menées sous forme de listes de vocabulaire organisées par thème et appelées « nominalia » (Germain 2018, 17). Dans son traité pédagogique de 1250, Bibbesworth articule l’apprentissage du français autour du lexique par le biais d’un poème pédagogique par lequel il vise la mémorisation d’unités phraséologiques appelées « groupes de mots » (Germain 2018, 18) ; il s’agit principalement de collocations, par exemple mettez le chaperoun ou coverez le chief, dans lesquelles le collocatif verbal est suivi de la base nominale servant de complément direct. L’enseignement du FLE concerne également des domaines de spécialité, notamment le domaine juridique et celui du commerce. Ce dernier en particulier
Les autres catégories sont les descriptions historiques, les observations de classe et les traités théoriques (Van Els/Knops 1988).
Phraséologie et enseignement du français commercial
31
s’impose dans les Flandres, où le français est enseigné aux marchands devant l’utiliser dans les échanges commerciaux internationaux jusqu’au XVIIIe siècle (Huchon 2002, 64). À l’intérieur de ces ouvrages, l’enseignement du français passe par une profusion d’unités phraséologiques, bien qu’aucun élément métalinguistique ne soit utilisé. Des manuels de conversation, dits colloques ou manières de langage, voient le jour à partir de 1350 (Germain 2018, 20–21 ; Zimont 2019, 1) en vue de promouvoir la maîtrise orale du français. Les explications grammaticales étant négligées, il est possible d’y retrouver une nomenclature du commerce et de la vie quotidienne, avec des termes complexes de type locution faible qui renvoient aux métiers de l’époque, par exemple couvreur de tieule, ou des collocations exprimant les actions de ces métiers, comme par exemple celle de vendre plusieurs espices attribuée à l’« apoticaire » (Germain 2018, 20). Dans un manuel de conversation circulant en Angleterre en 1396, un petit dialogue sur le vin suggère l’enseignement d’expressions telles « blanc vin et vermail » et « de bon vin » (ibid.) que nous qualifions respectivement de locution et de collocation. Les Collocutions de Jan Berthout sont composées aux Pays-Bas à la moitié du XVIe siècle : un chapitre du premier livre contient un dialogue situé dans un marché « pour apprendre à marchander, acheter et vendre », suivi d’un glossaire. Ses dialogues illustrent des énumérations « de cohyponymes se rapportant à un même terme générique » (Zimont 2019, 8), par exemple les types de draps : « A. Regardez ce qui vous duit : voi-là de bon drap de Bruges, & voi-là drap de Malines, voi-là aussy du drap d’Ypre, ensemble du drap de Bois-le-Duc, aussy de Lile, & de tous quartiers (Berthout 1575, fol. 27) » (ibid.). L’ouvrage inclut un Vocabulaire bilingue flamand-français, organisé selon un critère thématique dans des rubriques telles « Du Ciel & des noms d’Hommes et de Femmes », « le Firmament », « de la terre », « des villes », « des fruits de la terre », etc. En observant de plus près la section « De l’or, de l’argent & toutes merceries », il est possible de repérer et de classer plusieurs unités phraséologiques pour la partie française (Berthout 1619) : – des locutions de type faible, par exemple drap d’ecarlate, poisson de mer, une taverne au vin, dé à coudre, rentes à vie ; – des locutions semi-compositionnelles, comme cervoise double, horloge au soleil ; – des collocations, comme par exemple engraisser les cuirs, bender les arcs, belle fourure, prendre medecine, accorder les orgues ; – des clichés, par exemple Combien vous coute il ?, Combien le faites vous ?. La publication d’ouvrages à l’adresse des marchands se propage rapidement dans le reste de l’Europe, comme en témoigne l’histoire du manuel et du dictionnaire de Berlaimont, paru au début du XVIe siècle en français et en flamand, ensuite en
32
Maria Francesca Bonadonna
Exemple 1 : Les termes du commerce dans les Collocutions de Jan Berthout (1619).
huit langues, avec environ 150 éditions répertoriées jusqu’à la moitié du XVIIIe siècle (Kahn 2021). L’ouvrage de Berlaimont est « un véritable manuel, qui réunit dans une première section une série de dialogues, des lettres, des contrats, quittances, proposés comme modèles », suivie d’un lexique, disposé par ordre alphabétique, dans la deuxième partie (Colombo Timelli 1992, 30). L’organisation du lexique et de la phraséologie étant obscure et manquant de cohérence (Colombo Timelli 1992, 40), les dialogues foisonnent pour autant d’unités phraséologiques. À titre d’exemple, dans l’un des dialogues, destiné à apprendre à vendre et à acheter en français, nous distinguons des locutions faibles (par exemple, les types de drap : drap de soye, camelot, damas, velours), des locutions fortes (bon marchié) ; plusieurs collocations, par exemple celles décrivant la qualité des produits (bon drap ; bonne toille ; bon drap ; bonne chair ; bon poisson ; bons harengz), des clichés (par exemple, Combien me coustera l’aune de ce drap icy ? ; Combien vault la libre de ce frommaige ?). Par contre, la section consacrée au lexique offre une liste composée principalement d’unités lexicales et terminologiques simples, les unités phraséologiques se limitant à de rares collocations ((mal) content, gros argent) et locutions ((bon) marchié, livre à escripre, (en bon) poinct).
Phraséologie et enseignement du français commercial
33
3.2 Du XIXe siècle au début du XXe siècle À partir du XVIe siècle l’enseignement du FLE, et des langues étrangères plus en général, se focalise sur la grammaire et sur l’orthographe au sein de la méthode appelée méthode grammaire-traduction, méthode de la grammaire, méthode de la traduction ou encore méthode classique (Puren 2012, 17). L’enseignement de la grammaire se sert de manière considérable de la traduction de textes littéraires, à partir de la didactique des langues anciennes qui avait été proposée pendant des siècles. En revanche, le lexique est enseigné principalement à travers la mémorisation des listes des mots tirés des sources écrites et avec le support des dictionnaires (Martinez 2017, 40 ; Puren 2012, 21–22). C’est au début XIXe siècle que le besoin s’impose de renouveler la pratique didactique en insistant sur les langues modernes, au détriment du latin et du grec, afin de répondre au nouveau contexte économique et technique (Puren 2012, 32). Les gouvernements des pays européens se mobilisent ainsi pour organiser et promouvoir l’instruction technique, y compris l’enseignement commercial. Les ouvrages de français commercial se multiplient : par exemple, dans la série des manuels Roret sont publiés des manuels consacrés à la correspondance commerciale. L’ouvrage de 1840 par Reess-Lestienne et Trémery contient également un répertoire lexicographique (Reess-Lestienne/Trémery 1840, 11–27) autour des « termes les plus usités du français ». Le recensement des unités terminologiques suit un ordre alphabétique et inclut une définition ; par exemple, le terme certificat d’origine est défini en tant qu’ « écrit par lequel on déclare que telle marchandise est de fabrique nationale, fabriquée dans tel ou tel endroit […] », tandis que parties doubles correspond à la « manière de tenir les livres, où chaque article contient un débiteur et un créditeur ». Il comprend, plus précisément, 25 unités phraséologiques, dont des locutions qu’il est possible de qualifier de faibles (certificat d’origine, contrat ou police d’assurance, copie de lettres, déclaration aux douanes), des locutions semi-compositionnelles (comme lettre de voiture « écrit qui accompagne les marchandises qu’on expédie, avec les marques, les numéros, le prix de la voiture, le nombre de jours de route, avec l’indemnité de la part du voiturier »), des locutions fortes (par exemple, parties doubles et parties simples ou « manière de tenir les livres, chaque article n’ayant qu’un débiteur et un créditeur ») et des collocations (débiter un particulier, ouvrir un compte). La publication d’ouvrages à visée didactique dans le domaine commercial devient significative à la fin du XIXe siècle, entre autres, dans le contexte italien, où la langue française est enseignée dans les écoles commerciales et dans les instituts professionnels (Sclafani 2019, 357). Malgré l’émergence d’autres langues telles l’anglais et l’allemand, le français demeure la langue privilégiée dans les échanges commerciaux : « le français semble plutôt destiné à garantir la communication
34
Maria Francesca Bonadonna
internationale dans le domaine du pratique comme les activités commerciales » (Merger 2009, 10). Cependant, malgré cet intérêt pour la dimension pratique de l’enseignement de la langue destiné à un usage professionnel, la didactique du lexique ne se détache pas de la présentation traditionnelle de listes d’unités lexicales ou terminologiques (Sclafani 2019, 370). Parmi ces manuels figure, comme Merger (2009) le met évidence, la Dottrina popolare in quattro lingue de Giuseppe Sessa, dont la première édition date de 1888. Ce volume vise à répertorier des expressions relevant du commerce en quatre langues, c’est-à-dire l’italien, le français, l’anglais et l’allemand, en adoptant une organisation conceptuelle du domaine commercial. Le recensement des termes simples en italien (par exemple, prezzo, tariffa) est suivi d’exemples d’expressions illustrant les équivalents dans les quatre langues correspondantes : ainsi, à partir de l’italien prezzo, nous retrouvons en français une expression contenant le terme prix « Les prix que vous me côtez sont exorbitants », et, pour tariffa, une expression attestant le terme tarif « Notre tarif entrera en vigueur à dater du 5 ». Les sous-titres des différentes éditions du manuel signalent l’emploi d’un métalangage de la part de l’auteur en vue de présenter sa matière : par exemple, dans l’édition de 1888 Sessa utilise « Modi di dire Espressioni famigliari e frasi commerciali » (« Expressions idiomatiques, Expressions familières et expressions commerciales »), alors que dans l’édition de 1891 sont distinguées trois sections dénommées respectivement « Espressioni famigliari e motti popolari » (« Expressions familières et dictons populaires »), « Frasi commerciali » (« Phrases commerciales ») et « Proverbi » (« Proverbes »). À partir des exemples fournis par Merger, il est possible de reconnaître, dans la majorité des cas, des locutions fortes de la langue générale (Vi dò carta bianca/Je vous donne carte blanche ; essere al verde/être à sec, sur le pavé), des collocations (Osservare. Dobbiamo farvi osservare/Nous appelons votre attention làdessus), des clichés (Cosa. Ci fareste cosa assai grata/Il nous serait agréable que).
3.3 Le XXe siècle La naissance et la diffusion de nouveaux courants didactiques au cours du XXe siècle – de la méthode directe à la méthode audio-orale, en passant par la méthode audio-visuelle et l’approche communicative pour n’en citer que quelques-unes (Cuq, Gruca 2020 ; Puren 2012) – ne s’accompagnent pas de réelles transformations en ce qui concerne l’enseignement du lexique et de la terminologie. Nous nous limitons ici à rappeler quelques expériences significatives. Le début du siècle se caractérise par l’émergence de la méthode directe, cette dénomination étant adoptée dans les documents officiels en France depuis 1901 (Puren 2012, 64). En proposant une rupture avec la méthode traditionnelle,
Phraséologie et enseignement du français commercial
35
la méthode directe prône le développement des compétences orales dans la L2, la grammaire n’étant enseignée que de manière implicite et le recours à la langue maternelle étant à éviter (Cuq/Gruca 2020, 266–268 ; Riquois 2010, 133). L’intérêt pour le lexique porte sur un noyau de mots de la quotidienneté et continue de s’appuyer sur la mémorisation des listes de vocabulaire, organisées selon un critère thématique. Les stratégies d’enseignement du sens des mots sont de type inductif et incluent « gestes, objets, mimiques, exemples » (Puren 2012, 64), de même que des représentations visuelles à travers des « tableaux muraux illustrés » (Riquois 2010, 133). À titre d’exemple, nous pouvons considérer le manuel de Dessagnes de 1919. Dans sa Préface, l’auteur déclare que, selon une approche graduelle de l’enseignement du français pour des étrangers, son point de départ est la présentation de « mots isolés indiquant des choses matérielles qu’il est possible de représenter par le dessin. Les relations (position, forme, poids, etc.) que les choses ont entre elles s’expriment ensuite en phrases rudimentaires », ce qui mène progressivement à des phrases plus complexes et au développement des règles grammaticales (Dessagnes 1919, V–VI). L’importance du lexique est évoquée à plusieurs reprises, aussi en ce qui concerne les « termes nouveaux » dont il parle explicitement (Dessagnes 1919, VII) : il s’agit de termes de base relevant des domaines qui influencent la vie quotidienne de l’époque (de la sphère militaire à l’école, en passant par la géographie et la physique) et qui sont mis en relief en caractères gras en vue d’en faciliter l’apprentissage. Les termes sont décrits comme un élément clé de chaque leçon, puisqu’ils fonctionnent en tant que voie d’accès à l’étude de l’histoire, de la littérature, de la manière de penser à la française. Par exemple, dans la leçon 64, une section du vocabulaire est consacrée de manière spécifique au commerce, comme le montre l’extrait suivant (Dessagnes 1919, 240) :
Exemple 2 : Les termes du commerce dans la méthode directe de Dessagnes (1919).
36
Maria Francesca Bonadonna
Les termes propres au domaine du commerce, qui sont censés être nouveaux du point de vue des apprenants, sont représentés en gras : il s’agit de termes simples (commerçant, commerce, fournir) et de termes complexes de type locution faible (marchands en gros, marchands en détail). Des relations paradigmatiques et syntagmatiques aussi sont mises en évidence, sans pour autant qu’elles soient ouvertement évoquées : au niveau paradigmatique, des synonymes sont offerts entre parenthèses (marchand pour commerçant, détaillant pour marchand en détail) de même que des hyponymes (marchand en gros et marchand en détail étant décrits comme deux types de commerçant) ; au niveau syntagmatique, nous repérons des collocations dans lesquelles l’attention se focalise soit sur la base (comme dans faire le commerce) soit sur le collocatif (comme le collocatif verbal fournir suivi de sa base marchandise). Il est possible d’identifier d’autres collocations dans le texte, qui ne sont pas mises en gras (par exemple, grande quantité, vendre des marchandises, petite quantité). La présence d’un noyau lexical de base est discernable aussi dans d’autres méthodes du XXe siècle, comme la méthode audio-orale et la méthode audio-visuelle, visant prioritairement l’appropriation de l’oral. C’est justement sur la base d’un recueil de conversations authentiques en français que le projet gouvernemental du Français Fondamental voit le jour en France (Gougenheim et al. 1956), avec le but d’apprendre les mots les plus fréquents de la langue française. Des travaux ultérieurs se développent à partir de cette expérience, comme par exemple Le premier dictionnaire en images de Fourré (1962), qui offre une représentation en images des 1500 mots du Français Fondamental premier degré. Dans l’avertissement initial, l’auteur explicite la finalité du livre, centré sur l’apprentissage graduel du vocabulaire, à propos duquel il parle tantôt de « mots » tantôt de « termes ». Nous y retrouvons des termes de base du commerce qui entrent dans la vie courante, par exemple acheter, affaire, commerçant et commerce (qui sont réunis dans le même article), marchand, marché, vendre. Les informations sur les termes ne sont pas présentées de manière systématique : dans certains cas, nous trouvons des informations grammaticales (par exemple, la conjugaison du présent de l’indicatif des verbes acheter et vendre), dans d’autres des informations phraséologiques telles des collocations (il a fait une bonne affaire, le commerçant est celui qui fait du commerce). L’accroissement des échanges commerciaux à l’échelle internationale dans la deuxième moitié du XXe siècle stimule davantage la publication de manuels destinés, plus spécifiquement, à l’enseignement/apprentissage du français du commerce L2. L’accès thématique au domaine commercial et le rôle majeur joué par le vocabulaire sont deux caractéristiques principales de ces ouvrages, peu importe l’approche didactique adoptée. À titre d’exemple, le Manuel de français commercial à l’usage des étrangers (Mauger/Charon 1958) vise le développement des compétences
Phraséologie et enseignement du français commercial
37
rédactionnelles, à savoir la rédaction de lettres commerciales. Après une introduction à l’histoire de l’économie française, chacune des 24 leçons s’ouvre par une section de « Vocabulaire commercial », dont l’appropriation est présentée comme préalable aux activités suivantes de syntaxe et de rédaction. C’est dans cette section que les termes principaux de chaque sous-domaine (par exemple, maisons de commerce, locaux commerciaux, publicité) sont présentés en italique, de même que définis et expliqués en recourant à d’abondantes formules métalinguistiques. Voici un exemple tiré du chapitre XVI Règlements au comptant (exemple 3, 209–211) : Exemple 3 : Le Manuel de français commercial à l’usage des étrangers (Mauger/Charon 1958). I. Sous quelle formes peuvent s’effectuer les règlements de compte ? Ils peuvent s’effectuer soit en nature (1), c’est-à-dire par échange de marchandises, soit en espèces, c’est-à-dire en monnaie (2.) 1. 2.
Un règlement en nature porte aussi le nom de troc. Le verbe dérivé est troquer (par ex. : troquer un tableau contre du charbon, en temps de guerre). Ici, monnaie a un sens très général ; mais, dans la vie courante, il a le sens de « petite monnaie », par opposition aux billets de banque […]. Monnaie désigne aussi ce qui revient de petite monnaie après un paiement : « Monsieur, vous avez oublié votre monnaie à la caisse ».
10. Que signifie « endosser un chèque » ? C’est donner l’ordre, par mention spéciale au dos du chèque, de transmettre la somme indiquée à un bénéficiaire désigné. […] 11. Qu’est-ce qu’un chèque barré ? C’est un chèque qui ne peut être encaissé que par un banquier. Les risques de perte ou de vol sont donc ainsi évités, puisqu’il ne peut être touché par une autre personne que le destinataire, sur son compte en banque.
Les termes clés, dont des locutions, sont mis en relief en italique, parfois accompagnés des relations synonymiques et des marqueurs définitionnels (« c’est-àdire…c’est-à-dire ») ; les notes en bas de page font appui sur de nombreux marqueurs de dénomination (« porte aussi le nom de ») et des précisions sémantiques (« un sens très général ; mais, dans la vie courante, il a le sens de… »). Les auteurs introduisent des termes complexes de type locution faible, par exemple en vue d’énumérer des hyponymes (comptant à la commande, comptant à la livraison, comptant d’usage), pour définir des notions clés (chèque barré). Des collocations (endosser un chèque) font également l’objet d’explications. À la fin de chaque chapitre, des exercices de révision sont destinés à la création de phrases à partir de ce que les auteurs indiquent comme « groupes de mots » en fonction de leur comportement syntaxique : il s’agit à la fois d’unités lexicales de la langue générale (par exemple, trouver), de syntagmes libres (commande du 24 jan-
38
Maria Francesca Bonadonna
vier), de termes simples (entre autres, expédition), de locutions (par exemple, la locution semi-compositionnelle chèque barré), de collocations (comme faire un virement). Nous pouvons observer ci-dessous quelques exemples (218) : Exemple 4 : Des exercices sur le lexique et la phraséologique dans le Manuel de Mauger/Charon (1958). Accuser réception – expédition – commande du 24 janvier. Faire un virement – compte de chèques postaux – habitude. Espérer – marchandises – bon état – donner satisfaction. Trouver – chèque barré – règlement – facture du 4 février. Ci-joint – nouvelle facture – annuler – précédente.
Pendant les décennies successives, la publication d’ouvrages sur le français commercial se poursuit de manière considérable. L’approche privilégiée par ces manuels est celle communicative, qui s’impose à la fin du XXe siècle dans la didactique des langues étrangères, avec le but général de stimuler les compétences à communiquer. Le lexique n’est pas la voie d’entrée principale à l’apprentissage du français, qui repose sur des compétences de nature linguistique, sociolinguistique, discursive et stratégique (Cuq/Gruca 2020, 274–275). L’enseignement de la compétence lexicale est confié aux stratégies désormais traditionnelles : chaque cours est organisé sur la base du classement thématique renvoyant à des situations significatives. Le lexique est enseigné selon une approche implicite dans laquelle les termes clés et les expressions à apprendre sont insérés directement à l’intérieur des dialogues ou des textes écrits. Dans l’exemple suivant, tiré du manuel Les affaires en français de Bajard/Sibieude (1987, 65), nous retrouvons des exemples de phrases pour s’entraîner à des dialogues sur l’actualité économique : Exemple 5 : Les dialogues dans Les affaires en français de Bajard/Sibieude (1987). Cette année, les résultats progressent ! Par contre, l’an dernier, ils n’ont pas progressé ! Cette année, l’industrie automobile a de graves problèmes ! Cette année, les relations sociales se détériorent ! Cette année, le malaise économique s’amplifie !
Des listes de termes clés ou d’expressions sont aussi utilisées en vue de leur explication et de leur mémorisation : à titre d’exemple, dans le même ouvrage (Bajard/ Sibieude 1987, 154), un exercice porte sur les unités une entreprise en forte expansion, des capitaux à court terme, le second marché, des capitaux à niveau de risque élevé. En général, les appuis métalinguistiques à propos du lexique sont assez rares et relèvent, en plus de la définition, des propriétés morphologiques, comme
Phraséologie et enseignement du français commercial
39
par exemple : « Trouvez d’autres mots de la même famille que : participer, minoritaires, créer, investir, innover, céder, implantation, évaluation » (ibid.).
3.4 Les tendances à partir du XXIe siècle Ce n’est qu’à partir des années 2000 que l’attention à la question du lexique regagne sa place dans le cadre de l’enseignement et de l’apprentissage des langues (Grossmann 2011, 163). Cet intérêt accru pour la question lexicale touche certainement la dimension phraséologique, qui fait l’objet de nombreux courants de recherche, y compris celui de la phraséodidactique (González Rey 2008). Les phénomènes phraséologiques sont également centraux dans les réflexions issues de la Lexicologie Explicative et Combinatoire, qui prône un enseignement du lexique fondé sur une démarche progressive de notions métalexicales (Tremblay/Polguère 2014). De surcroît, suite à l’évolution informatique, de nouvelles ressources informatisées ont été élaborées pour l’enseignement des langues et du lexique. Nous pouvons mentionner, à ce propos, les réseaux lexicaux tel le Réseau lexical du français, qui représente les relations entre lexies et/ou termes au niveau paradigmatique et syntagmatique tout en permettant « des exploitations pédagogiques multiples, notamment pour l’enseignement du vocabulaire en langue maternelle (L1) et en langue étrangère (L2) » (Sikora 2017, 71). Les corpus numériques constituent un autre outil de plus en plus utilisé au service de l’enseignement de la phraséologie (Cavalla 2020 ; Colson 2015). En ce qui concerne, plus spécifiquement, le cas du français commercial, l’enseignement de la composante lexicale et métalinguistique occupe une place centrale dans ses aspects morphosyntaxiques, sémantiques phonétiques et orthographiques (Mangiante 2002). Cependant, une dichotomie peut être repérée entre le renouvellement théorico-méthodologique sur la didactique du lexique et la publication de manuels de FLE sur le commerce, qui restent plutôt ancrés dans les pratiques traditionnelles. En effet, les innovations majeures touchant l’enseignement/apprentissage du lexique commercial proviennent non pas des manuels de FLE, mais de la pratique lexicographique et terminographique. Rédigé selon une approche de lexicographie pédagogique, le Dictionnaire d’Apprentissage du Français des Affaires (Binon et al. 2000) recense plus de 3.000 termes du domaine commercial, sélectionnés en fonction de leur fréquence. Les riches informations sur les termes (dont les traductions, des familles de langues, les relations sémantiques de la synonymie et de l’antonymie, des variantes diatopiques) insistent aussi sur les liens dits de collocation : par exemple, à propos du terme demande, sont présentées les collocations une accélération de la demande, une hausse de la demande, le maintien de la demande, un ralen-
40
Maria Francesca Bonadonna
tissement de la demande, une baisse de la demande. Nous signalons, au sein du projet DIACOM-fr de l’Université de Vérone, auquel nous collaborons,3 l’élaboration d’une banque de données terminologiques sous forme de réseau et constituée à partir d’un corpus diachronique sur le commerce. Bien que réalisée avec un objectif prioritairement terminologique, cette ressource sera également exploitable à des fins didactiques ; une attention particulière est consacrée aux termes complexes, catégorisés comme des locutions fortes, semi-compositionnelles et faibles, chacune susceptible d’être associée à un niveau de compétence linguistique (Bonadonna/ Frassi 2022). Si nous revenons aux manuels de langues, un dépouillement de quelques ouvrages récents sur le français du commerce montre que la prise en compte du lexique et de la phraséologie garde un poids considérable dans l’organisation des contenus didactiques, tout en s’appuyant sur les stratégies didactiques de l’accès thématique et des listes de termes et d’expressions-clés (Bonadonna à paraître). Ces listes sont mises en relief pour les apprenants par des moyens graphiques, par exemple en caractères gras ou en italiques, même si le métalangage utilisé se limite à quelques termes de base telles lexique, mot, définition. Observons, à titre d’exemple, le manuel Le français des affaires de Prévost (2015) : chaque cours étant consacré à un sous-domaine du commerce, comme Entreprises et capitaux et De la commande au paiement, il contient des listes de termes clés du sousdomaine, suivis de leurs équivalents en italien, qui sont soulignés en gras (Prévost 2015, 115–116) : Exemple 6 : La liste des termes dans Le français des affaires (Prévost 2015). Le responsable des achats = il responsabile acquisti Passer commande, commander = ordinare L’appel d’offres = la gara d’appalto Le devis = il preventivo Le bon de commande = il buono d’ordine Le délai de livraison (f.) = il termine di consegna […] Dans les meilleurs délais = nel più breve tempo possibile Le bon, le bulletin, le bordereau de livraison = il buono, la bolla di consegna […] La réception = il ricevimento […] Les frais de transport, de port = le spese di trasporto Port compris, inclus = trasporto incluso Franco de port = porto franco
La description du projet est disponible à la page suivante : https://dh.dlls.univr.it/it/progetti/pa trimonio-linguistico-culturale/#diacom [consulté le 4 mai 2022].
Phraséologie et enseignement du français commercial
41
Il résulte que ces listes réunissent différents types de termes et de phrasèmes : des termes simples (devis, réception), des locutions faibles (responsable des achats, appel d’offres, délai de livraison, bon de commande, bon/bulletin/bordereau de livraison, frais de transport/de port), des locutions semi-compositionnelles (franco de port), des collocations (passer commande, port compris/inclus), des pragmatèmes (dans les meilleurs délais). Quelques précisions métalinguistiques sont fournies à l’intérieur des textes qui montrent l’usage de ces termes, encore une fois mis en évidence pour les apprenants au niveau graphique à l’aide du soulignage et des guillemets (Exemple 7 ; Prévost 2015, 116) : Exemple 7 : La visualisation des termes dans Le français des affaires (Prévost 2015). Toute livraison comporte des frais de transport (appelés aussi « frais de port » ou tout simplement « le port ») et des risques et il faut préciser, lors de la conclusion de la commande, qui les va assumer. […] En l’espèce (nella fattispecie), le port est compris, inclus dans le prix : les flacons de parfum sont expédiés franco de port, c’est-à-dire sans frais de port pour le destinataire.
La publication d’ouvrages didactiques sur le français commercial répond aujourd’hui également aux exigences de formation en vue de l’obtention des certifications linguistiques reconnues au niveau européen et international. Les compétences visées et évaluées sont notamment celles liées à la compréhension et à la production écrite et orale, le lexique ne faisant pas l’objet d’une évaluation systématique. L’enseignement du lexique a toujours tendance à s’articuler autour de deux pôles : d’une part, est mis en place un enseignement implicite des termes fondamentaux, qui sont utilisés et, dans certains cas, mis en évidence à l’intérieur des textes abordant un sujet spécifique du commerce à l’aide de moyens graphiques. D’autre part, des listes de termes sont présentées, sans pour autant mieux décliner les différents types d’unité terminologique et/ou phraséologique : elles peuvent être accompagnées d’activités portant sur le sens ou sur le réemploi à l’intérieur de phrases. À ce propos, nous pouvons examiner Le français du monde du travail de Cloose (2014). Dans le premier chapitre, consacré aux types de sociétés en France, la description de la société anonyme est effectuée en utilisant en gras des termes de base, comme dans l’extrait suivant (Cloose 2014, 16), qui a recours à des locutions faibles (conseil d’administration, jeton de présence), à des locutions semi-compositionnelles (assemblée générale), à des collocations (membres… rémunérés), accompagnées de synonymes et de précisions sémantiques entre parenthèses (respectivement payés et le jeton de présence a une certaine contrevaleur en euros […]).
42
Maria Francesca Bonadonna
Exemple 8 : Le français du monde du travail (Cloose 2014). Les membres du conseil d’administration sont rémunérés (payés) selon le système du jeton de présence (le jeton de présence a une certaine contrevaleur en euros, qu’on reçoit à chaque participation au conseil d’administration). Chaque année, souvent au mois de juin en France, se tient l’assemblée générale.
Une section consacrée de manière spécifique à l’ « enrichissement lexical » fournit une liste de termes à propos desquels les apprenants doivent effectuer des recherches bibliographiques (exemple 9). Exemple 9 : L’enrichissement lexical dans Le français du monde du travail (Cloose 2014). Enrichissement lexical Recherchez, à l’aide des ouvrages conseillés dans votre bibliographie, le sens des mots suivants : Fondateur Siège social Dépôt de brevet Chiffre d’affaires
4 Conclusions sur les phénomènes phraséologiques et sur le métalangage Ce parcours à travers les pratiques d’enseignement du français commercial à des apprenants allophones au fil du temps met en exergue la valeur heuristique de la dimension lexicale et phraséologique, dont l’appropriation constitue un passage obligé dans la maîtrise, d’abord, du domaine, ensuite de la langue étrangère. L’intérêt pour le lexique commercial, y compris de sa dimension phraséologique, ne caractérise pas seulement les manuels spécialisés sur le français du commerce, mais également les manuels de langue générale : si les premiers décortiquent le macro-secteur commercial en distinguant ses nombreux sous-domaines et en énumérant les termes qui sont propres à ces sous-domaines, les deuxièmes s’occupent du lexique de base relevant des activités commerciales qui se répercutent sur la vie quotidienne. Dans les deux cas, une place éminente est consacrée à la présentation – bien qu’implicite dans la majorité des ouvrages consultés – à des activités et à des exercices sur la composante phraséologique. La phraséologie est abordée généralement comme un ensemble homogène, alors qu’il est possible de distinguer différents phénomènes, à partir des locutions et des collocations. En ce qui concerne
Phraséologie et enseignement du français commercial
43
les locutions, nous repérons spécialement des locutions faibles constituant les termes complexes du domaine, qui véhiculent l’apprentissage des notions de base du commerce et de son système conceptuel, de même que leur réemploi lors du passage de la L1 à la L2. À propos des collocations, il est possible de discerner des collocations verbales et adjectivales qui permettent d’enrichir la production écrite et orale. Les clichés sont aussi bien représentés dans la didactique du lexique commercial, dont la communication a régulièrement recours à des phrasèmes sémantico-lexicaux compositionnels. Si la phraséologie constitue un élément incontournable dans les ouvrages didactiques, son métalangage demeure peu développé et confié, de manière succincte, aux préfaces des auteurs, dans lesquelles sont évoquées des notions métalexicales de base telles « mots », « termes », « vocabulaire ». À l’intérieur des manuels, soit le métalangage phraséologique est complètement absent, soit il s’exprime par des étiquettes génériques, par exemple « groupes de mot », ou qui portent sur l’explicitation du sens et sur les synonymes. Le recours à des moyens graphiques (caractères gras, italique, soulignage, guillemets, etc.) est destiné à éveiller l’attention des lecteurs sur ces phénomènes sans les mentionner explicitement. L’absence d’appui métalinguistique dans la didactique du français du commerce pourrait s’expliquer par les besoins du public des professionnels, qui seraient à la recherche d’outils d’apprentissage leur permettant de parvenir promptement à une communication immédiate, tant à l’oral qu’à l’écrit (des dialogues médiévaux à la correspondance commerciale du XIXe siècle). Cependant, la profusion d’ouvrages didactiques qui se succèdent dans le contexte commercial, dotés de listes de termes et de phrasèmes cherchant à suivre les transformations rapides du domaine, pourrait suggérer les bénéfices d’un enseignement de la dimension métalinguistique qui, bien qu’apparemment plus chronophage, pourrait se révéler plus rentable quant à l’apprentissage solide du fonctionnement du lexique, à développer dans n’importe quel contexte.
Bibliographie Binon, Jean/Verlinde, Serge/Van Dyck, Jan/Bertels, Ann, Dictionnaire d’apprentissage du français des affaires, Paris, Didier, 2000. Bonadonna, Maria Francesca/Frassi, Paolo, Les termes complexes de type locution dans l’enseignement du français L2 en langue de spécialité. Le cas du domaine du commerce international, Lidil 65 (2022), 1–19. Bonadonna, Maria Francesca, La conception de mini-corpus par les apprenants pour la maîtrise des notions méta-terminologiques, in : Burrows, Alice/Cros, Isabelle/Kübler, Nathalie/Miras, Grégory (edd.), Pédagogie des langues à l’université, entre présence et distance, à paraître.
44
Maria Francesca Bonadonna
Cavalla, Cristelle/Hartwell, Laura, Présentation, Lidil 58 (2018), http://journals.openedition.org/lidil/ 5367 [dernière consultation : 10.11.2022] Colombo Timelli, Maria, Dictionnaires pour voyageurs, dictionnaires pour marchands, ou la polyglossie au quotidien aux XVIe et XVIIe siècles, Linguisticae investigationes 16:2 (1992), 395–420. Cuq, Jean-Pierre/Gruca, Isabelle, Cours de didactique du français langue étrangère et seconde, Grenoble, Presses Universitaires de Grenoble, 42020. Germain, Claude, Évolution de l’enseignement des langues. 5 000 ans d’histoire, Paris, CLÉ International, 1993. Germain, Claude, Comment on apprenait le français hors de France dès le XIe siècle, jusqu’à la parution de la première grammaire imprimée du français au XVIe siècle, Synergies France 12 (2018), 15–33. González Rey, Isabel, La phraséodidactique en action. Les expressions figées comme objet d’enseignement, in : Bini, Christine (ed.), La culture de l’autre. L’enseignement des langues à l’université, Lyon, La Clé des Langues, 2010, https://dialnet.unirioja.es/servlet/articulo?codigo= 4026980 [dernière consultation : 10.01.2022]. Gougenhaim, Georges/Michéa, René/Rivenc, Paul/Sauveageot/Aurélien, L’élaboration du français élémentaire. Étude sur l’établissement d’un vocabulaire et d’une grammaire de base, Paris, Didier, 1956. Grossmann, Francis, Didactique du lexique. État des lieux et nouvelles orientations, Pratiques 149–150 (2011), 163–183. Jousse, Anne-Laure/Polguère, Alain/Tremblay, Ophélie, Du dictionnaire au site lexical pour l’enseignement/apprentissage du vocabulaire, in : Les apprentissages lexicaux. Lexique et production verbale, Villeneuve d’Ascq, Presses universitaires du Septentrion, 2008, 141–157, https://doi.org/ 10.4000/books.septentrion.14541. Huchon, Mireille, Histoire de la langue française, Paris, Librairie Générale Française, 2002. Kahn, Gisèle, « La langue est une marchandise ». Regards sur la diffusion du français auprès de publics spécialisés du moyen âge au XXe siècle, Documents pour l’histoire du français langue étrangère ou seconde 66–67 (2021), https://doi.org/10.4000/dhfles.8125. Kristol, Andres Max, L’enseignement du français en Angleterre (XIII–XVe siècles). Les sources manuscrites, Romania 443/444 (1990), 289–330. Lerat, Pierre, Langue et technique, Paris, Hermann, 2016. Mangiante, Jean-Marc, Place et rôle du lexique spécialisé dans les discours de français commercial et économique, Recherche et pratiques pédagogiques en langues de spécialité. Cahiers de l’Apliut 21:4 (2002), 27–39. Mejri Soumaya, Mejri Salah, La phraséologie spécialisée. Concepts, opacité, culture, Phrasis. Studi fraseologici e paremiologici 4 (2020), 256–283. Mel’čuk, Igor/Clas, André/Polguère, Alain, Introduction à la lexicologie explicative et combinatoire, Louvain-la-Neuve, Duculot, 1995. Mel’čuk, Igor, Tout ce que nous voulions savoir sur les phrasèmes, mais …, Cahiers de lexicologie 102 (2013), 129–149. Merger, Marie-France, Giuseppe Sessa et sa dottrina popolare in quattro lingue (1891) ou … Réussirai-je à écrire une lettre commerciale avec cet ouvrage ?, Documents pour l’histoire du français langue étrangère ou seconde 42 (2009), 215–230. Puren, Christian, Histoire des méthodologies de l’enseignement des langues, Paris, Nathan-CLE international, 2012 [1988]. Riquois, Estelle, Évolutions méthodologiques des manuels et matériels didactiques complémentaires en FLE, Education & formation e-292 (2010), 129–142.
Phraséologie et enseignement du français commercial
45
Sclafani, Marie-Denise, Les débuts de l’enseignement du français commercial en Italie, de la loi Casati à la réforme Gentile, Verbis. Lingue letterature culture 2 (2019), 357–371. Sikora, Dorota, Modélisation de connaissances lexicales dans une ressource lexicale, Revue française de linguistique appliquée 22, 61–74 (2017). Van Els, Theo J.M./Knops, Mathieu F., The history of the teaching of foreign languages in the low countries, Historiographia linguistica 15:1–2 (1988), 289–316. Zimont, Elizaveta, Les « collocutions » (ca 1543–1546) de Jan Berthout. Variations et répétitions dans un manuel de langue, Documents pour l’histoire du français langue étrangère ou seconde 62–63 (2019), 115–140.
Sources primaires Bajard, Jean-Pierre/Sibieude, Christiane, Les affaires en français, Paris, Hatier, 1987. Berthout, Jan, Collocutions bien familieres, composees par Jean Berthout maistre d’ecole à Bruxelles, ausquelles est ajouté un vocabulaire, divisé par chapitres, Antwerpen, Hieronymus Verdussen, 1619. Cloose, Éliane, Le français du monde du travail. Approche spécifique de l'économie et du monde des affaires, Grenoble, Presses Universitaires de Grenoble, 52014. Dessagnes, P., Le français pour les étrangers. Méthode directe, Paris, Masson et Cie, 1913. Fourré, Pierre, Premier dictionnaire en images. Les 1500 mots du français fondamental 1er degré, Paris, Didier, 1962. Mauger, Gaston/Charon, Jacqueline, Manuel de français commercial. À l’usage des étrangers, Paris, Larousse, 1958. Prévost, Michèle, Le français des affaires, Venezia, Libreria Editrice Cafoscarina, 2015. Reess-Lestienne, C.F./Trémery, F., Nouveau manuel complet pour la correspondance commerciale, Paris, Roret, 1840. Sessa, Giuseppe, Modi di dire Espressioni famigliari e frasi commerciali nelle quattro lingue italiana – francese – inglese – tedesca, Milano, Cogliati, 1888.
Maria Teresa Zanola
La formation des phrasèmes terminologiques entre diachronie et variation Résumé : La perspective diachronique longue ou courte en terminologie favorise l’étude de l’évolution de formes et de sens dans les lexiques spécialisés, au cours d’une période déterminée d’un domaine ou d’un sous-domaine. Quelques cas d’analyse dans le domaine scientifique des mathématiques et monétaire illustrent l’efficacité d’un classement théorique des phrasèmes terminologiques qui met en valeur les degrés de gradation et de variation que l’on peut établir dans le figement. Mots-clés : terminologie diachronique, lexique spécialisé, phrasème, phraséologie, variation Abstract: Short or long-term diachronic research in terminology supports the investigation of the evolution of forms and meanings in specialized lexicons over a given period of time in a domain or sub-domain. A few case studies in the scientific field of mathematics and finance show how effective a theoretical classification of terminological phrasemes can be, by highlighting the degrees of graduation and variation in the process of idiomaticity. Keywords: diachronic terminology, specialised lexicon, phraseme, phraseology, variation
1 Introduction La terminologie permet de pénétrer les savoirs et les savoir-faire d’une langue et d’une société : dans tout domaine structuré des savoirs et des pratiques, l’élaboration des formes linguistiques maîtrisant les concepts ainsi que l’analyse et l’étude de ces structures conceptuelles accompagnent l’histoire des langues mêmes. Des dénominations telles que nomenclature, lexique technique et scientifique, lexique spécialisé ont anticipé et/ou accompagné les démarches de l’analyse terminologique. Des approches sémasiologiques et onomasiologiques ont caractérisé l’évolution des recherches terminologiques en Europe et à l’échelle internationale, toujours en dialogue avec les études sur la néologie, sur la variation et les démarches https://doi.org/10.1515/9783110749854-004
48
Maria Teresa Zanola
de normalisation. La production continuelle de nouvelles connaissances et la grande complexité des phénomènes va au-delà de normes rigides, et introduit des solutions différentes dans le patrimoine terminologique. D’un point de vue onomasiologique, le processus de création de la terminologie ne considère pas toujours les relations parmi les mots en tant que parfaits équivalents des relations parmi les phénomènes. D’un point de vue sémasiologique, la terminologie favorise l’accès à la connaissance des domaines, permet la précision conceptuelle et contribue à la clarté dans la dénomination des objets, des opérations, des procédés abstraits et concrets, théoriques et pratiques. La terminologie documente ainsi le développement technique et scientifique, le communique au citoyen, à l’expert, au journaliste, au public. Chaque science, chaque technique, mais aussi chaque profession et chaque métier transmettent leur patrimoine cognitif et expérientiel à travers leurs terminologies respectives et poursuivent leur évolution et leur enrichissement à travers des néologismes de forme et de sens, que ce soient des unités simples ou complexes. La terminologie permet une approche qui considère l’évolution du sens et de la forme aussi bien que les variations possibles au sein des réalités linguistiques, ce qui stimule les recherches aussi dans une perspective diachronique, dans l’histoire de la langue et de la pensée, au sein du contexte disciplinaire et culturel des domaines envisagés. Les activités conceptuelles et désignatives autour de la connaissance de la nature des faits terminologiques observés en perspective diachronique – la métaterminologie – acquièrent un rôle encore plus significatif, du fait que les sources de documentation – les realia terminologiques – obligent à en vérifier la portée et l’efficacité. La perspective de la terminologie diachronique permet d’aborder l’étude de l’évolution de formes et de sens dans les vocabulaires et dans la lexicographie spécialisée ; elle favorise des enquêtes dans les rapports évolutifs entre concepts et termes, entre terminologie et néologie, que ce soit au cours d’une période déterminée d’un domaine ou d’un sous-domaine spécialisé, pour une période de diachronie longue ou courte. Dans une panoplie de ressources textuelles très variées dans le temps et dans la typologie, il est très intéressant de considérer un aspect précis de la formation terminologique, qui n’a pas été nécessairement observé dans une perspective de diachronie longue au sein de domaines spécialisés déterminés : l’analyse des phrasèmes terminologiques. C’est un terrain d’exploration passionnant, pour lequel nous ne pouvons que signaler quelques cas d’études en tant que trace évidente de l’intérêt de cette perspective, permettant de valider l’efficacité de typologies lexicales et de catégorisation, même dans des lieux moins balayés et moins exploités.
La formation des phrasèmes terminologiques entre diachronie et variation
49
Après avoir illustré le système typologique utilisé pour analyser les phrasèmes terminologiques, faisant référence au modèle de Mel’čuk (1995 ; 1997 ; 2013 ; voir aussi Mel’čuk/Clas/Polguère 1995), nous offrirons des exemples de cette application dans le domaine scientifique des mathématiques et monétaire. Des exploitations diversifiées permettront d’apprécier l’efficacité d’un classement théorique des phrasèmes terminologiques qui met en valeur les degrés de gradation – et de variation – que l’on peut établir dans le figement.
2 Les phrasèmes dans les langues spécialisées : des perspectives d’étude Il faut tout d’abord considérer que la prise en compte de la phraséologie dans les études terminologiques est relativement récente. Si l’on considère les phases de l’évolution de la terminologie comme discipline (Humbley 2018), après le moment de démarrage lié à la naissance et à l’affirmation de la théorie générale de la terminologie, la phase suivante a pris pleinement conscience de l’existence de la dimension phraséologique et discursive, pour s’ouvrir ensuite à la prise en compte de la variation linguistique.1 Cette période de l’histoire de la terminologie est marquée par un rapprochement de plus en plus étroit de la pratique terminographique avec la lexicographie et, par conséquent, avec la linguistique et les sciences du langage.
Il ne faut pas sous-estimer le fait que l’utilisation des systèmes informatiques dans la gestion des données terminologiques a contribué à un changement considérable dans la théorisation de la discipline. Les grandes bases de données terminologiques (les premières furent Eurodicautom de la Communauté européenne, la Banque de terminologie du Québec – devenue plus tard le Grand dictionnaire terminologique –, Termium Plus® à l’Université de Montréal, géré ensuite par le Bureau de la traduction) ont révolutionné la pratique de la terminologie, permettant l’accès à de vastes répertoires facilitant la création de ressources terminologiques. Cette évolution technologique intense a également entraîné une modification radicale de la configuration des producteurs de terminologie et des utilisateurs de ressources terminologiques. Si au cours de la période wüsterienne les conceptualisations de la discipline étaient exploitées et partagées uniquement par des experts et des professionnels issus de domaines non linguistiques, à partir des années 1970 et 1980 les linguistes se sont progressivement impliqués dans le travail terminologique : ils organisent des débats (les journées organisées par le Réseau international de néologie et de terminologie, RINT) et publient des ouvrages visant à préciser le rôle du terminologue et du linguiste dans la pratique terminologique, désormais ouverte à la composante phraséologique de la langue.
50
Maria Teresa Zanola
La conscience de la nécessité d’une investigation linguistique au sein de la terminologie contribue au développement de divers courants d’études dans lesquels l’analyse des unités terminologiques suit des directions parfois différentes : il faut citer la théorie communicative de la terminologie (Cabré 1992 ; 1999), la terminologie sociocognitive (Temmerman 2000), la socioterminologie (Gaudin 2002), l’approche terminologique basée sur les cadres (Faber/Márquez Linares/ Vega Expósito 2005 ; Faber 2011), la linguistique de corpus avec la consolidation conséquente de la dimension discursive dans les études terminologiques (Condamines 2005), la théorie de la métaphore grammaticale, qui considère l’évolution des discours technico-scientifiques et la terminologisation des unités discursives (Pecman 2012a ; 2012b ; 2014). Dans le cadre de ces courants, la terminologie s’affirme en tant que terrain d’investigation et de réflexion vaste, au sein duquel la variation linguistique, dans ses dimensions synchroniques et diachroniques, est l’objet d’études et d’analyses approfondies (voir Condamines/Rebeyrolles/Soubeille 2004 ; Dury/Picton 2009 ; Zanola 2014 ; Grimaldi 2017 ; Zollo 2020 ; Piselli 2021 ; Zanola 2021a ; 2021b). La terminologie offre son patrimoine aux analyses phraséologiques, avec la possibilité d’orientations différentes dans l’étude et l’analyse des expressions recensées.2 Frassi (2020) signale les études qui ont mis au clair les caractères de la phraséologie spécialisés – L’Homme 2000 ; Vittoz 2005 ; Rosembaum 2016 ; Abreu 2018 ; Frassi/Calvi/Humbley 2020 –, précisant que « la terminologie a toujours préféré présenter les unités terminologiques à partir de la distinction entre termes simples et termes complexes » et soulignant que « cette distinction n’a pas toujours fait l’unanimité quant aux critères de classement de ces deux types de termes ». Si pour Cabré (1992) – remarque Frassi – « les termes simples correspondent à des unités lexicales monomorphémiques, alors que les termes complexes incluent un grand nombre de cas de figures – depuis les dérivés morphologiques et les composés jusqu’aux syntagmes très fréquents en terminologie », pour L’Homme (2004) « la distinction entre termes simples et termes complexes repose sur un critère graphique, et ce, pour des raisons liées à l’extraction automatique ». Ainsi les termes complexes incluent-ils des entités lexicales composées par plusieurs mots graphiques, alors que les termes simples correspondent à des entités lexicales correspondant à un seul mot graphique.
L’importance de la variation est donc liée au progrès technologique. Grâce aux extracteurs automatiques et semi-automatiques de terminologie à partir de corpus et aux applications innovantes du Traitement Automatique des Langues, la variation linguistique au niveau discursif et textuel occupe une place prépondérante dans les analyses terminologiques. Il s’agit d’un domaine d’étude qui suscite un intérêt croissant dans la recherche terminologique des années 2000 et 2010 (voir Freixa 2006 ; Cabré 2008 ; Pecman 2012a ; 2012b ; 2014 ; Zanola 2014).
La formation des phrasèmes terminologiques entre diachronie et variation
51
Ce sont trois les thèmes abordés aujourd’hui par les études terminologiques dans une perspective variationniste (Drouin/Francoeur/Humbley/Picton 2017) : – la dimension sociale de la variation, à travers les différentes catégories de locuteurs, à savoir : l’usage de l’expert par rapport à celui de l’utilisateur commun ; la dimension émotionnelle ; la variation diastratique dans les langages spécialisés ; – les outils et les méthodes pour identifier et décrire la variation terminologique ; – la sémantique de la variation à travers l’analyse de la saturation conceptuelle et de la métaphore.
3 La phraséologisation dans le domaine des mathématiques anciennes La richesse des sources documentaires et des realia terminologiques constitue le point de départ de toute recherche terminologique : chaque secteur, chaque domaine doit être considéré pour la particularité de sa tradition conceptuelle et la spécificité de son contenu. Pour établir une typologie de phrasèmes terminologiques en perspective diachronique, il faut défricher un terrain métaterminologique vaste, qui aide à distinguer entre les archaïsmes et les phrasèmes qui restent vivants et/ou productifs dans le temps. La phraséologisation relevée à une époque donnée et dans un domaine conceptuel déterminé – qui exprime l’état des connaissances et des coordonnées culturelles de la tranche temporelle considérée – montre la possibilité d’appliquer une méthode d’analyse solide et de pouvoir classer des phrasèmes sémantiques et non sémantiques (selon la catégorisation de Mel’čuk 1995 ; 1997) avec différents degrés de figement. L’efficacité de ces instruments d’analyse phraséologique sera illustrée à l’aide de quelques cas, entre diachronie et variation. Dans le domaine des mathématiques du XVe siècle, le Triparty en la science des nombres de Nicolas Chuquet (1484), premier ouvrage d’algèbre écrit en franϛais, offre un terrain très intéressant pour observer les phrasèmes. L’arithmétique écrite en latin parle en langue vulgaire pour s’adresser aux marchands en raison de leurs besoins de calcul : le Triparty traite des équations polynomiales, des radicaux et d’arithmétique commerciale, dans un style qui se distingue par la précision du langage et le symbolisme utilisé (Zanola 2003, 642–645). Pour répertorier la richesse des locutions relatives aux nombres, la description des phrasèmes de l’approche de Mel’čuk évoquée (1995 ; 2013) est un appui considérable, efficace pour toute tranche temporelle synchronique analysée en perspective diachronique.
52
Maria Teresa Zanola
Soit la définition donnée de « phraséologisation » (Mel’čuk 1997, 393) : « Nous avons affaire à la phraséologisation chaque fois que, dans une langue L, un complexe Z de signes X et Y possède des propriétés – sémantiques, phonétiques ou combinatoires – qui ne découlent pas, suivant les règles standard de L, des propriétés correspondantes des signes constituants. Autrement dit, Z ≠ X + Y. L’expression Z est alors appelée complexe phraséologisé de signes. Nous appelons un tel Z un phrasème, et l’ensemble de tous les phrasèmes de L, la phraséologie de L ».
Il y a trois composantes de X : le signifié, le signifiant et le syntactique. Selon la composante – que l’on pourrait considérer comme défaillante – du complexe des signes X, nous distinguons les phrasèmes suivants : – les phrasèmes sémantiques (le signifié est lexicalisé) ; le plus souvent ce sont des mots-formes phraséologisés ; – les phrasèmes non-sémantiques : les phrasèmes formels (le signifiant est lexicalisé ; des formes supplétives où l’écart est imprévisible dans le domaine de la forme, par ex. je vais, j’✶aille) et les phrasèmes combinatoires (le syntactique est lexicalisé), tels que les pragmatèmes (par ex., les formules de salutations). Un phrasème X est dit sémantique si et seulement si X est quasi-représentable dans son signifiant et peut être caractérisé par l’importance des composantes communes entre le signifié du phrasème sémantique donné et les signifiés des signes dont il est constitué. On peut distinguer trois classes majeures de phrasèmes sémantiques : – les phrasèmes sémantiques forts ou complets, où le signifié du phrasème ne partage aucune composante non triviale avec aucun des signifiés des signes constituants : c’est de l’algèbre, en deux mots, estre au bas des quatre pieds, estre à deux doigts de la mort (Di Stefano 1991, s.v.). Ce sont les phrasèmes les plus reconnaissables, pour lesquels la compréhension des composantes séparées est opaque et le niveau de métaphorisation est le plus fort. D’autres exemples (Di Stefano, s.v.) : et un et deux ‘dit de l’argent comptant’, autant en vault ung comme deux ‘ils sont tous pareils’, se faire tenir a quatre ‘etre furieux, en colère’. Dans le traité du Triparty, on peut relever des phrasèmes sémantiques lexicaux au niveau morphologique, du type figure ‘chiffre’, denominacion ‘exposant’, notable ‘vérité mathématique’ ; – les phrasèmes sémantiques faibles, ou semi-phrasèmes, où le signifié du phrasème inclut le signifié d’un des signes constituants mais ne partage aucune composante non triviale avec les signifiés des autres signes (ils sont appelés aussi « collocations » ; voir aussi les fonctions lexicales de Mel’čuk) :
La formation des phrasèmes terminologiques entre diachronie et variation
–
53
parvenir à l’un ‘se mettre d’accord, atteindre son but’ (Di Stefano, s.v.), partir les nombres, medier les nombres, adjouster les nombres (Triparty) manifestant une fonction Oper. Dans ensemble totalement ordonné (Triparty) est active une fonction Magn qui marque l’intensification du sens apporté par le phrasème (avec l’introduction d’une propriété mathématique spécifique : la création d’un concept nouveau détermine une définition appropriée – voir Gentilhomme 1995, 18) ; des quasi-phrasèmes sémantiques, où le signifié du phrasème inclut les signifiés de tous les signes constituants mais le contenu exprimé par la locution dépasse celui du syntagme libre formé de composantes porteuses de signifiés-concepts ou des signifiés-notions (Gentilhomme 1995, 19–20). Signalons les exemples suivants : règle de trois, nombre parfaitz, proporcionalz ; nombre rout, entier, simple, composé ; racines cubiques, tierces (Triparty).
L’application de cette typologie de phrasèmes permet d’illustrer la richesse linguistique de la phraséologie terminologique et de mettre en valeur la phraséologie en tant qu’appui et aide à la synonymie et vice-versa. Il n’est pas inintéressant de remarquer que c’était une langue scientifique en formation, à un stade où il était fréquent d’avoir des doublets aussi bien que des phénomènes de réduplication synonymique et de polysémantisme (Thomasset 2005). À titre d’exemple, rappelons qu’au Moyen Âge le mot ‘arithmétique’ réunissait un vocabulaire avec une gamme synonymique riche, où les diverses appellations correspondaient aussi à des diversités de contenu. Arismetica, algorisme, arte de l’abbaco, science des nombres, art arismetica, libro di ragioni … étaient autant de manières d’appeler le même objet. « Le mot est de fait un terme générique qui englobe tout ce qui concerne le nombre » remarque Spiesser (2003, 10–11) : l’arithmétique ou science des nombres peut désigner l’arithmétique dite spéculative ou, à l’opposé, la logistique ou art du calcul, ainsi indiquant deux directions conceptuelles, l’une théorique et l’autre pratique. Celles-ci donnent lieu à des séries synonymiques distinguées : de la part de l’arithmétique pratique, il y a les techniques de calcul, la pratique commerciale, les traités d’abaque ou d’algorisme, de la part de l’arithmétique spéculative on parle de science des nombres. Autant de phrasèmes dans la terminologie scientifique des mathématiques qui ont mobilisé aussi la modification du réseau synonymique des termes. Le statut des locutions mathématiques présente le phénomène de la variation synonymique de type différent – diastratique, diaphasique surtout. Considérons les exemples suivants : le terme spin – une propriété fondamentale intrinsèque d’une particule élémentaire (électron, neutron, etc.) – est consacré par l’usage en physique, désignant moins le mouvement de rotation de la particule sur ellemême que le moment cinétique créé par ce mouvement. Moment cinétique propre
54
Maria Teresa Zanola
est son synonyme, un synonyme complet, qui se différencie pour sa base lexicale française remplaçant l’emprunt à l’anglais. Ce terme est accepté uniquement en physique, car dans les autres domaines l’équivalent de spin demeure le terme rotation (notamment en astronomie). Dans le langage des sciences, le terme ne vit que dans le réseau conceptuel de sa discipline et c’est le domaine contextuel qui constitue sa toile de fond : si vraisemblance et probabilité peuvent entretenir des rapports de synonymie, les deux concepts se distinguent lorsqu’ils sont utilisés en statistique ou dans la théorie de la probabilité. C’est le cas de spin synonyme de moment cinétique propre en physique et de spin synonyme de rotation en astronomie qu’on vient de citer.
3.1 La phraséologisation dans l’histoire de la monnaie L’observation des locutions concernant les monnaies – de l’hyperonyme argent et sou aux monnaies du temps, telles que le denier, l’écu, la livre et le marc – nous a donné la curiosité d’approfondir l’analyse du rapport – si rapport il y a – entre la réalité historique et les niveaux de métaphorisation que ces mêmes mots ont développés en moyen français. Prenons quelques exemples de la phraséologie de denier recensée dans le Dictionnaire des locutions en moyen français (Di Stefano 1991) : – ne … denier, un denier, deux deniers … ‘peu ou rien’ ; – ne … denier ne maille ‘pas un sou, rien du tout’ ; – de quatre deniers ‘de peu d’envergure’ ; – deniers secs ‘argent comptant’ ; – le denier Dieu ‘pieuse contribution qui scelle un marché’ ; – conoistre qqn comme un denier ‘fort bien’ ; – employer bien ses quatre deniers ‘manger bien en proportion de ce qu’on paye’ ; – gagner, vendre denier a denier ‘sou après sou, par petites quantités’ ; – vendre deniers contans, a bons deniers comptans ‘trahir une personne’ ; – ne scet mettre deux deniers qu’il n’en ait un parisis ‘dit d’une personne qui a une chance inouïe’. Denier figure aussi dans des proverbes : le denier est bon qui sauve la livre, un denier en coffre vaut droit trois en bourse d’autruy, mieulx vaut souffrir que denier en coffre, denier oublié n’a grace ne gré. Dans la variété lexicalisée générée par le vocabulaire monétaire, nous retrouvons toute la gamme typologique des phrasèmes (Zanola 2004) :
La formation des phrasèmes terminologiques entre diachronie et variation
–
– – –
55
les phrasèmes sémantiques complets : employer bien ses quatre deniers, en parler pour son argent ‘connaître bien le prix d’une chose’, prendre pour argent comptant ‘être crédule’ ; les semi-phrasèmes ou collocations : conoistre qqqn comme un denier ; les quasi-phrasèmes : vendre denier à denier ‘vendre sous après sou, par petites quantités’ ; les phrasèmes pragmatiques, où le signifié n’est pas complètement prévisible à partir des signifiés des signes constituants (au denier douze, au sou la livre).3
On pourrait analyser les locutions relatives à l’argent et aux monnaies suivant ce classement, mais il nous paraît plus intéressant de souligner certains emplois récurrents que nous retrouvons dans ce domaine de phraséologisation. Observons l’expression de l’augmentation (Zanola 2004, les exemples sont tirés de Di Stefano 1991) : conoistre qqn comme un denier ‘fort bien’ ; ne scet mettre deux deniers qu’il n’en ait un parisis ‘dit d’une personne qui a une chance inouïe’. Encore plus fréquent est l’emploi de la métaphore monétaire pour exprimer la négation totale ou partielle : ne gagner argent ne gaige ‘rien du tout’, ne … denier, un denier, deux deniers … ‘peu ou rien’, ne … denier ne maille ‘pas un sou, rien du tout’, pour tout l’argent d’Asie ‘pour rien au monde’. D’autres expressions soulignent la pauvreté et la pénurie d’argent : estre logé chez le sieur d’Argentcourt ‘être à court d’argent’, bas, plat, leger d’argent ‘pauvre, fauché’, mince d’argent ‘fauché’. La petitesse d’esprit est lexicalisée dans la locution de quatre deniers ‘de peu d’envergure’. Ces quelques exemples nous permettent non seulement de reconstituer une sorte de toile de fond où vivaient ces locutions ayant trait aux monnaies, mais ils nous donnent également l’occasion d’alimenter la réflexion sur les liens que ces mots tissent entre réalité historique et niveaux de métaphorisation en moyen français. Ils suffisent toutefois pour préparer le terrain à de nouvelles pistes de recherche se situant dans une perspective diachronique.
Au sous la livre indique le taux : « Lettres de Louis XI IX,65 : et aussi que paiez et contribuez ausdictz fiez et ausmones pro rate et au solz la livre de ce que vous tenez de ladicte prevosté… pour rate et au soult la livre » (Di Stefano 1991).
56
Maria Teresa Zanola
4 Conclusion L’histoire des mathématiques s’entremêle avec l’histoire du lexique du commerce, où technique, théorie, intentions pédagogiques et besoins commerciaux se fondent dans l’histoire des mots et des concepts : les phrasèmes utilisés dans le discours du raisonnement mathématique appartiennent au code et au système linguistique de cette science, au sein de laquelle ils assument une valeur univoque. Villa (2016, 129) souligne que dans la terminologie scientifique le processus de lexicalisation est presque toujours précédé d’une phase où coexistent différents synonymes et variantes du néologisme : la néoformation qui reflète le mieux le concept s’impose sur les autres, à moins que des facteurs de nature linguistique n’interviennent dans ce processus. Le réseau conceptuel et dénominatif est ainsi utilisé avec la plus complète conscience des relations sémantiques : le cas évoqué de la synonymie illustre la situation d’un procédé rhétorique utilisé au moment de la discussion et de l’établissement de nouveaux référents, un procédé qui marque le résultat d’un processus de distinction dans un domaine où le paradigme est à la fois une réalité syntagmatique. Au sein de ces choix procéduraux les phrasèmes ont leur droit de vie et de vitalité. L’intérêt de valoriser l’analyse de la phraséologie terminologique permet d’illustrer aussi la richesse des typologies de formation que les domaines spécialisés offrent à l’analyse linguistique et conceptuelle, ouvrant la voie à des terrains encore inexplorés à déblayer.
Bibliographie Abreu, Sabrina Pereira de, Consideraϛões sobre a natureza colocacional e locucional de sintagmas terminológicos, ReDILLeT 1:2 (2018), https://revistas.unc.edu.ar/index.php/ReDILLeT/article/ view/22266 [dernière consultation : 12.11.2021]. Anscombre, Jean-Claude/Mejri, Salah (edd.), Le figement linguistique. La parole entrâvée, Paris, Honoré Champion, 2011. Beaujouan, Guy, L’enseignement de l’arithmétique élémentaire à l’université de Paris aux XIIIe et XIVe siècles, in : Beaujouan, Guy (ed.), Par raison de nombres. L’art du calcul et les savoirs scientifiques médiévaux, Aldershot, Variorum, 1991, 93–124. Burger, Harald/Dobrovol’ skij Dmitrij/Kühn Peter/Norrick, Neal R. (edd.), Phraseology. An international handbook of contemporary research, Berlin-New York, Mouton de Gruyter, 2007. Cabré, Maria Teresa, La terminologia. La teoria, els mètodes, les aplications, Barcelona, Empúries, 1992. Cabré, Maria Teresa, La terminología. Representación y comunicación, Barcelona, Institut Universitari de Lingüística Aplicada & Universitat Pompeu Fabra, 1999. Cabré, Maria Teresa, El principio de poliedricidad. La articulación de lo discursivo, lo cognitivo y lo lingüístico en terminología, Iberica. Revista de la asociación europea de lenguas para fines
La formation des phrasèmes terminologiques entre diachronie et variation
57
específicos 16:1 (2008), 9–36, https://www.redalyc.org/articulo.oa?id=287024065003 [dernière consultation : 12.11.2021]. Chuquet, Nicolas, Triparty en la science des nombres, Bibliothèque nationale fonds français n° 1346, ff. 148–210, 1484. Condamines, Anne, Linguistique de corpus et terminologie, Langages 157 (2005), 36–47. Condamines, Anne/Rebeyrolles, Josette/Soubeille, Anne, Variation de la terminologie dans le temps. Une méthode linguistique pour mesurer l’évolution de la connaissance en corpus, in : Actes d’Euralex international congress (6–10 juillet 2004), Lorient, Université de Lorient, 2004, 547–557. Cowie, Anthony Paul (ed.), Phraseology. Theory, analysis, and application, Oxford, Clarendon Press, 1988. Di Stefano, Giuseppe, Dictionnaire des locutions en moyen français, Montréal, Ceres 1991. Drouin, Patrick/Francoeur, Aline/Humbley, John/Picton, Aurélie (edd.), Multiple perspectives on terminological variation, Amsterdam/New York, John Benjamins, 2017. Dury, Pascaline/Picton Aurélie, Terminologie et diachronie. Vers une réconciliation théorique et méthodologique, Revue franϛaise de linguistique appliquée 14:2 (2009), 31–41. Faber, Pamela, The dynamics of specialized knowledge representation. Simulational reconstruction or the perception-action interface, Terminology 17:1 (2011), 9–29. Faber Benítez, Pamela/Márquez Linares, Carlos/Vega Expósito, Miguel, Framing terminology. A process-oriented approach, Meta Journal des traducteurs/Meta : translators’ journal 50:4 (2005), 1–10. Pierre/Lafin, Pierre/Piguet, Marie-France (edd.), Locution. Entre lexique, syntaxe et pragmatique, Paris, Klincksieck, 1997. Frassi, Paolo/Calvi, Silvia/Humbley, John, Fouille de textes et repérage d’unités phraséologiques, in : Terminologie & ontologie. Théorie et applications, Chambéry, Presses Universitaires Savoie Mont Blanc, 2020, 321–338. Frassi, Paolo, La force des locutions faibles en domaine de spécialité, in : Conceição, Manuel Célio/ Zanola, Maria Teresa (edd.), Terminologia e mediação lingüística. Métodos, práticas e atividades, Faro, Universidade do Algarve Editora, 2020, 43–58. Freixa, Judith, Causes of denominative variation in terminology. A typology proposal, Terminology 12:1 (2006), 51–77. Gaudin, François, Socioterminologie. Une approche sociolinguistique de la terminologie, Bruxelles, De Boeck, 2002. Gentilhomme, Yves, Contribution à une réflexion sur les locutions mathématiques, Cahiers de Lexicologie 66:1 (1995), 5–37. Grimaldi, Claudio, Discours et terminologie dans la presse scientifique franϛaise (1699–1740). La construction des lexiques de la botanique et de la chimie, Berne, Peter Lang, 2017. Humbley, John, La terminographie entre langue et discours. Réflexions historiques et épistémologiques, in : Altmanova, Jana/Centrella, Maria/Russo, Katherine (edd.), Terminology & discourse/ Terminologie et discours, Bern, Peter Lang, 2018, 69–92. L’Homme, Marie-Claude, Understanding specialized lexical combinations, Terminology 6:1 (2000), 89–109. Mejri, Salah, Figement et traduction Problématique générale, Meta. Journal des traducteurs/Meta : translators’ journal 53:2 (1998), 244–252. Mel’čuk, Igor A., Phrasemes in language and phraseology in linguistics, in : Everaert, Martin/van der Linden, Erik-Jan/Schenk, Andr/Schreuder, Robert (edd.), Idioms. Structural and psychological perspectives, Hillsdale, N.J. – Hove, Erlbaum, 1995, 167–232. Mel’čuk, Igor A., Cours de morphologie, vol. 4, Montréal, Presses de l’Université de Montréal, 1997.
58
Maria Teresa Zanola
Mel’čuk, Igor A., Tout ce que nous voulions savoir sur les phrasèmes, mais …, Cahiers de lexicologie 102 (2013), 129–149. Mel’čuk, Igor A./Clas, André/Polguère, Alain, Introduction à la lexicologie explicative et combinatoire, Bruxelles, Duculot, 1995. Pecman, Mojca, Étude lexicographique et discursive des collocations en vue de leur intégration dans une base de données terminologiques, The Journal of Specialised Translation (JoSTrans) 18 (2012), 113–138 (=2012a) Pecman, Mojca, Tentativeness in term formation. A study of neology as a rhetorical device in scientific papers, Terminology 18/1 (2012), 27–58 (=2012b) Pecman, Mojca, Variation as a cognitive device. How scientists construct knowledge through term formation, Terminology 20:1 (2014), 1–24. Piselli, Francesca, Néologie et variation synonymique des termes de couleur de la teinture de la soie. Une approche diachronique, Cahiers de lexicologie 118 (2021), 115–135. Rosenbaum, Franková Lucia, Phrasèmes spécialisés dans les textes économiques, Cahiers de lexicologie 108:1 (2016), 43–57. Spiesser, Maryvonne, Une arithmétique commerciale du XVe siècle. Le « Compendy de la pratique des nombres » de Barthélemy de Romans, Turnhout, Brepols, 2003. Temmerman, Rita, Towards new ways of terminology description. The sociocognitive approach, Amsterdam/Philadelphia, John Benjamins 2000. Thomasset, Claude, L’élaboration d’un lexique du vocabulaire scientifique en ancien franϛais, Quaderni del CIRSIL 4 (2005), 31–41. Villa, Maria Luisa, La scienza sa di non sapere per questo funziona, Milano, Guerini e Associati, 2016. Vittoz, Marie-Berthe, Les locutions en discours. Vers un inventaire de formes idiomatiques dans la langue des affaires franϛais-italien, Alessandria, Edizione dell’Orso, 2005. Zanola, Maria Teresa, Phrasèmes sémantiques et pragmatiques dans le lexique des sciences du XVe siècle. Pour une typologie phraséologique, Le moyen français 51– 52–53 (2003), 641–650. Zanola, Maria Teresa, Argent et monnaies au XVe siècle entre réalité historique et métaphorisation, in : Colombo, Maria/Galderisi, Claudio (edd.), Pour acquerir honneur et pris. Mélanges de moyen français offerts à Giuseppe Di Stefano, Montréal, Ceres 2004, 593–599. Zanola, Maria Teresa, Arts et métiers au XVIIIe siècle. Études de terminologie diachronique, Paris, L’Harmattan, 2014. Zanola, Maria Teresa, Che cos’è la terminologia, Roma, Carocci 2020. Zanola, Maria Teresa, Terminologie diachronique. Méthodologies et études de cas Une introduction, Cahiers de lexicologie 118:1 (2021), 13–21 (=2021a). Zanola, Maria Teresa (ed.), Terminologie diachronique. Méthodologies et études de cas, Cahiers de lexicologie 118:1 (2021), 1–289 (=2021b). Zollo, Silvia Domenica, Origine et histoire du vocabulaire des arts de la table. Analyse lexicale et exploitation de corpus textuels, Berne, Peter Lang, 2020.
Delphine-Anne Rousseau
Phrasèmes terminologiques et collocations technolectales Résumé : En offrant une réflexion sur le statut des unités polylexicales en terminologie, cet article vise à lever les ambigüités qui subsistent en terminologie quant à la délimitation des concepts de phrasème, collocation et phraséologisme. Sur la base d’une analyse d’exemples de contextes terminologiques, faite notamment sous l’angle des marqueurs, trois concepts distincts sont mis de l’avant (phrasème terminologique, collocation technolectale et phraséologisme). Mots-clés : phrasème terminologique, collocation technolectale, phraséologisme, technolecte, marqueurs terminologiques Abstract: Through a reflection on the status of polylexical units in terminology, this article aims at solving the remaining ambiguities as to the differentiation between the concepts of phraseme, collocation and phraseologism. Based on an analysis of various terminological contexts carried out mostly through the prism of markers, three separate concepts are put forward : terminological phraseme, technolectal collocation and phraseologism. Keywords: knowledge patterns, terminological markers, terminological phraseme, technolectal collocation, phraseologism
1 Introduction La majeure partie des travaux que nous menons en terminologie historique depuis plusieurs années, et pour lesquels nous avons constitué des corpus assez conséquents, porte sur la terminologie musicale en France et en Angleterre (Rousseau 2019 ; 2021).1 En menant la partie descriptive (terminologie synchronique histo-
Notre corpus se composait, pour l’étude synchronique historique de la terminologie musicale à la seconde moitié du XVIIe siècle en France et en Angleterre, principalement de méthodes et de traités musicaux, mais également de certaines préfaces d’œuvres musicales ; pour l’étude diachronique, nous avons utilisé un corpus composé d’encyclopédies et de dictionnaires musicaux, ainsi que de certaines méthodes musicales publiés en France et en Angleterre entre le début du XVIIIe siècle et la fin du XXe siècle. https://doi.org/10.1515/9783110749854-005
60
Delphine-Anne Rousseau
rique) de ces travaux, nous avons effectué une première extraction terminologique en prenant soin d’inclure dans notre base de données, outre des noms et des syntagmes nominaux, des adjectifs et des syntagmes adjectivaux, des adverbes et des locutions adverbiales, ainsi que des verbes. Nous appuyant sur la définition de phraséologisme proposée par Xavier Lelubre pour la terminologie – « tout syntagme non terminologisé, comprenant au moins un terme, d’étendue supérieure au terme et inférieure à la phrase, et par ailleurs de « fréquence non négligeable » dans les textes de spécialité » (1996, 167–168) –, nous avions de plus choisi de colliger des « phrasèmes ». Cependant, au fil du temps, nous avons constaté que les phrasèmes que nous avions relevés regroupaient des éléments qui allaient au-delà des simples collocations ou de tournures de phrases propres au domaine musical. De manière concomitante, nous nous sommes interrogée sur la frontière entre terme et non-terme. Étant nous-même experte du domaine étudié,2 notre perception de la réalité du domaine et du parler métier venait se confronter à certains de nos a priori théoriques de terminologue. Nous avons alors repris notre analyse du corpus en mettant l’accent sur les différents marqueurs, car nous étions convaincue que ceux-ci constituent de véritables indices pour valider les candidats-termes (et les candidats-concepts3), situer les concepts dans des microstructures de concepts, mais aussi attester du lien entre terme et concept, si fondamental en terminologie. Ces marqueurs peuvent être tout autant textuels que non textuels, ces derniers incluant, outre les marqueurs typographiques, d’autres éléments non-textuels4 dès lors qu’ils en remplissent les fonctions. Dans l’extrait reproduit dans la figure 1, Jean-Jacques Rousseau explique pourquoi il recourt aux marqueurs typographiques. Jean-Jacques Rousseau n’est pas le seul auteur de notre corpus à utiliser les marqueurs typographiques, comme on pourra d’ailleurs le constater dans les différents contextes présentés dans cet article, mais tous les auteurs ne sont pas aussi explicites. Rappelons toutefois que, à l’époque de la composition manuelle en typographie, ce recours à l’italique, à une majuscule initiale, ou encore à des
En plus d’être terminologue, nous sommes également musicienne professionnelle spécialisée en musique ancienne. Au cours de l’analyse terminologique d’un corpus textuel, il arrive que le terminologue soit confronté à un énoncé qui semble renvoyer vers un concept, à propos duquel le statut de concept demande d’être confirmé par d’autres occurrences ou indices textuels ; c’est ce que nous avons choisi de nommer candidat-concept, par analogie avec candidat-terme. Tels que la notation musicale, les symboles, la notation algébrique ou les schémas explicatifs. Nous en avons traité à plusieurs reprises dans notre thèse (Rousseau 2019) et dans d’autres travaux (2021, entre autres).
Phrasèmes terminologiques et collocations technolectales
61
Figure 1 : Recours aux marqueurs typographiques (Rousseau 1782, xix–xx).
petites capitales représentait un geste délibéré et beaucoup moins banal qu’il ne l’est aujourd’hui.5 Étudier la langue de spécialité sous l’angle des marqueurs ouvre des perspectives d’éclaircissement quant à la nature des unités polylexicales en langues de spécialité. L’adoption de ce nouvel angle d’approche sur le corpus nous a permis d’ajouter un nombre substantiel de fiches à notre base de données, mais également de constater que bon nombre des éléments colligés en tant que phrasèmes constituaient en réalité des termes à part entière. Nous avons également constaté que ce que nous avions vu émerger avec la terminologie musicale s’observait également dans d’autres domaines. Cela nous a amenée à envisager d’un nouvel œil la phraséologie en langue de spécialité. Dans cet article, nous partagerons dans un premier temps notre analyse d’un certain nombre de cas tirés de nos travaux sur la terminologie musicale ancienne, avant d’élargir notre réflexion à la terminologie en général en abordant sur le plan théorique les unités polylexicales en langue de spécialité, puis de formuler des propositions pour distinguer « phrasème terminologique » et « collocation technolectale ».
En effet, là où ces actions s’effectuent de nos jours en un simple clic ou à l’aide d’un raccourciclavier, le recours à l’italique, à des grandes ou à des petites capitales impliquait à l’époque pour le typographe de récupérer manuellement les caractères mobiles dans les cassetins du haut (ou, pour les italiques, de faire appel à une fonte différente), avant de composer le texte et de le placer sur le marbre.
62
Delphine-Anne Rousseau
2 Analyse de cas dans la terminologie musicale ancienne 2.1 Appuyer le tremblement L’un des sous-domaines de la musique ancienne particulièrement riches sur le plan terminologique est celui des agréments (ou ornements), c’est-à-dire des embellissements codifiés de la musique.6 Parmi ces agréments figurent les différents types de tremblement,7 dont le tremblement appuyé, expliqué en notation musicale dans la Figure 2.
Figure 2 : Loulié (1696, 70).
En étudiant cet extrait du seul point de vue du repérage d’unités lexicales ayant statut de terme, on repérerait probablement les noms ayant une majuscule initiale : voix, son, coulé, tremblement, trembler, appuy et notte. Cependant, une relecture attentive permet de repérer deux marqueurs de désignation, marqueurs qui font habituellement le lien entre un énoncé définitoire et un terme. Alors que le second de ces
Particulièrement nombreux et sophistiqués en France aux XVIIe et XVIIIe siècles. Terme qui a produit comme dérivé le terme trembler, comme dans trembler la note.
Phrasèmes terminologiques et collocations technolectales
63
marqueurs (s’appelle) précède le terme nominal Appuy,8 que nous avons déjà identifié en tant que terme, l’autre marqueur (cela s’appelle), variante du précédent, fait clairement le lien entre un énoncé définitoire (« quand la voix demeure sensiblement sur le petit Son du premier Coulé du Tremblement ») et appuyer le tremblement. Sans porter attention aux marqueurs, on aurait probablement assimilé cette forme à une « simple » collocation [verbe + terme]. Or, l’existence d’une relation directe entre un énoncé définitoire (qui renvoie vers un concept) et une unité lexicale (fût-elle polylexicale) oblige le terminologue à considérer cette unité lexicale comme un terme. Cette analyse est celle du terminologue, qui fonde son travail sur une connaissance plus ou moins approfondie du domaine étudié, mais surtout sur des indices textuels. Mais qu’en est-il de la perception de l’expert ? Après tout, cette perception de l’expert sur son « parler » professionnel et sur les concepts de son domaine sont à la base de l’approche socioterminologique et à la base de nombreux travaux effectués dans le cadre d’opérations d’aménagement terminologique. C’est Albert Cohen, musicologue américain spécialiste de la théorie musicale des XVIIe et XVIIIe siècles,9 que nous convoquerons ici, car il a publié en 1965 une traduction anglaise de l’ouvrage de Loulié (1696) cité ci-dessus. Fait à souligner, et tout pertinent à notre propos, Albert Cohen fait figurer dans cette édition en français dans le texte et en caractères soulignés tout ce qu’il considère être des termes musicaux propres à la musique française de l’époque, traduisant ainsi son sentiment terminologique. Ainsi la première phrase de l’extrait ci-dessus a été traduite par Cohen de la manière suivante : « when the voice dwells perceptibly on the subsidiary tone of the first coulé of the tremblement, this is known as appuyer le tremblement » (1965, 74). Il semble donc que, pour cet expert, coulé, tremblement et appuyer le tremblement constituent bel et bien des termes musicaux.
2.2 Battre la mesure Il s’agit ici d’un syntagme que nous retrouvons dans plusieurs des ouvrages de notre corpus, et qui a été utilisé de manière discontinue par les musiciens jusqu’à aujourd’hui. Or, en examinant les cotextes de ce syntagme, on retrouve des marqueurs de désignation (c’est là ce qui s’appelle et et l’on use de ce terme chez SaintLambert et, chez Jacques Ozanam, ce qui s’appelle), mais aussi un double-marqueur typographique : l’emploi par Ozanam de l’italique et de la majuscule initiale pour battre la mesure, comme on peut l’observer ci-dessous :
Et, en réalité, appuy du tremblement. Et en particulier de la musique française de cette époque.
64
Delphine-Anne Rousseau
Figure 3 : Battre la mesure.
Ces marqueurs pointent vers un renvoi à un concept unique. Mais il est d’autres éléments qui viennent confirmer le lien entre battre la mesure et un concept précis, validant ainsi le statut de terme à part entière de ce syntagme, comme on le constate dans l’extrait de l’article consacré par Jean-Jacques Rousseau à battre la mesure dans son Dictionnaire de musique reproduit à la figure 4. Trois éléments sont à souligner dans cet extrait. Tout d’abord, il convient d’observer que battre la mesure figure en entrée dans le dictionnaire (et non pas sous l’entrée Mesure, qui introduit pourtant un article assez substantiel dans ce même ouvrage). Cela nous semble constituer un argument appuyant le statut de terme/concept de battre la mesure déjà suggéré par les marqueurs retrouvés dans les ouvrages de Loulié et d’Ozanam cités ci-dessus. Deuxièmement, à la lecture du deuxième paragraphe, on constate que le concept auquel renvoie battre la mesure est associé à une procédure précise et codifiée. Peu importe la mesure, le temps qui est frappé est toujours celui qui suit immédiatement la barre de mesure, et il est toujours précédé d’un temps levé. Enfin, le dernier paragraphe cité (figure 4) nous apprend qu’il existe pour le concept de battre la mesure des spécificités nationales : « les Musiciens François ne battent pas la Mesure comme les Italiens ». On ne bat pas la mesure de la même manière en France qu’en Italie, comme le démontre l’explication par JeanJacques Rousseau des différentes battues à quatre et à trois temps, et chaque pays a sa manière bien codifiée de battre la mesure. Précisons en outre que, dans ce même Dictionnaire, on trouve une entrée pour batteur de mesure, où ce terme est défini comme « celui qui bat la Mesure dans un Concert » (Rousseau 1782, 112). Le fait qu’on
Phrasèmes terminologiques et collocations technolectales
65
Figure 4 : Extrait de l’article « Battre la mesure », (Rousseau 1782, 112–113).
ait ressenti le besoin de créer un terme pour identifier un tel rôle confirme que battre la mesure renvoie à un concept bien spécifique. Battre la mesure renverrait donc à un concept bien défini, ce qui lui confèrerait le statut de terme. Un argument supplémentaire vient faire disparaître le conditionnel de la phrase précédente : « battre la mesure » s’insère dans une microstructure de concepts. En effet, dans notre corpus, on retrouve tout un ensemble de concepts, qui s’organisent en une typologie des manières de battre la mesure, comme on peut le voir dans l’arbre conceptuel présenté en figure 5.
Figure 5 : Arbre conceptuel présentant les différentes manières de battre la mesure.
Il existe donc, pour le concept de « battre la mesure », différents concepts subordonnés (un pour chaque type de mesure).10 Dès lors qu’un candidat-concept (ici, « battre
La mesure à deux temps inégaux est en réalité une mesure à trois temps : elle compte un temps « long » et un temps « court », le temps long valant le double en durée du temps court.
66
Delphine-Anne Rousseau
la mesure ») peut se subdiviser en concepts subordonnés, ou s’intégrer dans une série de concepts coordonnés et subordonnés d’un autre concept superordonné, il serait aberrant de ne pas considérer qu’il s’agit d’un concept en bonne et due forme. Plusieurs auteurs-musiciens viennent étayer le statut de concept des différentes manières de battre la mesure. Et ils le font non seulement au moyen d’une explication textuelle, mais aussi par des schémas illustrant le mouvement de la main correspondant aux différentes battues. Ainsi, M. de Saint-Lambert, dans ses Principes du clavecin de 1702, réédités ultérieurement chez Étienne Roger à Amsterdam, fournit les explications suivantes :
Figure 6 : Description en texte et en image de trois battues de mesure (Saint-Lambert s.d., 43–46).
Michel Pignolet de Montéclair fournit lui aussi des schémas de battue de mesure dans ses Principes de musique (1736, 24), tout comme le font également d’autres auteurs. La contribution de ces schémas est substantielle, car ils viennent confirmer ce qu’énonce le texte : battre la mesure, sous ses différents spécifiques, obéit à une « chorégraphie de la main » codifiée. Il ne s’agit véritablement pas du verbe battre de la langue générale, auquel on aurait accolé le terme mesure.
2.3 Jouer à couvert, jouer à découvert Nous évoquions plus haut l’importance dans la validation du statut de terme d’un candidat-terme du fait qu’un syntagme figure en entrée dans un ouvrage dictionnairique ou encyclopédique. C’est le cas, en musique, de deux syntagmes, construits sur le modèle [verbe-terme + locution adverbiale], jouer à couvert et jouer à découvert, l’un étant naturellement l’antonyme de l’autre, et figurant tous deux dans le Dictionnaire de Tré-
Phrasèmes terminologiques et collocations technolectales
67
voux de 1752.11 Ces deux syntagmes apparaissent certes à la suite des différentes entrées pour le verbe jouer, mais pas immédiatement après l’entrée spécifique au domaine musical. La définition donnée pour ces deux termes est la suivante :
Figure 7 : Jouer à couvert, Jouer à découvert. Dictionnaire universel françois et latin (Dictionnaire de Trévoux) (1752, 1538).
Le Traité de la Musette cité comme source dans ces articles est celui publié par Charles-Emmanuel Borjon de Scellery en 1672, puis en 1678, ouvrage présent dans notre corpus, et dans lequel nous trouvons deux des phrases citées ci-dessus : « il ne faut jamais lever qu’un doigt à la fois, si ce n’est lorsque l’on tremble, & c’est ce que l’on appelle joüer à couvert » et « le jeu à découvert, est plustost celuy de la Musette des Bergers, que de l’Instrument dont nous parlons icy » (1672, 23). Il s’agit cependant de la seule occurrence que nous ayons trouvée de ces deux syntagmes. Difficile, donc, de conclure qu’il s’agit ou non d’un terme. Ces syntagmes semblent cependant renvoyer à des concepts bien précis (pour Borjon de Scellery, à tout le moins, et pour les auteurs du Dictionnaire cité ci-dessus). En outre, joüer à couvert est précédé chez Borjon de Scellery du marqueur de désignation c’est ce que l’on appelle, ce qui, dans ce cas, ferait pencher la balance du côté du statut de terme. Cependant, en l’absence d’un plus grand nombre d’occurrences, il n’est pas possible de tirer une conclusion définitive.
2.4 Porter la voix : phrasème (terme) ou collocation ? D’autres cas sont moins évidents à analyser, comme celui de porter la voix, qui, au fil du temps, a renvoyé à deux concepts (et a donc chaque fois constitué un terme), mais qui ne relève dans d’autres contextes que de la simple collocation.
Ces deux entrées ne figurent pas l’édition de 1721 de ce même Dictionnaire, ni dans celle de 1738. On les retrouve en revanche dans l’édition de 1771.
68
Delphine-Anne Rousseau
2.4.1 Concept 1 – Porter la voix = exécuter un port de voix (jusqu’à la seconde moitié du XVIIIe siècle) Parmi les agréments en musique dont il a été question plus haut dans cet article (cf. section 2.1), on relève également le port de voix. Or, de la même manière que le tremblement appuyé semble avoir produit le dérivé appuyer le tremblement, le port de voix semble avoir produit le syntagme dérivé (candidat-terme) porter la voix. Différents auteurs ont utilisé ce dérivé, dont Bertrand de Bacilly, qui a utilisé ce syntagme à quelques reprises dans L’Art de bien chanter de 1679, toujours dans le contexte d’une explication du port de voix. En faisant référence à différents airs à chanter, il explique où et comment il convient de faire des ports de voix. Outre une référence à diverses manières de porter la voix, ce qui pourrait suggérer une typologie et, par conséquent, une arborescence conceptuelle, dans les quelques passages reproduits ci-dessous, les indices suggérant que porter la voix renvoie à un concept musical précis ne sont pas d’ordre textuel, mais bien d’ordre musical. C’est donc l’expert qui, ici, peut renseigner le terminologue sur le statut à accorder au syntagme :
Figure 8 : Porter la voix chez Bacilly (1679, 147–148, 150, 157, 158 et 160).
2.4.2 Concept 2 – Porter la voix = exécuter un port de voix (depuis la seconde moitié du XVIIIe siècle L’influence grandissante de la musique italienne sur la musique française à la seconde moitié du XVIIIe siècle a entraîné, à travers un changement de mode et d’esthétique, l’importation de concepts et de termes musicaux transalpins. Parmi ceux-ci, on retrouve le portamento di voce, qui a pris en français le nom de port
Phrasèmes terminologiques et collocations technolectales
69
de voix (mais pour désigner un tout autre concept que le port de voix, démodé,12 dont il a été question ci-dessus), et le dérivé porter la voix a quant à lui remplacé l’usage précédent du terme. Le Traité complet de l’art du chant de l’École de Garcia (1847) présente ainsi ce « nouveau » port de voix :
Figure 9 : Port de voix, École de Garcia (1847, 29).
Cette supplantation conceptuelle et terminologique ne s’est pas faite sans rebuffades, comme on le constate dans la critique véhémente qu’en fait ci-dessous Jean Olivier de Meude-Monpas, où porter la voix apparaît en entrée, accompagné du marqueur définitionnel c’est :
Figure 10 : Porter la voix (Meude-Monpas 1787, 153).
Dans les deux cas présentés ci-dessus (cf. sections 2.4.1 et 2.4.2 de cet article), porter la voix renvoie à chaque fois à un concept musical bien défini et constitue par conséquent à chaque fois un terme.
Et que Meude-Monpas définit ainsi dans son Dictionnaire de musique : « mauvaise et ancienne méthode de monter diatoniquement d’une note à une autre, en tremblant la voix par un coup de gosier. C’étoit un hoquet méthodique et insipide » (1787, 153). Dans son Essai sur la musique ancienne et moderne, Jean Benjamin de La Borde explique la différence entre ces concepts français et italien (1780, 310).
70
Delphine-Anne Rousseau
2.4.3 Porter la voix = collocation Cependant, il arrive que porter la voix s’utilise dans des contextes légèrement différents. Ainsi, chez Loulié, on retrouve ce syntagme dans « prendre le Ton, c’est porter la voix au degré de Son qui est donné » (1696, 77). Chez Jean Rousseau, on peut lire :
Figure 11 : Porter la voix (Rousseau 1710, 15).
Il n’est ici nullement question du port de voix, et porter la voix ne semble pas renvoyer à un concept précis. C’est aussi le cas, au XIXe siècle, chez Choron. Dans tous ces cas, on constate que porter la voix relève véritablement de la collocation.
2.5 Prendre la fugue Plusieurs des auteurs étudiés ont exposé dans leurs ouvrages les règles de composition de la fugue. C’est au sein de ces explications qu’apparaît un autre syntagme composé sous la forme [verbe + dét. + terme], soit prendre la fugue. Ici encore, ce n’est que lors d’une deuxième analyse que ce syntagme s’est ajouté sur la liste des candidats-termes/candidats-concepts. Dans son Traité de la composition de musique publié en 1667, Guillaume Gabriel Nivers explique qu’il faut « qu’un sujet de Fugue se fasse par la suite d’un beau chant, digne d’estre imité et repeté plusieurs fois. Pour la seconde Partie qui suit et entre pour faire et prendre la Fugue (ce sont les termes) trois choses aussi sont à considerer, son commencement, son progrez, et sa suite » (1667, 50). La présence du marqueur ce sont les termes a attiré notre attention sur deux candidatstermes, soit faire la fugue et prendre la fugue. Si faire la fugue ne se retrouve nulle part ailleurs dans notre corpus, prendre la fugue (que l’on retrouve à d’autres en-
Phrasèmes terminologiques et collocations technolectales
71
droits chez Nivers) apparaît en revanche dans un certain nombre d’ouvrages13 analysés. Tout d’abord, dans le Nouveau traité des regles pour la composition de Charles Masson,14 puis dans le Traité de la Fugue et du Contrepoint publié à Berlin en 1756 par Friedrich Wilhelm Marpurg, critique, journaliste, théoricien musical et compositeur allemand, comme on peut l’observer ci-dessous :15
Figure 12 : Occurrences de prendre la fugue chez Marpurg (1756).
Bien que moins d’indices permettent de valider le statut de terme de prendre la fugue, il semble clair que, dans ce syntagme, prendre n’a pas le sens qu’on lui prête dans la langue générale. S’agit-il d’un terme, ou d’une collocation dont le tout possède un sens qui dépasse la somme de ses parties ? Seule la découverte d’autres occurrences16 pourrait permettre de trancher.
Le fait que ce terme renvoie à un concept très spécifique de la composition d’une fugue explique sa fréquence relativement basse. Ouvrage publié au moins à quatre reprises (1699, 1705, 1710 et 1738), ce qui lui confère une autorité certaine dans le domaine. À noter que, si la première de ces citations a été reprise telle quelle à l’article que François Henri Joseph Blaze consacre à la fugue dans son Dictionnaire de musique moderne publié en 1828 (Castil-Blaze 1828, 101), toutes l’ont été par Alexandre Étienne Choron dans plusieurs de ses ouvrages. Grâce à la diffusion numérique de davantage d’ouvrages anciens.
72
Delphine-Anne Rousseau
3 Retour vers la théorie : phrasème terminologique et collocation technolectale La musique est loin d’être le seul domaine où l’on rencontre des cas semblables. Marc Van Campenhoudt n’a-t-il pas relevé, dans le domaine maritime, certaines collocations récurrentes qui constituent, selon lui, « des expressions idiomatiques qui méritent un traitement notionnel, dans la mesure où elles possèdent chacune une acception propre et appellent des traductions précises » (2002, 100) ? Il donne ainsi les exemples de sonder la cale (to sound the pumps en anglais et die Pumpen peilen en allemand), allonger la nage (to row a long stroke en anglais et mit langem Schlag rudern en allemand) et mettre à la voile (to get sail en anglais et Segel setzen en allemand). Il présente également des cas, pour lesquels il propose l’appellation de notion idiomatique, et où une expression idiomatique a pour équivalent un terme simple dans l’autre langue, en soulignant le fait que « les termes simples attestent que l’on a bel et bien affaire à des notions – représentant ici des actions » (2002, 101). Or, l’un des critères enseignés pour la validation des candidats-termes complexes aux apprenants-terminologues est précisément l’existence d’un équivalent monolexical dans une autre langue. Lorsqu’il y a, de surcroit, renvoi à un concept précis, cela permet généralement de confirmer le statut de terme. Pour sa part, Christina Dechamps (2015) a relevé dans le domaine juridique un certain nombre d’exemples construits sur le modèle [verbe + nom], qu’elle nomme collocations verbales. Parmi ces exemples, on retrouve les deux syntagmes adopter une loi et voter une loi, dont elle souligne la non-synonymie, en rappelant qu’une « loi peut être votée sans pour autant être adoptée » (2015, 214). De la même manière, à propos de abroger une loi et abolir une loi, elle précise du second syntagme qu’il est « réservé aux institutions et conceptions fondamentales du système juridique » (2015, 214). C’est que chacun de ces syntagmes renvoie à un concept bien précis et, renchéririons-nous, à un concept bien précis spécifique à chaque État ou législation (où il existe une procédure strictement codifiée pour chacune de ces actions). Dans ce cas, peut-on réellement parler de collocations ? Ne serait-il pas plus juste de parler de termes ? La question se pose pour la plupart des « collocations verbales » juridiques mentionnées dans l’article de Dechamps, et au sujet desquelles elle déplore le fait qu’il n’existe pas de matériel adéquat pour leur enseignement en langue étrangère – elles « connaissent un traitement peu satisfaisant dans les différents documents de soutien pour l’enseignement des langues étrangères de spécialité » (2015, 217) –, ainsi que leur absence des dictionnaires. Toutefois, si l’on accepte l’idée qu’il s’agit bien de termes, n’est-ce pas plutôt dans des glossaires ou dans d’autres produits terminologiques que devraient figurer ces termes, accompagnés d’une définition terminologique et
Phrasèmes terminologiques et collocations technolectales
73
de toutes les données que l’on retrouve habituellement dans ce genre d’ouvrage ? Cela apporterait une solution à l’un des problèmes qu’elle soulève, à savoir qu’« aucune règle n’a encore été proposée pour expliquer la formation des collocations […] [et] l’élève doit mémoriser chaque collocation car il ne peut s’appuyer sur aucune grammaire logique » (2015, 216) : on peut penser que l’apprentissage est facilité, dès lors que l’étudiant apprend simultanément le concept et le terme. Dans ce même domaine, Laurent Gautier relève quelques exemples de ce qu’il nomme, « provisoirement et faute de mieux » (2003), collocations conceptuelles, dans les cas où des « régularités dépassent le cadre formel de la collocation d’un substantif avec un verbe » (2003). Cet auteur donne l’exemple de ein Gesetz beschließen ‘adopter une loi’, à propos duquel il explique que, si le verbe beschließen ‘adopter’ « peut s’utiliser dans un grand nombre de situations, son apparition combinée à celle de Gesetz ‘loi’ provoque une spécialisation de son sémantisme, l’acception alors retenue de beschließen pouvant être qualifiée de spécialisée pour former le syntagme adopter une loi qui renvoie à un acte spécialisé du domaine » (2010, 285–286). Ici aussi, donc, la « collocation » renvoie à un concept précis et codifié du domaine étudié, ce qui devrait, nous semble-t-il, inciter à la qualifier de terme plutôt que de collocation. Nous pourrions également mentionner certains cas issus du domaine de la cuisine et de la gastronomie, comme certains exemples tirés du Pâtissier royal parisien de Marie Antoine Carême (1815), où des formes [verbe + nom] sont accompagnées en cotexte de marqueurs typographiques (le terme figure en italique) et textuels, et pour lesquelles le renvoi à un concept spécifique est évident. On y retrouve ainsi entre autres fraiser un tour, faire la fontaine, donner un tour, passer aux fines herbes, ou encore corrompre la pâte (Carême 1815, 3, 14, 30, 61). Mais comment donc nommer ces syntagmes-termes ? Comment distinguer les syntagmes-termes des collocations propres à une langue de spécialité ? Dans la langue générale, comme le rappellent Raquel Silva, Rute Costa et Fátima Ferreira, « une collocation est, d’un point de vue strictement linguistique, une association entre morphèmes lexicaux présentant, entre eux, un phénomène d’attraction motivé par un ensemble d’affinités combinatoires » (2004, 347). Ces auteures rappellent également que, au sein d’une collocation, « chaque élément […] garde son sens individuel, même si le sens d’un élément est limité par celui de l’autre » (2004, 350–351). En ce sens, il existe bien évidemment des collocations en langue de spécialité, qui régissent dans le style du discours spécialisé les associations de mots, ou qui viennent, par une règle (ou convention) syntagmatique, restreindre l’éventail paradigmatique (adjectifs de couleur, verbes d’action, adverbes de manière, etc.) des mots jouxtant un terme ; l’acquisition de ces collocations compte pour beaucoup dans l’appropriation de la langue de spécialité ou du technolecte. Pour reproduire ou pour comprendre une langue de spécialité, il est en effet fon-
74
Delphine-Anne Rousseau
damental de connaître et de maîtriser non seulement la terminologie du domaine, mais aussi le style discursif propre au domaine (la phraséologie), dont font partie les collocations technolectales. Pour distinguer les « groupements de nature générale » que constituent selon elle les collocations des « groupements spécialisés », Marie-Claude L’Homme (1998a) a proposé de nommer combinaisons lexicales spécialisées (CLS) ces derniers groupements, en précisant que le consensus qui les régit s’établit alors entre spécialistes d’un domaine plutôt qu’entre locuteurs d’une même langue. Telles que définies par cette auteure, les CLS sont constituées de deux lexèmes dont la base est une unité terminologique qui est un nom, et dont l’autre lexème est soit un verbe, soit un adjectif, soit un nom. Cela exclurait donc les combinaisons formées sur la base d’un terme-verbe. Marie-Claude L’Homme argue en effet que « comme les unités terminologiques auxquelles la terminologie s’est intéressée appartiennent majoritairement à la catégorie grammaticale du nom, celle-ci-devient la base privilégiée » et que, « par conséquent, le mot clé d’une CLS, est généralement un nom » (1998a, 515). Selon nous, cette prise de position revient en quelque sorte à ne pas remettre en question la pratique terminologique qui a ignoré pendant trop longtemps les termes non nominaux, une pratique qui nous semble regrettable. En effet, comme l’ont souligné plusieurs terminologues, dont Chienwen Tsai (2017) et nous-même (Rousseau 2019, 229–236), la quasi-hégémonie nominale des termes répertoriés dans les ouvrages terminologiques semble refléter davantage le peu d’attention portée aux termes non-nominaux par les praticiens de la terminographie que le portrait réel des terminologies, qui comptent également, comme l’ont pourtant souligné de nombreux auteurs (dont Rey 1979 ; Depecker 2002 ; Betsch et al. 2017 ; Pimentel 2015 ; Coutier 1994 ; L’Homme 1998b) des verbes, des adjectifs et des adverbes. Il nous apparaît donc au contraire qu’il conviendrait bien davantage d’élargir, dans les faits, les pratiques d’extraction terminologique à toutes les catégories lexicales,17 plutôt que de contraindre un concept théorique à s’adapter aux ou à ne tenir compte que des seuls travaux terminologiques existants. Au terme de combinaison lexicale spécialisée, Silva et al. citées ci-dessus préfèrent celui de collocation terminologique (2004, 352), cette dernière étant constituée selon elles de deux lexèmes : un terme mono ou multilexémique et un nonterme, ou encore deux termes, dont chacun peut être mono ou multilexémique.18 À leurs yeux, la collocation terminologique ne constitue pas un terme, car selon
Ce que permettent différents outils terminotiques, dont l’extracteur terminologique TermoStat créé par Patrick Drouin. En précisant que, dans ce dernier cas, « le spécialiste identifie le concept auquel renvoie l’un des lexèmes qui a le statut d’unité terminologique et qui dans un certain contexte syntagmatique attire un autre lexème qui peut être lui aussi terminologique » (Silva et al. 2004, 352).
Phrasèmes terminologiques et collocations technolectales
75
elles « aucune des collocations terminologiques ne renvoie à un seul concept » (2004, 352). Elles expliquent cependant que, « dans les cas où la relation de dépendance entre les éléments de la construction, qui au départ était une simple collocation terminologique, se solidifie, il s’opère alors un changement motivé par l’acquisition d’un degré bien plus fort de cohésion lexicale entre éléments, faisant perdre à la collocation terminologique son statut pour prendre celui d’unité terminologique » (2004, 352). Tout cela ramène à un problème fondamental (soulevé par Silva et al. 2004, 347), qui consiste à distinguer ce qui relève du terme complexe et ce qui relève de la collocation. Ces auteures, pour qui cette distinction est d’ordre conceptuel, rappellent par ailleurs que, « en contexte de langue de spécialité, l’unité terminologique est facilement identifiable à travers le concept qu’elle véhicule », tandis que les collocations « réunissent syntagmatiquement un ensemble de constituants, dont l’un ou un groupe [sic] exerce un pouvoir d’attraction morphosyntaxique et/ou sémantique sur l’ensemble des autres constituants qui composent la collocation » (2004, 353). Les exemples que nous avons présentés précédemment permettent d’illustrer différents cas de figure : d’un côté, des unités complexes renvoyant à un concept (ce qui relève de la terminologie) et, de l’autre, des syntagmes tenant de la collocation (ce qui relève du style discursif propre à un technolecte – et donc de la phraséologie). Comme on l’a vu, c’est le cotexte qui, dans la plupart des cas, permet de trancher entre les deux, le principal enjeu résidant dans la détermination de l’existence ou de la non-existence d’un renvoi à un concept unique. Le fait que la collocation en langue de spécialité tient pour nous davantage du technolecte que de la terminologie nous amène à proposer le terme de collocation technolectale (plutôt que terminologique). En tant que concept subordonné, ce concept de collocation technolectale hérite de tous les caractères propres à la collocation, sa spécificité tenant à ce qu’elle est composée d’au moins un terme. Sa récurrence dans le discours (au sein d’un technolecte) constitue bien évidemment une caractéristique importante, mais il nous semble important de rappeler que, en terminologie, la notion de fréquence est toute relative : en effet, plus un concept est spécifique au sein d’une arborescence conceptuelle, ou plus il est récent, et plus la fréquence attendue doit être basse.
3.1 Phrasème terminologique Par contre, pour ce qui est des unités complexes renvoyant à un concept unique, et qui ont statut de terme, nous proposons le terme de phrasème terminologique (phrasème à statut terminologique) et que nous définissons comme étant un terme complexe renvoyant à un concept précis au sein du domaine, formé d’au
76
Delphine-Anne Rousseau
moins un terme (mono ou plurilexical), dont l’une des parties est généralement un verbe d’action. En effet, sur la base de nos études sur corpus et de plusieurs observations dans différents domaines, ce phrasème prend la forme d’un verbe d’action (terme ou non-terme) suivi d’un terme nominal, ou encore d’un verbe d’action (terme ou non-terme) suivi d’une locution adverbiale (terme). Ces phrasèmes terminologiques, tels que nous les définissons ici, seraient-ils le fruit de la solidification de la « relation de dépendance entre les éléments » [de la collocation terminologique] évoquée par Silva et al. (2004, 352) ? Pour pouvoir l’affirmer, il serait nécessaire de procéder à des études diachroniques très circonscrites afin de retracer l’histoire de chacun des phrasèmes terminologiques. Reste, au moment d’analyser un corpus, à distinguer les phrasèmes terminologiques des collocations technolectales. À cette fin, nous proposons certains critères permettant de valider ou non le statut de phrasème terminologique. La liste proposée ici n’est pas nécessairement exhaustive et il n’est pas nécessaire que tous les critères soient satisfaits pour qu’il y ait validation. Comme nous l’avons vu dans les quelques exemples présentés dans cet article, les marqueurs jouent notamment un rôle fondamental dans le repérage des candidats-termes, qu’il s’agisse de candidats-termes simples mais plus encore de candidatstermes complexes (comme c’est le cas des candidats-phrasèmes terminologiques). Ces marqueurs sont le plus souvent d’ordre textuel (de désignation, définitionnels, de relation conceptuelle, de synonymie, d’antonymie, diachroniques, etc.), mais ils peuvent être également d’ordre typographique (italique, gras, guillemets, majuscule initiale, petites capitales, etc.), comme on l’a vu chez différents auteurs. Le fait de pouvoir situer un candidat-concept au sein d’une microstructure de concepts (en particulier une microstructure de type générique/spécifique) constitue, selon nous, un deuxième critère permettant de discriminer phrasème terminologique et collocation technolectale. En effet, si l’on peut rattacher à un candidatconcept (nommons-le ccx), une série plus ou moins longue de candidats-concepts (ou de concepts) subordonnés, ou encore le rattacher à un concept superordonné, il est plus que probable que ccx constitue véritablement un concept au sein du domaine étudié. Ce sont souvent les marqueurs de relation conceptuelle mentionnés ci-dessus qui traduisent ou qui révèlent au terminologue l’existence du rattachement d’un candidat-terme à une microstructure de concepts, comme c’était le cas de plusieurs des exemples présentés plus haut dans cet article. Il s’agit là du cas de figure le plus simple. Dans d’autres cas, toutefois, c’est uniquement par l’analyse post-dépouillement de plusieurs contextes que le terminologue sera en mesure d’esquisser une structure de concepts, au sein de laquelle figurera le candidat-concept ccx. Comme nous l’avons vu dans différents exemples cités dans cet article, et comme nous l’avons montré par ailleurs (Rousseau 2019 ; 2021), les informations non-textuelles, comme des illustrations ou des schémas techniques, peuvent venir
Phrasèmes terminologiques et collocations technolectales
77
valider le statut de terme d’un candidat-terme. Cela vaut donc aussi pour les candidats-phrasèmes terminologiques. D’une certaine manière, on pourrait dire que les informations non textuelles viennent confirmer le sentiment terminologique, ou encore qu’elles appuient certaines hypothèses suggérées par l’analyse du contexte. En outre, le fait qu’un candidat-phrasème figure en entrée dans un ouvrage dictionnairique ou encyclopédique, comme on l’a vu plus haut avec battre la mesure, et non pas en sous-entrée d’un autre terme « parent », peut venir ajouter à la conviction ou à la certitude d’un lien candidat-phrasème ⇆ concept, validant par le fait même le statut de phrasème terminologique. Enfin, et c’est là qu’entre en jeu une collaboration élargie avec les experts du domaine étudié, il convient d’interroger (de manière directe ou indirecte) le sentiment terminologique des experts.
3.2 Quid des phraséologismes ? Reste à catégoriser certains éléments propres à chaque technolecte, et sur lesquels Catherine Resche attire notre attention, en expliquant qu’elle a relevé, dans le domaine boursier, des « tournures propres au domaine […] qui étaient en fait des dictons ou préceptes et constituaient des phrases entières » (1997). Dans d’autres domaines, il existe également des locutions ou des tournures de phrases qu’on ne retrouve ni dans la langue générale, ni dans aucun autre type de discours, et qui confèrent leur caractère idiomatique aux textes produits par les spécialistes (on pense ici notamment à la langue notariale19). Ces éléments de discours propres à chacun des domaines de spécialité, et que nous nommons phraséologismes, font partie selon nous du bagage nécessaire à la pleine appropriation d’un technolecte, au-delà de la seule maîtrise de la terminologie et de l’insertion des termes en discours.20 Nous considérons en effet que les phraséologismes doivent être assimilés (connus et maîtrisés) par les experts (et futurs experts) des différents domaines,
Dans laquelle on a parfois recours à des doublets, comme idoine et adéquat, apte et idoine, déclarer et confirmer, mais également à d’autres tournures de phrases comme par devant nous notaire, agissant en qualité de, fait et passé à, ou encore entre les mains de nous, notaire. Des ouvrages comme celui de De Wulf et al. (2013) sont, à ce sujet, fort instructifs. Ce « caractère idiomatique » auquel nous faisons référence ici correspond, par exemple, à ce que tâchait de transmettre Raymond Lindon, grande figure française du domaine juridique au XXe siècle, dans Le style et l’éloquence judiciaires publié en 1968. Les technolectes comprennent d’autres composantes encore, dont des particularités syntaxiques ou grammaticales, notamment celles mentionnées, pour le domaine médical, par François Maniez (2011).
78
Delphine-Anne Rousseau
mais également bien sûr par les terminologues et par les écrivants21 qui se spécialisent dans un ou quelques domaines en particulier, comme le soulignaient déjà en leur temps Jean Darbelnet (1979) et Maurice Rouleau (1995). Il s’ensuit que ces éléments devraient être relevés et colligés au cours du dépouillement terminologique. Il serait par ailleurs intéressant de procéder à une comparaison interlinguistique de ces phraséologismes, ainsi que de s’intéresser à leur histoire.
4 Conclusion C’est par la connaissance approfondie du domaine et par l’étude poussée d’un corpus étendu, mais aussi par l’expérience de terrain, que nous pouvons atteindre, audelà de la compréhension théorique, une compréhension concrète des concepts de phrasème terminologique et de collocation technolectale ; c’est ce qui nous a permis d’en proposer les définitions données plus haut dans cet article.22 Cette distinction entre les deux concepts étant établie, nous souhaitons formuler une réflexion plus générale sur la terminologie et sur le travail terminologique. Tout d’abord, et comme nous l’avons déjà suggéré à quelques reprises par ailleurs (Rousseau 2019 ; 2021), il est impératif d’élargir la collaboration entre le terminologue et l’expert. De plus, il devient plus que nécessaire d’intégrer à toute exploitation terminologique d’un corpus le repérage systématique des différents marqueurs, mais aussi de consacrer un peu du temps gagné avec les différents outils terminotiques à l’analyse plus approfondie du cotexte des candidats-termes. Par ailleurs, il se dégage de l’étude des cas particuliers présentés dans les pages précédentes qu’il est impératif d’élargir la collecte terminologique à toutes les catégories lexicales porteuses de concepts,23 ce qui, en plus d’assurer que tous les phrasèmes soient consignés dans les bases de données, permettra de brosser le véritable portrait des terminologies, ouvrant la porte à une étude de la variété dans la distribution des termes par catégorie lexicale au sein des différents domaines et à la comparaison de cette distribution entre différentes langues au sein d’un même domaine.
Au nombre desquels figurent en premier lieu les traducteurs ou les rédacteurs techniques. Phrasème terminologique : terme complexe renvoyant à un concept précis au sein du domaine, formé d’au moins un terme (mono ou plurilexical), dont l’une des parties est généralement un verbe d’action ; collocation technolectale : collocation propre à un technolecte et composée d’au moins un terme. Comme nous l’avons déjà écrit ailleurs (Rousseau 2019, 229–236).
Phrasèmes terminologiques et collocations technolectales
79
Enfin, il est fondamental pour les terminologues de réagir au matériau étudié (les corpus) et de s’autoriser à éventuellement revoir ou revisiter certaines conceptions ou préconceptions théoriques. En effet, on procède en général, et avec raison, à l’établissement d’un cadre théorique et d’une méthodologie avant de constituer un corpus et de l’exploiter, puis de procéder à l’analyse des résultats obtenus. Cette étape théorique et méthodologique préalable est essentielle : on ne peut en effet pas naviguer à vue dans la recherche scientifique. Cependant, nous concluons de l’expérience acquise au cours de nombreuses années de recherche qu’il est nécessaire, une fois que l’on est confronté à la réalité du matériau (les textes), de s’imposer une certaine souplesse d’esprit et d’accepter la possibilité de devoir revoir, par exemple, certaines conceptions théoriques. Au cours de nos travaux, nous avons ainsi été appelée notamment à ajuster non seulement les limites du domaine étudié, mais aussi notre définition de ce qui constitue ou non un terme.
Bibliographie Bacilly, Bertrand de, L’Art de bien chanter […], Paris, Chez l’Auteur, 1679. Betsch, Michael, Franz Rainer/Joanna Wolborska-Lauter, The structure of economic andbusiness terms, in : Mautner, Gerlinde (ed.), Handbook of business communication. Linguistic approaches, Boston/ Berlin, De Gruyter Mouton, 2017, 407–432. Borjon de Scellery, Pierre, Traité de la musette […], Lyon, Jean Grin et Barthélémy Rivière, 1672. Borjon de Scellery, Pierre, Traité de la musette […], Paris, Louis Vendosme, 1678. Carême, Marie Antoine, Le pâtissier royal parisien […], vol. 1, Paris, Dentu, 1815. Castil-Blaze [Blaze, François-Henri-Joseph], Dictionnaire de musique moderne, Bruxelles, Mees, 1828. Cohen, Albert, voir Loulié. Coutier, Martine, Tropes et termes. Le vocabulaire de la dégustation du vin, Meta. Journal des traducteurs/Meta. Translators’ journal 39:4 (1994), 662–675. Darbelnet, Jean, Réflexions sur le discours juridique, Meta. Journal des traducteurs/Meta. Translators’ journal 24:1 (1979), 26‑34. Dechamps, Christina, L’enseignement du français juridique en centre de langues. Quelques perspectives, Recherche et pratiques pédagogiques en langues de spécialité, Cahiers de l’Apliut XXXIV:1 (2015), 213–224. Depecker, Loïc, Entre signe et concept. Éléments de terminologie générale, Paris, Presses Sorbonne nouvelle, 2002. De Wulf, Christiaan (avec la collaboration de Jan Bael et Stan Devos, traduction de Yohanne Laurent, sous la direction de Siegfried Theissen), La rédaction d’actes notariés. Droit des personnes et droit patrimonial de la famille, Waterloo, Wolters Kluwer, 2013. Dictionnaire universel françois et latin : contenant la signification et la définition tant des mots de l’une et de l’autre langue, avec leurs différens usages que des termes propres de chaque état et de chaque profession …, Tome 4, Paris, Compagnie des libraires associés, 1752. Dictionnaire universel françois et latin. Vulgairement appelé dictionnaire de Trévoux […], vol. 5, Paris, Compagnie des Libraires Associés, 1771.
80
Delphine-Anne Rousseau
Garcia, Manuel, Traité complet de l’art du chant, Paris, E. Troupenas et C.ie, 1847. Gautier, Laurent, Terminologie et phraséologie comparées du droit constitutionnel en français et en allemand, in : L’espace euro-méditerranéen. Une idiomacité partagée, Hammamet, Tunisie, 2003, 113–126, https://hal.archives-ouvertes.fr/hal-00201275/file/LGautier-Terminologie_et_Phraseolo gie.pdf [dernière consultation : 07.11.2021]. Gautier, Laurent, Du terme au phrasème en droit constitutionnel. Un double aller-retour ?, in : Gréciano, Gertrud (ed.), Micro- et macrolexèmes et leur figement discursif, Louvain/Paris, Peeters, 2010, 285–296. La Borde, Jean Benjamin de, Essai sur la musique ancienne et moderne, vol. 3, Paris, Pierres, 1780. Lelubre, Xavier, Conception d’un dictionnaire terminologique et phraséologique trilingue anglais-françaisarabe dans le domaine de l’optique, in : Clas, André/Thoiron, Philippe/Béjoint, Henri (edd.), Lexicomatique et dictionnairique, Paris/Montréal, Agence universitaire de la francophonie, 1996, 163–172. L’Homme, Marie-Claude, Caractérisation des combinaisons lexicales spécialisées par rapport aux collocations de langue générale, in : Fontenelle, Thierry/Hiligsmann, Philippe/Michiels, Archibald/ Moulin, André/Theissen, Siegfried (edd.), Euralex 98 Proceedings. 8th international congress of the European association for lexicography, vol. 2, Liège, Université de Liège, 1998, 513–522 (=1998a). L’Homme, Marie-Claude, Le statut du verbe en langue de spécialité et sa description lexicographique, Cahiers de lexicologie 73:2 (1998), 61–84 (=1998b). Lindon, Raymond, Le style et l’éloquence judiciaires, Paris, Albin Michel, 1968. Loulié, Étienne, Elements ou principes de musique, mis dans un nouvel ordre […], Paris, Christophe Ballard, 1696. Loulié, Étienne, Elements or principles of music, ed. et trad. Cohen, Albert, Brooklyn, Institute of Mediaeval Music, 1965. Maniez, François, Structures syntaxiques et schémas phraséologiques de l’anglais médical contemporain. Tentative de description d’un style spécialisé, Études de stylistique anglaise 2 (2011), 77‑96. Marpurg, Friedrich Wilhelm, Traité de la fugue et du contrepoint. Divisé en deux parties, vol. 1, Berlin, Haude et Spener, 1756. Masson, Charles, Nouveau traité des regles pour la composition de la musique, Paris, Christophe Ballard, 1699. Meude-Monpas, Jean Olivier de, Dictionnaire de musique, Paris, Knapen et Fils, 1787. Montéclair, Michel Pignolet de, Principes de musique […], Paris, Chez L’Auteur, 1736. Nivers, Guillaume Gabriel, Traité de la composition de musique, Paris, Ballard, 1667. Ozanam, Jacques, Dictionnaire mathématique ou idée générale des mathématiques. Dans lequel l’on trouve, outre les termes de cette science, plusieurs termes des arts et des autres sciences, Paris, Estienne Michallet, 1691. Pimentel, Janine, Using frame semantics to build lexical resource on legal terminology, in : Kockaert, Hendrick J./Steurs, Frieda (edd.), Handbook of terminology, Amsterdam/Philadephia, John Benjamins, 2015, 425–450. Resche, Catherine, Prolégomènes à la phraséologie comparée en langue de spécialité. Exemple de l’anglais et du français de la finance, ASp. la revue du GERAS 15:18 (1997), 487–503. Rey, Alain, La terminologie. Noms et notions, Paris, PUF, 1979. Rouleau, Maurice, La langue médicale. Une langue de spécialité à emprunter le temps d’une traduction, TTR. Traduction, terminologie, rédaction 8:2 (1995), 29–49. Rousseau, Delphine-Anne, Un cas de résurgence terminologique. La terminologie musicale en usage en France et en Angleterre à la seconde moitié du XVIIe siècle, Thèse doctorale, Université Lumière Lyon 2, 2019, http://www.theses.fr/2019LYSE2067 [dernière consultation : 07.11.2021].
Phrasèmes terminologiques et collocations technolectales
81
Rousseau, Delphine-Anne, Terminologie historique et musique ancienne. « Guidon » et « petite reprise », deux cas de résurgence terminologique, Cahiers de lexicologie 118 (2021), 137–174. Rousseau, Jean, Méthode claire, certaine et facile pour apprendre à chanter la musique […], Amsterdam, Pierre Mortier, 21710 [1683]. Rousseau, Jean-Jacques, Dictionnaire de musique. Collection complète des œuvres de J. J. Rousseau […], vol. 17e […], Genève, Société typographique, 1782. Saint-Lambert, Monsieur de, Les principes du clavecin […], Paris, Christophe Ballard, 1702. Saint-Lambert, Monsieur de, Les principes du clavecin […], Amsterdam, Estienne Roger, s.d. Silva, Raquel/Costa, Rute/Ferreira, Fátima, Entre langue générale et langue de spécialité, une question de collocations, Études de linguistique appliquée 135:3 (2004), 347–359. Tsai, Cheinwen, Analyse lexicale des verbes culinaires dans les dictionnaires spécialisés, Revue française de linguistique appliquée 22:1 (2017), 117–129. Van Campenhoudt, Marc, Idiomaticité et gestion de données terminologiques. Une approche notionnelle, Meta. Journal des traducteurs/Meta. Translators’ journal 139:1 (2002), 97–106.
Alain Polguère
Les modificateurs redondants et leur rôle en terminologie De l’amour physique aux masques de protection Résumé : Cette étude aborde un type particulier d’expressions phraséologiques : les collocations à modificateur redondant du type amour physique, communication téléphonique, etc., où le gouverneur syntaxique est une acception spécifique du vocable correspondant dont le sens inclut en totalité le sens du modificateur. Après avoir exposé le problème à l’étude (section 1), nous nous penchons sur le statut général de la redondance en langue : stigmatisation des pléonasmes (2.1), faux pléonasmes (2.2), redondances phraséologisées (2.3 et 2.4). Finalement (section 3), nous examinons la place toute particulière occupée par les collocations redondantes dans les terminologies et offrons une solution pour leur modélisation lexicographique au sein de modèles généraux du lexique appelés Systèmes Lexicaux. Mots-clés : collocation, fonction lexicale, terminologie, redondance terminologique, Lexicologie Explicative et Combinatoire (LEC), Systèmes Lexicaux, Réseau Lexical du Français (RL-fr) Abstract: This study focuses on a particular type of phraseological expressions : collocations with redundant modifiers such as romantic love, phone call, etc., where the syntactic governor is a specific sense of the corresponding vocable whose meaning includes the entire meaning of the modifier. After presenting the problem at hand (section 1), we turn to the general status of redundancy in natural language : stigmatization of pleonasms (2.1), false pleonasms (2.2), phraseologized redundancies (2.3 and 2.4). Finally (section 3), we examine the special place occupied by redundant collocations in terminologies and offer a solution for their lexicographic modeling within general lexical models called Lexical Systems. Keywords: collocation, lexical function, terminology, terminological redundancy, Explanatory Combinatorial Lexicology (ECL), Lexical Systems, French Lexical Network (fr-LN)
Note : Nous remercions chaleureusement Sabrina Abreu ainsi que deux relecteurs anonymes pour leurs commentaires sur une version préliminaire de cet article. https://doi.org/10.1515/9783110749854-006
84
Alain Polguère
1 Mettons la table Le lexique du français – et, vraisemblablement, de toute langue – contient un nombre significatif de syntagmes nominaux phraséologiques de la forme Nom→Modificateur où le Modificateur est sémantiquement redondant vis-à-vis du Nom. Ce Modificateur a pour fonction sémiotique première de marquer l’acception du vocable nominal impliquée dans le syntagme en question ; par exemple : amour physique, communication téléphonique, compétition sportive, masque de protection, prise électrique... Notons que, plus marginalement, on trouve les modificateurs redondants utilisés avec d’autres parties du discours ; par exemple, les Verbes – aimer d’amour, désirer physiquement – ou les Adjectifs – physiquement fort. De plus, ce type de redondance peut aussi se manifester sur le plan morphologique – par exemple, en anglais, eyelash litt. ‘œil.cil’ (Koch 2008, section 3.3 Redundant compounds). Deux conditions doivent être satisfaites pour considérer qu’une construction Nom→Modificateur est un syntagme à modificateur redondant. D’une part, il faut diagnostiquer que ce syntagme n’est pas une locution – cf., entre autres, Abreu (2018), ainsi que la distinction formelle établie entre dé à coudre et dé à jouer dans Polguère (2011). D’autre part, il faut démontrer que la tête de ce syntagme est bien une acception spécifique du vocable correspondant qui inclut dans sa définition lexicale le sens exprimé par le modificateur. Ainsi, on peut démontrer qu’il existe une acception du vocable COMMUNICATION qui contient dans sa définition le sens ‘[qui se fait au] téléphone’ et qui possède ses collocatifs propres, marqueurs de son identité lexicale, tel qu’illustré en (1a–c). (1)
a. Paolo coupe la communication. b. Attends, je prends la communication. c. Son secrétaire lui passe la communication.
Ces observations démontrent que communication téléphonique est bel et bien un syntagme à modificateur redondant. Les syntagmes à modificateur redondant sont phraséologiques : ce sont des cas particuliers de phrasèmes (= expressions non libres).1 Plus précisément, il s’agit de collocations, au sens de Hausmann (1979), qui ont pour base le gouverneur syntaxique (nominal, verbal...) et pour collocatif le modificateur redondant. Leur caractère régulier dans les langues a été récemment pris en compte dans le cadre de la Lexicologie Explicative et Combinatoire par l’introduction d’une fonc-
Sur la notion de phrasème, voir par exemple Mel’čuk (2013).
Les modificateurs redondants et leur rôle en terminologie
85
tion lexicale spécifique – appelée Redun (du lat. redundantia) – dans le système des fonctions lexicales standards (Mel’čuk/Polguère 2021). Le phénomène de la phraséologisation de modificateurs redondants occupe une place non triviale dans les terminologies, où de nombreux termes scientifiques ou techniques dits complexes sont formellement des syntagmes nominaux à modificateur redondant : bilan comptable, escompte de règlement, fonction mathématique, genre grammatical, régime syntaxique, masque de protection, etc. Dans bien des cas, la nature de syntagme redondant n’est révélée que lorsque l’on confronte la nomenclature scientifique « théorique » à la réalité linguistique telle qu’elle se manifeste dans les textes écrits et oraux. Ainsi, s’il est vrai qu’il existe plusieurs types d’infarctus et que le syntagme infarctus du myocarde dénote une pathologie spécifique parmi ceux-ci, dans la pratique, une acception individualisée de infarctus = lang. gén. crise cardiaque a émergé, qui désigne spécifiquement l’infarctus dit du myocarde. La terminologie linguistique et les conventions d’écriture dont nous faisons usage dans la suite de cette étude sont introduites « au fil de l’eau » dans notre exposé.
2 Perspective lexicologique sur la modification redondante Cette section de théorisation de la notion de modification redondante se divise en quatre parties : stigmatisation de la redondance en tant que faute de style (2.1), faux pléonasmes (2.2), redondances phraséologisées ou « bons » pléonasmes (2.3) et conclusions préliminaires sur les modificateurs redondants (2.4).
2.1 La redondance en tant que pléonasme-erreur Les dictionnaires du français associent habituellement le terme pléonasme à deux faits de langue distincts : (i) une erreur/maladresse – généralement mentionnée en premier dans la description du terme – ou (ii) une figure de style. Ainsi, on trouve dans le Larousse en ligne la description suivante sous l’entrée pléonasme :2
https://www.larousse.fr/dictionnaires/francais/pléonasme/61617 [dernière consultation : 02.07.2021).
86
(2)
Alain Polguère
« Répétition dans un même énoncé de mots ayant le même sens, soit par maladresse (par exemple descendre en bas), soit dans une intention stylistique (par exemple Je l’ai vu, dis-je, vu, de mes propres yeux, vu [Molière]) ».
Dans son emploi courant, notamment en contexte scolaire, le terme pléonasme porte néanmoins presque exclusivement une charge négative et n’est que très marginalement considéré sous l’angle de la figure de style. Une des tâches qui est assignée aux enseignants, par exemple, est la chasse aux répétitions/pléonasmes dans les écrits de leurs élèves. Il est aisé de trouver dans les documents pédagogiques des instructions relatives à l’éradication des pléonasmes, ainsi que des listes de pléonasmes courants considérés comme fautifs. Pour ne citer qu’un exemple, on trouve sur le site Web de la University of Sheffield un document3 produit par le Student Information Services Desk de cette institution qui contient 119 syntagmes proscrits, caractérisés par la présence de ce que le document qualifie de redundant modifier, par exemple : advance reservation, integrate together, etc. La notion de pléonasme-erreur, telle que couramment employée en contexte scolaire (ou autre), est doublement problématique. Face aux pléonasmes que l’on pourrait à bon droit considérer comme fautifs (tels que les syntagmes advance reservation et integrate together donnés plus haut), on trouve deux types de syntagmes parfaitement acceptables que nous désignons par les termes de (i) faux pléonasmes et (ii) redondances phraséologisées (ou « bons » pléonasmes).
2.2 Faux pléonasmes Attardons-nous sur le « pléonasme » que la citation du Larousse – (2), section 2.1 – donne en exemple : descendre en bas, que nous discuterons avec son pendant monter en haut. Ces syntagmes sont considérés comme des exemples types des maladresses stylistiques. Ils sont presque systématiquement utilisés pour illustrer les pléonasmes et leur caractère fautif n’est jamais remis en question (à notre connaissance). Pourtant, on pourrait légitimement se demander pourquoi ces deux syntagmes sont constamment employés par les locuteurs du français et pourquoi ils semblent si naturels. Notre position est la suivante : si ces deux syntagmes sont constamment employés, c’est qu’ils répondent à un besoin réel de communication. En conséquence, s’il y a erreur, elle n’est pas commise par ceux
https://www.sheffield.ac.uk/polopoly_fs/1.481754!/file/List-of-Redundant-Modifiers.pdf [dernière consultation : 24.07.2021].
Les modificateurs redondants et leur rôle en terminologie
87
qui disent monter en haut et descendre en bas, mais par les censeurs qui y voient une faute de style : Monter en haut et descendre en bas, tels qu’employés de façon récurrente par les locuteurs du français, ne sont aucunement erronés. Ce sont de faux pléonasmes.
Cela vaut aussi pour de très nombreuses expressions stigmatisées de la même façon. Commençons par faire la démonstration de la nature de faux pléonasmes des deux syntagmes monter en haut et descendre en bas, en nous concentrant pour cela sur le cas du premier, auquel nous allons référer dorénavant, pour alléger l’exposé, au moyen du sigle MEH. Nous donnons en (3) une illustration d’un emploi type de MEH, avant de mener une analyse de son contenu sémantique : (3)
Là, j’ai mes trois plantes à la main, je vais monter en haut voir comment je peux réorganiser certains pots... [https://accrosjardin.forumactif.com/t7888p75-commande-de-succulenteschez-thang-n (dernière consultation : 10.09.2020)]
MEH est formellement constitué de deux composants : monter et en haut, que nous allons examiner successivement. Le vocable MONTER étant polysémique, il est important d’identifier quelle acception de ce vocable est mise en jeu dans MEH. Il s’agit du lexème4 MONTER I.A.2, pour lequel nous proposons la définition lexicographique ci-dessous, suivant les principes définitionnels présentés dans Mel’čuk/Polguère (2018) :
Figure 1 : Définition lexicographique de MONTER I.A.2.
Un vocable – dont le nom s’écrit en petites majuscules, par exemple PERROQUET –, est un regroupement d’unités lexicales (ou lexies) de mêmes signifiants et présentant une intersection de sens significative ; on est sinon en présence d’homonymie entre deux vocables et non de polysémie d’un vocable. Les unités lexicales sont soit des lexèmes – par exemple, PERROQUET I.A ‘oiseau...’ et PERROQUET I.B ‘personne bavarde et qui répète ce qu’on dit’ –, soit des locutions – par exemple, PERROQUET DE MER ‘macareux’. Comme on le voit, les unités lexicales qui sont des acceptions d’un vocable polysémique sont identifiées par une numérotation lexicographique. Nous utilisons dans cette étude la numérotation du Trésor de la Langue Française informatisé (TLFi 2002) pour identifier les acceptions des vocables à chaque fois que cela est possible.
88
Alain Polguère
Cette définition (qui n’est certainement pas parfaite) met en évidence le fait que MONTER I.A.2 dénote un déplacement intentionnel d’un X vers un lieu Y plus élevé que le lieu où X se trouve. C’est bien évidemment le sens ‘plus haut’ – inclus dans la définition du verbe – qui est la source du diagnostic erroné de pléonasme pour MEH. Le second composant de MEH est la locution prépositionnelle à valeur adverbiale ou adjectivale ⌜EN HAUT⌝ 2, pour laquelle nous proposons la définition suivante :5
Figure 2 : Définition lexicographique de ⌜EN HAUT⌝ 2.
Cette définition permet de rendre compte du fait que le syntagme ⌜en haut⌝ employé dans MEH n’est pas un syntagme compositionnel. Il ne signifie pas simplement ‘situé dans le haut’, mais est plus spécifique et fait référence à un espace situé plus haut : une pièce, un étage d’une maison ou, plus généralement, un endroit destiné à accueillir des personnes et leurs éventuelles activités.6 Ainsi, pour quelqu’un qui se tient au pied d’un arbre et indique simplement son intention d’y grimper, il serait peu approprié de dire : (4)
– Je monte en haut.
Par contre, (3) devient parfaitement naturel si une hutte est construite dans l’arbre et si le Locuteur7 dit qu’il va s’y rendre. Une illustration bien connue d’un tel emploi de la locution ⌜EN HAUT⌝ 2 (et de son antonyme ⌜EN BAS⌝ 2) se trouve dans le répertoire traditionnel des comptines françaises :
L’autre acception du vocable ⌜EN HAUT⌝, la locution ⌜EN HAUT⌝ 1 (notre numérotation), possède une structure actancielle distincte : [X] en haut de Y – par ex., La bouteille de vhisky est en haut de l’armoire. Notre analyse rend compte du fait que ⌜EN HAUT⌝ 2 est une locution faible, par contraste avec les locutions fortes (et les semi-locutions). Pour une discussion des différents types de locutions dans la perspective de la Lexicologie Explicative et Combinatoire, voir notamment Mel’čuk (2013) et Polguère (2015). Le terme Locuteur – avec une majuscule initiale – désigne la personne qui produit un énoncé, par contraste à locuteur [d’une langue], sans majuscule.
Les modificateurs redondants et leur rôle en terminologie
(5)
89
[...] Maman est en haut qui fait du gâteau, Papa est en bas qui fait du chocolat [...]
Les analyses sémantiques qui viennent d’être faites montrent que lorsque le Locuteur combine le verbe MONTER I.A.2 avec le modificateur adverbial ⌜EN HAUT⌝ 2, il instancie la seconde position actancielle (Y) du verbe en exprimant le fait que X ne se dirige pas simplement « vers le haut », mais bien qu’il se rend dans un espace (un endroit circonscrit, une pièce, etc.). Même si l’apport de sens est minime, l’emploi de la locution ⌜EN HAUT⌝ 2 ajoute bien un contenu sémantique à celui du verbe gouverneur de MEH. Nous ne sommes donc aucunement en présence d’un pléonasme, contrairement à la croyance générale, qui relève d’une attitude typique d’hypercorrection. Bien entendu, il y a une intersection de sens entre le verbe et son modificateur dans MEH, mais ce n’est justement qu’une intersection, non d’une inclusion entière du sens du modificateur adverbial, qui justifierait un diagnostic de pléonasme. Si nous avons pris la peine d’analyser en détail le cas de MEH pour démontrer qu’il ne s’agit pas d’un pléonasme, c’est que les listes de pléonasmes qu’affectionnent les donneurs de leçons linguistiques regorgent de faux pléonasmes de ce type, alors qu’il serait essentiel de faire le tri et de ne lancer des avertissements qu’à propos des syntagmes récurrents qui présentent une maladresse véritable du fait du caractère parfaitement redondant du modificateur qu’ils contiennent.8 Notons qu’il est fréquent que la stigmatisation de faux pléonasmes provienne d’un manque de prise en considération de la non-compositionnalité sémantique du modificateur, comme dans le cas de MEH. Un autre exemple classique est applaudir ⌜des deux mains⌝, où le modificateur n’exprime aucunement ‘en utilisant ses deux mains’, mais plutôt ‘sans réserve/en appréciant véritablement la chose applaudie’, ce que l’on peut modéliser de la façon suivante en termes de fonction lexicale :
Une intéressante occurrence de monter en haut se trouve dans un document vidéo consultable en ligne sur le site de Radio Canada. On y voit Simone de Beauvoir faire visiter le Café de Flore à une journaliste lors d’une entrevue diffusée en mars 1967 dans l’émission Dossier. Dans le segment 19’40’’–20’10’’, Beauvoir dit : « [...] Oui c'est ça et Sartre se mettait en général à la table làbas près des bouteilles [pause] et là quelquefois quand il y avait trop de monde en bas alors on montait à la [courte hésitation] en haut » [URL : https://ici.radio-canada.ca/info/videos/media7813789/simone-beauvoir-et-jean-paul-sartre-couple-mythique-litterature (dernière consultation : 17.11.2020)].
90
(6)
Alain Polguère
Ver( applaudir ) = ⌜de bon cœur⌝, ⌜des deux mains⌝
La formule Ver( L ) – fonction lexicale Ver (du lat. verus) appliquée à la lexie L – est décrite dans Mel’čuk/Polguère (2021, section 3.2, [36]) comme équivalente à « une lexie adjectivale ou adverbiale que le Locuteur utilise comme modificateur de L pour exprimer un sens du type ‘véritable’, ‘tel qu’il faut’, ‘tel que ça doit être’, etc. ». Cette incursion dans le domaine des fonctions lexicales syntagmatiques nous offre une transition naturelle vers notre prochain sujet : les redondances phraséologisées, qui sont – tout comme les faux pléonasmes monter ⌜en haut⌝ ou applaudir ⌜des deux mains⌝ – des phrasèmes collocatifs.
2.3 Redondances phraséologisées Si la collocation applaudir ⌜des deux mains⌝ est un faux pléonasme, du fait de la nature de la locution (donc, sémantiquement non compositionnelle) du collocatif modificateur, il n’en va pas de même d’autres collocations couramment stigmatisées en tant que pléonasmes telles que crier fort, perfection absolue, etc. Le syntagme crier fort est effectivement redondant, puisque la définition de crier inclut le sémantème ‘[son qui est] fort’. Pourtant, le diagnostic de pléonasme9 relève lui aussi, comme dans le cas des faux pléonasmes, de l’hypercorrection. L’adjectif fort est tout simplement un des modificateurs types, parmi de nombreux autres, qu’offre la langue française pour intensifier le sens du verbe CRIER. En termes de fonction lexicale – Magn (du lat. magnus) étant la fonction lexicale syntagmatique d’intensificateur typique10 –, cela s’exprime par la formule suivante : (7)
Magn( crier ) = avec force, fort < ⌜à pleine gorge⌝, ⌜à pleins poumons⌝, ⌜ à tue-tête⌝, avec fureur, ⌜comme un enragé⌝, ⌜comme un fou⌝, ⌜ comme un putois⌝, ⌜comme un sourd⌝, de toutes ses forces, //hurler ; ⌜ à fendre l'âme⌝
Pour construire (7), nous nous sommes inspiré de la liste de « compléments adverbiaux » proposée pour CRIER dans le Dictionnaire des cooccurrences de la suite lo-
Dorénavant, nous ne parlerons de pléonasme que dans le sens de ‘pléonasme-erreur’. Pour une description détaillée, voir Mel’čuk/Polguère (2021, section 3.2, [35]).
Les modificateurs redondants et leur rôle en terminologie
91
gicielle Antidote (Charest et al. 2007). Il est intéressant de remarquer que le cooccurrent fort – que nous mentionnons dans (7) en deuxième position – a été manuellement retiré des cooccurrents fréquents que les analyses statistiques menées par les auteurs de la ressource n’ont certainement pas manqué de retourner (Charest et al. 2010). On trouve une trace indirecte de cette intervention manuelle dans le fait que le correcteur orthographique d’Antidote « connaît » la séquence crier fort et la repère dans les textes qu’on lui donne à analyser comme étant un pléonasme.11 Pourtant, du strict point de vue du contenu sémantique, la séquence crier avec force – admise par le correcteur et explicitement donnée dans le Dictionnaire des cooccurrences – présente la même redondance : si X crie, il le fait nécessairement avec force (= fort). Il existe donc de « bons » pléonasmes, qui sont des syntagmes collocationnels redondants où le collocatif s’utilise de façon conventionnelle pour exprimer le contenu d’une fonction lexicale syntagmatique. Sont principalement concernées ici les fonctions lexicales à collocatifs modificateurs Redun, Magn, Ver et Bon, décrites dans la section 3.2 de Mel’čuk/Polguère (2021). Attardons-nous sur le cas de la fonction lexicale Redun, qui a déjà été mentionnée en tout début d’article. D’introduction récente dans le système des fonctions lexicales standards, elle est présentée ainsi dans Mel’čuk/Polguère (2021, section 3.2, [34]) : « Redun( L ) est une lexie adjectivale ou adverbiale que le Locuteur utilise comme modificateur redondant de L (= dont le sens est inclus dans celui de L) pour préciser quelle acception d’un vocable polysémique donné il utilise ». Les modificateurs phraséologisés du type Redun sont donc motivés sémiotiquement en tant que désambiguïseurs. Dire interrompre une communication téléphonique, au lieu de dire simplement interrompre une communication, équivaut en quelque sorte à dire interrompre une communication III.C (si l’on imagine que notre interlocuteur a accès à la numérotation lexicographique du TLFi). Les collocatifs Redun sont très nombreux dans les langues. Ils sont un produit dérivé du phénomène de polysémie et au moins deux options peuvent être envisagées pour l’apparition d’un Redun dans une langue L : – une nouvelle acception d’un vocable donné de L apparaît et un Redun s’impose afin de signaler l’acception en question en tant que néologisme, puis ce Redun demeure dans l’usage comme modificateur optionnel – par exemple, souris II.C.3b = souris d’ordinateur ;12
Charest et al. (2010, section 3.4) mentionnent explicitement les pléonasmes comme type de cooccurrences qui ont été manuellement retirées dans une phase dite d’« élagage » des listes retournées par les analyses syntaxiques et statistiques des corpus. Cette analyse diachronique est fondée sur notre observation personnelle, puisque nous avons fait partie des utilisateurs initiaux de cet équipement informatique, en laboratoire de recherche
92
–
Alain Polguère
une locution ayant une structure lexico-sémantique compatible avec la structure d’une collocation à Redun apparaît, puis une séparation phraséologique (Pausé/Polguère 2020) s’opère où (i) le gouverneur syntaxique de la locution devient une nouvelle acception du vocable correspondant et (ii) le modificateur devient son collocatif Redun – par exemple, ⌜empreinte A digitale⌝ → empreinte B.4 + digitale.13
Le cas de empreinte digitale, qui vient d’être cité comme illustration, est tout particulièrement intéressant pour la suite de la discussion. Il s’agissait originellement d’une locution faible : son sens inclut le sens de la lexie de base du vocable EMPREINTE identifiée par la lettre A dans le TLFi et le sens ‘digital = relatif aux doigts’, ainsi que du matériau sémantique additionnel (‘trace de la présence de...’). Il n’est cependant plus exact, d’un point de vue lexicologique et lexicographique, de considérer l’existence d’une telle locution en français contemporain. La tête syntaxique du syntagme a pris son autonomie en passant dans la langue générale – elle est devenue le lexème EMPREINTE B.4 –, et digitale doit être considéré comme un modificateur redondant, parfaitement admissible, mais optionnel : laisser ses empreintes sur N, relever les empreintes de N, etc. Bien entendu, dans une perspective terminologique, il est tout à fait légitime d’identifier le concept terminologique correspondant au moyen du terme dit « complexe » empreinte digitale. Cette question est discutée plus bas (section 3.2). Le rapport intime qu’entretient Redun avec la polysémie en fait une fonction lexicale particulièrement importante (même si elle est longtemps restée sous les radars de la Lexicologie Explicative et Combinatoire). Elle engendre de très nombreuses redondances phraséologisées dans les langues.
2.4 Conclusions préliminaires (sur les modificateurs redondants) Nous espérons qu’il est maintenant clair pour nos lectrices et lecteurs que se trouvent qualifiées de pléonasmes des constructions de natures fort diverses, y compris
et université : souris II.C.3b s’employait seul, parfois en combinaison avec son Redun – voir aussi la description du TLFi qui contient une citation de 1984. À noter que souris informatique, même s’il est attesté dans les textes, est un phrasème très marginal par rapport à souris d’ordinateur. Même si nous indiquons un numéro d’acception (B.4) pour le sens du vocable EMPREINTE correspondant à ‘empreinte digitale’, les rédacteurs du TLFi n’avaient, à l’époque, pas encore sauté le pas : ils ont décrit le syntagme empreinte digitale, en tant qu’« expression » sous l’entrée empreinte, sans mentionner explicitement l’existence d’une acception autonome du vocable EMPREINTE portant ce sens.
Les modificateurs redondants et leur rôle en terminologie
93
des constructions qui sont à tort considérées comme des erreurs linguistiques : les faux pléonasmes et les redondances phraséologisées (collocations redondantes).14 Ces dernières sont omniprésentes dans les langues. Ce sont des phrasèmes « ordinaires », parfaitement bien construits et dont la maîtrise fait partie intégrante de la maîtrise de la langue à laquelle ils appartiennent. Nous allons, dans la suite de l’exposé, nous concentrer sur les phrasèmes à Redun, qui constituent une part importante des redondances phraséologisées. À fin d’illustration, nous donnons dans la Figure 3 une liste de syntagmes de ce type extraits du Réseau Lexical du Français ou RL-fr (Polguère 2014).15
Figure 3 : Syntagmes à Redun extraits du Réseau Lexical du Français (RL-fr).
Il est possible de contester la validité des données ci-dessus en affirmant qu’il s’agit non de collocations, mais d’expressions devant impérativement être considérées en bloc, avec ellipse possible du modificateur. On parle alors généralement d’expressions polylexicales (multiword expressions ou MWE), terme vague qui permet de se situer dans une sorte de no man’s land conceptuel et d’éviter de se compromettre en parlant de locutions (ce que ces expressions ne sont clairement pas). Deux conditions doivent être remplies pour postuler, comme nous le faisons, que nous sommes bien ici en présence de syntagmes collocationnels où le sens du modificateur syntaxique est entièrement présent dans celui du gouverneur, conditions que nous illustrerons avec le cas de prise III électrique (présent dans la Figure 3) : A) autono-
Certaines redondances phraséologisées peuvent être décrites dans les dictionnaires et autres textes de référence non comme des pléonasmes-erreurs, mais comme des figures de style ; par exemple, voir de ses propres yeux dans l’entrée pléonasme du Larousse citée en (2), section 2.1. La numérotation lexicographique des unités lexicales qui gouvernent syntaxiquement ces syntagmes est, dans le cas présent, celle du RL-fr (au moment de la rédaction du présent texte) et non du TLFi.
94
Alain Polguère
mie fonctionnelle de la tête syntaxique et B) agrégats lexicaux caractéristiques de celle-ci. A) Autonomie fonctionnelle de la tête syntaxique. La tête syntaxique d’un syntagme à modificateur redondant, puisqu’elle porte l’entièreté du sens du syntagme, doit être absolument autonome. Le Locuteur doit pouvoir l’employer seule pour exprimer le sens en question, sans qu’il s’agisse d’une ellipse permise par le contexte d’énonciation. Tel est bien le cas de la tête syntaxique prise dans prise électrique, pour laquelle on trouvera sans aucune difficulté des attestations d’emplois autonomes comme en (8). (8)
Il n’y a pas de prise dans la salle de bains, il n’y a que la lumière. [Web http://www.forum-electricite.com/installation-prise-de-courant-sallebains.htm (dernière consultation : 12.04.2021)]
L’emploi de prise seul, dans ce sens, est tellement la norme que l’on peut dire que c’est bien l’ajout de l’adjectif électrique qui est perçu comme une redondance et non son omission qui est perçue comme une ellipse. Cette importante nuance fonctionnelle est discutée dans Polguère (2011) à propos de dé à jouer (collocation à Redun) vs ⌜dé à coudre⌝ (locution). B) Agrégats lexicaux (lexical clusters) caractéristiques de la tête syntaxique. La tête syntaxique, si elle est une lexie autonome incluant le sens du modificateur, doit contrôler dans le réseau lexical de la langue des agrégats lexicaux (lexical clusters) caractéristiques (Polguère 2020a). Ceux-ci sont constitués d’unités lexicales avec lesquelles la tête syntaxique entretient des relations paradigmatiques et syntagmatiques privilégiées. On trouvera, dans les agrégats lexicaux contrôlés par la tête syntaxique, un nombre significatif d’unités lexicales sémantiquement liées au modificateur. Ainsi, le lexème PRISE III[RL-fr] contrôle un nombre très important de liens lexicaux qui le singularisent : – liens paradigmatiques – vers les lexies FICHE1 A.2e[TLFi], MULTIPRISE, ⌜PRISE DE ⌝ TERRE ... ; – liens syntagmatiques – cf. les collocations prise électrique/de courant, mâle/femelle, murale..., brancher/débrancher, raccorder... une prise. Toutes les têtes syntaxiques des syntagmes énumérés dans la Figure 3 répondent aux conditions A) et B) ci-dessus, et cela nous autorise à identifier ces expressions en tant que syntagmes redondants. Leur récurrence dans les productions orales et écrites nous permet de surcroît de les considérer comme des syntagmes phraséologisés du type Redun.
Les modificateurs redondants et leur rôle en terminologie
95
3 Redondances nominales dans les terminologies Nous abordons maintenant le cas spécifique des phrasèmes terminologiques (essentiellement nominaux) à modificateur redondant. Pour alléger l’expression, nous désignerons dorénavant ces phrasèmes sous le nom de redondances terminologiques. Après avoir montré la très forte présence de ces constructions dans les terminologies (3.1), nous expliquons comment il convient selon nous de les modéliser lexicographiquement (3.2).
3.1 Importance quantitative et fonctionnelle des redondances terminologiques Une fois le phénomène de la modification à Redun clairement identifié, on peut constater que les redondances terminologiques sont omniprésentes dans tous les domaines de spécialités. Pour illustrer ce fait, nous énumérons ci-dessous une douzaine de redondances terminologiques extraites du RL-fr (dont nous reprenons la numérotation lexicographique pour l’identification de la tête des syntagmes), regroupées en cinq domaines scientifiques ou techniques distincts. On pourrait sans difficulté augmenter considérablement la taille des données présentées ci-dessous. 1.
Chimie – cf. Gotkova et al. (2020) – composé chimique – élément chimique – liaison chimique (contraster avec liaison amoureuse/intime, pour une autre acception du vocable LIAISON) – chimiquement pur
Le dernier exemple énuméré ci-dessus est intéressant, car il illustre le fait que le phénomène que nous analysons déborde le seul domaine des termes nominaux. L’adjectif qui gouverne le chimiquement pur est une acception spécialisée du vocable PUR(Adj) propre au domaine de la chimie. 2.
Mathématiques – couple mathématique – fonction mathématique
3.
Astronomie – excentricité orbitale
4.
Géologie – manteau terrestre
96
5.
Alain Polguère
Mécanique – cheval fiscal – pompe à essence – pompe à huile [dans le RL-fr, il s’agit d’une acception spécialisée de POMPE distincte de la précédente] – régime mécanique
En nous fondant sur notre expérience de la modélisation lexicographique de ce type de phrasèmes, nous faisons l’hypothèse que les redondances terminologiques sont prioritairement contrôlées par les termes qui appartiennent à des vocables polysémiques au sein desquels ils cohabitent avec des acceptions de langue générale. La fonction du Redun, dans ce cas, est double : 1. singulariser l’acception terminologique en regard des acceptions de langue générale ; 2. identifier le domaine technico-scientifique dont relève ce terme. Un même vocable de langue générale pouvant contenir plusieurs acceptions associées à des domaines spécifiques, les différents Redun permettent aussi de distinguer entre elles les acceptions terminologiques. Nous avons identifié dans le RL-fr un cas assez spectaculaire de vocable possédant plusieurs acceptions de langue générale et de langue de spécialité (marquées « spéc ») ayant chacune leur Redun : il s’agit du vocable RÉGIME, dont la polysémie est (partiellement) décrite dans la Figure 4.
Figure 4 : Polysémie de RÉGIME dans le RL-fr avec identification des Redun.
Les données de la Figure 4 illustrent bien la double fonction sémiotique des modificateurs Redun identifiée plus haut, même si la singularisation des acceptions et
Les modificateurs redondants et leur rôle en terminologie
97
leur association avec un domaine de spécialité n’est pas nécessairement complète : l’acception I.2 n’est pas caractérisée par un Redun spécifique et les acceptions II.1 ~ II.2 possèdent le même Redun (l’adjectif alimentaire). Nous abordons maintenant la dernière étape de l’étude des redondances terminologiques : la question de leur modélisation lexicographique.
3.2 Modélisation lexicographique (et un mot de conclusion) Les redondances terminologiques constituent un type particulier de ce que la tradition terminologique appelle termes complexes. Cette dernière notion a été largement discutée dans la littérature ; voir entre autres – pour des textes compatibles avec les notions lexicologiques utilisées ici – Maniez (2002), L’Homme (2005 ; 2017) et Abreu (2018). Deux points font tout particulièrement débat dans la communauté des chercheurs en terminologie : (i) la distinction entre locutions et collocations au sein des termes complexes et (ii) le mode de description à adopter pour ces syntagmes terminologiques dans les dictionnaires et bases de données lexicales. Dans le cas spécifique des redondances terminologiques, le premier point n’est plus pour nous un sujet de discussion, puisque nous avons démontré que ces syntagmes sont bien des collocations (à collocatif Redun). Nous allons nous concentrer ici sur le problème de la modélisation lexicographique de ces syntagmes au sein de ressources lexicales faisant cohabiter langue générale et langues de spécialité. Comme dans tout ce qui a précédé, notre modèle lexicographique de référence sera celui des Systèmes Lexicaux, qui sont de vastes réseaux lexicaux dont l’ossature est principalement tissée par les relations de fonctions lexicales paradigmatiques et syntagmatiques connectant les lexies de la langue (Polguère 2014). Néanmoins, les propositions que nous faisons ici s’appliquent aussi dans le cadre de la modélisation terminographique en général.16 Selon nous, une modélisation adéquate des redondances terminologiques doit permettre de réconcilier deux réalités en apparence contradictoires : A) une réalité théorique et B) une réalité pratique. A) Du point de vue théorique, les redondances terminologiques, en tant que collocations (donc, phrasèmes compositionnels), ne sont pas des unités lexicales (= lexies) et, de ce fait, elles ne doivent pas être lexicographiquement réifiées comme doivent l’être les lexèmes et locutions de la langue. Toute collocation, même si elle
Ces propositions sont en grande partie fondées sur un travail interdisciplinaire mené depuis plusieurs années avec notre collègue chimiste Francesca Ingrosso autour de la terminologie de la chimie et de son interaction avec le lexique général (Ingrosso/Polguère 2015 ; Gotkova et al. 2020).
98
Alain Polguère
est à un niveau très général d’abstraction une sorte d’entité lexicale, correspond en tout premier lieu à une règle lexicale qui spécifie une propriété de combinatoire restreinte de sa base. Pour illustrer ce fait, prenons le cas d’une collocation de langue générale prototypique : temps pourri. Il est tout à fait possible, pour des vacanciers malchanceux, que ce syntagme exprime très directement un concept important du quotidien de leurs dernières vacances sur le littoral et qu’il soit ainsi la verbalisation « unitaire » de ce concept lorsqu’ils racontent leur été à leurs proches. Temps pourri tend alors pour ces vacanciers à être employé en bloc, comme le serait par exemple une locution. Mais il s’agit là d’une conséquence dans la Parole des vacanciers de faits extralinguistiques. Le statut collocationnel de temps pourri demeure inchangé en Langue. Sa modélisation lexicographique doit faire partie de la modélisation de la combinatoire lexicale de la lexie TEMPS ll.A.1 ; c’est-à-dire, dans le cadre de la Lexicologie Explicative et Combinatoire, au moyen de la formule : (9)
AntiBon( temps II.A.1 ) = mauvais < pourri, ⌜de chien⌝, ⌜de cochon⌝
Au sein d’une ressource lexicale, la formule (9) offre la réponse à la question suivante : quelle unité lexicale/expression doit-on choisir pour exprimer le sens ‘pas bon’ auprès de la lexie TEMPS II.A.1, quelles que soient les situations individuelles de Parole ? Cette formule modélise une connaissance que l’on pourrait qualifier de « purement » linguistique. Ce qui vient d’être dit à propos d’une collocation de langue générale vaut pour toutes collocations, et s’applique donc aussi aux redondances terminologiques, qui sont à modéliser comme des propriétés de leur base dans la description lexicographique de celle-ci, au moyen de la fonction lexicale Redun – ou par toute modélisation équivalente dans d’autres approches lexicographiques. B) Du point de vue pratique, cependant, dans un contexte de manipulation des concepts terminologiques et non simplement des termes eux-mêmes, il est souvent crucial de singulariser les termes, notamment lorsqu’ils présentent une parenté formelle avec des éléments du vocabulaire de langue générale. Et tel est bien le cas des redondances terminologiques, dont la tête syntaxique est généralement ambiguë (entre acception de langue générale et acception spécialisée). Ainsi, l’utilisation du seul mot-forme liaison (cf. le lexème LIAISON A.5 dans le TLFi) ne pose généralement aucun problème dans le contexte d’un texte technico-scientifique de chimie ou dans le discours d’un chimiste. Il existe cependant des contextes où l’on est naturellement amené à privilégier l’emploi de la redondance terminologique liaison chimique ; notamment : l’établissement de nomenclatures de termes de la chimie et la production de textes où la terminologie de la chimie n’est pas prédominante. Pour cette raison, certains terminologues et spécialistes de la chimie pourront insister sur le fait qu’il existe bel et bien un terme liaison chimique, qui doit clairement être
Les modificateurs redondants et leur rôle en terminologie
99
identifié comme tel. Et c’est bien ce que l’on trouve dans le Compendium of Chemical Terminology, aussi appelé Gold Book, sur le site de l’IUPAC (International Union of Pure and Applied Chemistry). Cette ressource terminologique (IUPAC 2019) propose deux entrées distinctes, pour bond ‘liaison’ et pour chemical bond ‘liaison chimique’, avec les explications suivantes :17 bond There is a chemical bond between two atoms or groups of atoms in the case that the forces acting between them are such as to lead to the formation of an aggregate with sufficient stability to make it convenient for the chemist to consider it as an independent ‘molecular species’. chemical bond When forces acting between two atoms or groups of atoms lead to the formation of a stable independent molecular entity, a chemical bond is considered to exist between these atoms or groups. The principal characteristic of a bond in a molecule is the existence of a region between the nuclei of constant potential contours that allows the potential energy to improve substantially by atomic contraction at the expense of only a small increase in kinetic energy. Not only directed covalent bonds characteristic of organic compounds, but also bonds such as those existing between sodium cations and chloride anions in a crystal of sodium chloride or the bonds binding aluminium to six molecules of water in its environment, and even weak bonds that link two molecules of O2 into O4, are to be attributed to chemical bonds.
La première description établit de façon implicite une synonymie exacte entre bond et chemical bond (avec un hyperlien vers l’article de la redondance terminologique !). On peut donc considérer que cette première description traite de la même notion terminologique que la seconde. Ce qui frappe avant tout, c’est que bond se voit associer une description formellement proche d’une définition lexicographique, alors que chemical bond est décrit de façon nettement plus « encyclopédique ». La distinction linguistique entre le lexème seul et la redondance terminologique qui lui est associée est ainsi utilisée dans IUPAC (2019) pour fournir deux types d’informations : sous l’entrée bond, on décrit avant tout le terme lui-même ; sous l’entrée chemical bond, on décrit le concept associé, comme si la redondance terminologique identifiait plus clairement ce concept que le lexème seul. Cela rejoint les observations que nous avons faites antérieurement (section 3.1) sur la double fonction sémiotique des redondances terminologiques : (i) singulariser les termes qui sont les bases de ces collocations dans la polysémie des vocables dont ils font partie (notamment vis-à-vis des acceptions de langue générale de ces vocables) ; (ii) caractériser ces termes en tant que relevant de domaines technico-scientifiques spécifiques. Le soulignement indique des hyperliens dans les articles en ligne.
100
Alain Polguère
Nous ne remettons aucunement en question le fait que les spécialistes d’un domaine peuvent éprouver le besoin, dans des situations particulières, de référer à un concept de leur domaine au moyen du terme complexe qu’est la redondance terminologique, et toute modélisation terminologique doit tenir compte de ce fait. La modélisation extraite de IUPAC (2019) que nous venons d’examiner est cependant peu claire et porte à confusion puisqu’elle met sur le même plan – et même met en compétition – deux modélisations, qu’il conviendrait de distinguer formellement : – une modélisation linguistique, qui caractérise les termes eux-mêmes ; – une modélisation conceptuelle, qui fait le point sur l’état des connaissances (dans les domaines concernés) sur les notions technico-scientifiques correspondantes – une notion étant une association Concept ↔ Terme. Il n’appartient pas aux lexicologues (ou terminologues) de dire aux spécialistes d’un domaine donné comment il convient de caractériser un concept qu’ils manipulent. Par contre, ils doivent fournir à ces derniers une modélisation des termes qui soit en harmonie avec la réalité du discours spécialisé. C’est pourquoi, dans le cas précis des redondances terminologiques, nous ne voyons aucun inconvénient à fournir une double modélisation de ces phrasèmes : 1. sous l’entrée correspondant à la base des collocations, l’identification du ou des Redun de la lexie en question ; 2. dans la nomenclature du modèle lexical, des entrées individuelles pour les redondances terminologiques, caractérisées en tant que syntagmes collocationnels. La Figure 5 montre comment la redondance terminologique liaison chimique est décrite sous forme d’une entrée lexicale dans le RL-fr. Nous donnons ici une « vue-article », c’est-à-dire une visualisation sous forme textuelle de l’information lexicographique (réticulaire). Dans cettte description lexicographique, les caractéristiques grammaticales (CG) sont vitales pour identifier la nature lexicale de l’entité décrite : – la marque d’usage langagier « spéc » indique que l’on est en présence d’un terme – sur le système des marques d’usage du RL-fr, voir Polguère (2020b) ; – la deuxième caractéristique grammaticale (i) indique que ce terme est un syntagme nominal non lexicalisé (pas de partie du discours « nom » ou « locution nominale », comme cela serait le cas pour une lexie) et (ii) donne la structure lexico-syntaxique (Pausé 2020) du syntagme en question, fondée sur les deux lexies LIAISON II et CHIMIQUE I du RL-fr ; – « collocation » correspond à la spécification du statut phraséologique de l’entité lexicale décrite.
Les modificateurs redondants et leur rôle en terminologie
101
Figure 5 : Vue-article de liaison chimique dans le RL-fr.
La réification de liaison chimique dans le Système Lexical du RL-fr et l’encodage de sa relation de synonymie (Syn) avec le lexème LIAISON II permettent d’interpréter directement sur le plan lexical les deux entités au statut notionnel flou (entre terme et concept) présentes dans IUPAC (2019). La nature réticulaire du modèle du RL-fr permet en outre d’associer à la redondance terminologique liaison chimique le même type d’agrégat lexical que l’on associe à une lexie véritable. La Figure 6 montre les constituants fondamentaux de l’agrégat en question, les arcs en pointillé indiquant des relations purement formelles.
Figure 6 : Cœur de l’agrégat lexical de liaison chimique dans le RL-fr.
Terminons par une remarque sur le potentiel classificatoire des Redun terminologiques dans les langues, et dans les Systèmes Lexicaux tels que le RL-fr. Les ressources lexicales « traditionnelles » qui intègrent la description des termes dans celle du lexique de langue générale ont recours à des marques d’usage identifiant le « domaine » des termes en question. Ainsi, l’article lexicographique de la lexie LIAISON A.5 dans le TLFi – le pendant de LIAISON II dans le RL-fr – débute
102
Alain Polguère
par la marque d’usage « CHIM. ». Par contraste, le microréseau de la Figure 6 illustre le fait qu’il n’est pas nécessaire d’avoir recours à ce type d’indication de domaine dans un Système Lexical, notamment grâce à l’information apportée par les Redun terminologiques. Le domaine terminologique de LIAISON II s’établit ainsi en trois temps : 1. la marque d’usage « spéc » dans les caractéristiques grammaticales de LIAISON II indique la nature terminologique de cette lexie ; 2. le lien de Redun pointe vers un adjectif (CHIMIQUE I), qui est formellement l’adjectivisation (lien de fonction lexicale A0, ainsi que son pendant de nominalisation S0) de la lexie CHIMIE I.1 ; 3. cette dernière dénote une discipline scientifique et peut donc être exploitée comme identificateur de domaine.18 L’avantage d’une telle approche est qu’elle évite de gérer manuellement un ensemble (toujours relativement arbitraire et fluctuant) de domaines de spécialité. C’est la langue elle-même, à travers les liens de fonctions lexicales qui tissent le lexique, qui nous procure cette information. Dans le cas où une redondance terminologique est présente, comme dans la configuration de la Figure 6, l’identification du ou des domaines est très directe. La même stratégie peut néanmoins être appliquée en l’absence de redondance terminologique : la topologie des Systèmes Lexicaux fera toujours apparaître les lexies identificatrices de domaines dans les agrégats lexicaux des termes. L’examen détaillé du cas particulier des redondances terminologiques nous a ici servi à mettre l’éclairage sur le fait fondamental que la langue sait « prendre soin » de ses termes en les intégrant au lexique dans sa globalité. De façon symétrique, un phénomène tel que celui des redondances terminologiques est un des indices forts du fait que l’écosystème des termes est bien le lexique dans sa totalité : c’est en prenant en compte cette réalité linguistique qu’il faut les modéliser.
Comme l’a noté un des évaluateurs de l’article, des collocations à Redun telles que cheval fiscal ou pompe à huile mentionnées plus haut (section 3.1) ne permettent pas, seules, l’identification de domaines. Cela est précisément dû au fait que les valeurs de Redun ne dénotent pas, dans ces cas spécifiques, des disciplines scientifiques ou techniques.
Les modificateurs redondants et leur rôle en terminologie
103
Bibliographie Abreu, Sabrina, Considerações sobre a natureza colocacional e locucional de sintagmas terminológicos, ReDILLeT 1 (2018), https://revistas.unc.edu.ar/index.php/ReDILLeT/article/view/22266/21866 [dernière consultation : 21.11.2021]. Charest, Simon/Brunelle, Éric/Fontaine, Jean/Pelletier, Bertrand, Élaboration automatique d’un dictionnaire de cooccurrences grand public, in : Actes de la 14 e conférence sur le Traitement Automatique des Langues Naturelles, Toulouse, ATALA, 2007, 265–274. Charest, Simon/Brunelle, Éric/Fontaine, Jean, Au-delà de la paire de mots. Extraction de cooccurrences syntaxiques multilexémiques, in : Actes de la 17 e conférence sur le sur le Traitement Automatique des Langues Naturelles, Montréal, ATALA, 2010, 41–50. Gotkova, Tomara/Ingrosso, Francesca/Mikhel, Polina, Vocabulaire de la chimie. L’analyse sémantique des phrasèmes [diaporama de la communication], Colloque International PhraséoTerm, 16–17 novembre 2020, Vérone. Hausmann, Franz Josef, Un dictionnaire des collocations est-il possible ?, Travaux de littérature et de linguistique de l’université de Strasbourg 17:1 (1979), 187–195. Ingrosso, Francesca/Polguère, Alain, How terms meet in small-world lexical networks : the case of chemistry terminology, in : Proceedings of the 11e international conference on terminology and artificial intelligence (TIA 2015), Grenade, 2015, 167–171, http://ceur-ws.org/Vol-1495/paper_11.pdf [dernière consultation : 21.11.2021]. IUPAC, The Gold Book API, v1.0, International union of pure and applied chemistry (IUPAC), 2019, DOI : 10.1351/goldbook. Koch, Peter, Cognitive onomasiology and lexical change. Around the eye, in : Vanhove, Martine (ed.), From polysemy to semantic change, Amsterdam/Philadelphia, John Benjamins, 2008, 107–137. L’Homme, Marie-Claude, Sur la notion de « terme », Meta. Journal des traducteurs/Meta. Translators’ journal 50:4 (2005), 1112–1132. L’Homme, Marie-Claude, Combinatoire spécialisée. Trois perspectives et des enseignements pour la terminologie, Traduction terminologie, rédaction (TTR) 30:1–2 (2017), 215–241. Maniez, François, Distinguer les termes des collocations. Étude sur corpus du patron « adjectif–nom » en anglais médical, in : Actes de la 9e conférence sur le Traitement Automatique des Langues Naturelles, Nancy, ATALA, 2002, 344–349. Mel’čuk, Igor, Tout ce que nous voulions savoir sur les phrasèmes, mais..., Cahiers de lexicologie 102 (2013), 129–149. Mel’čuk, Igor/Polguère, Alain, Theory and practice of lexicographic definition, Journal of cognitive science 19:4 (2018), 417–470. Mel’čuk, Igor/Polguère, Alain, Les fonctions lexicales dernier cri, in : Marengo, Sébastien (ed.), La théorie Sens-Texte. Concepts-clés et applications, Paris, L’Harmattan, 2021, 75–155. Pausé, Marie-Sophie, Modélisation des locutions dans un réseau lexical. Enjeux théoriques, Langue(s) & parole 5 (2020), 157–178. Pausé, Marie-Sophie/Polguère, Alain, Séparation phraséologique. Quand les locutions s’éclatent, Cahiers de lexicologie 116 (2020), 233–271. Polguère, Alain, Figement et ellipse dans une perspective lexicographique. Le cas de « dé à jouer » et « dé à coudre », in : Anscombre, Jean-Claude/Mejri, Salah (edd.), Le figement linguistique. La parole entravée, Paris, Champion, 2011, 363–373. Polguère, Alain, From writing dictionaries to weaving lexical networks, International journal of lexicography 27:4 (2014), 396–418.
104
Alain Polguère
Polguère, Alain, Non-compositionnalité. Ce sont toujours les locutions faibles qui trinquent, Verbum 37:2 (2015), 257–280. Polguère, Alain, Apports de la lexicographie réticulaire. Le cas de la polysémie relationnelle, Langue(s) & parole 5 (2020), 135–156 (=2020a). Polguère, Alain, Vers une approche systémique des marques d’usage, in : Armianov, Gueorgui (ed.), Marques de registre dans les dictionnaires bilingues, Paris, Presses de l’Inalco, 2020, 3–32 (=2020b). TLFi, Trésor de la Langue Française informatisé, Nancy, ATILF CNRS & Université de Lorraine, 2002, en ligne : http://www.atilf.fr/tlfi.
Jingrao Li, Agnès Tutin
Quels traitements pour la phraséologie scientifique transdisciplinaire dans une perspective d’aide à la rédaction ? Résumé : La phraséologie scientifique transdisciplinaire, définie comme l’ensemble des expressions polylexicales propres au genre du discours scientifique, est un maillon indispensable pour la maîtrise de la rédaction scientifique, en particulier pour les apprentis chercheurs. Dans cet article, nous réfléchissons à plusieurs façons d’exploiter la base phraséologique construite au sein du LIDILEM (Hatier et al. 2016 ; Jacques/Tutin 2018) dans un outil d’aide à la rédaction. Après une présentation des différents types d’expressions polylexicales recensées, trois types d’accès sont décrits : a) onomasiologique, par notions scientifiques ou fonctions discursives ; b) sémasiologique, avec des relations lexicales paradigmatiques et syntagmatiques ; c) par la traduction, en particulier à partir du chinois. Mots-clés : phraséologie, discours scientifique, lexique scientifique transdisciplinaire, aide à la rédaction, lexique scientifique chinois Abstract: Crossdisciplinary scientific phraseology, defined as the collection of multiword expressions specific to the genre of scientific discourse, is an essential component for mastering scientific writing, especially for novice researchers. In this article, we consider several ways to take advantage of the phraseological database developed within LIDILEM Lab (Hatier et al. 2016 ; Jacques/Tutin 2018) in a writing aid tool. After a presentation of the different types of multiword expressions, three types of uses are described: a) onomasiological, by scientific notions or discursive functions ; b) semasiological access, with paradigmatic and syntagmatic lexical relations ; c) through translation, in particular from Chinese. Keywords: phraseology, scientific discourse, transdisciplinary scientific lexicon, writing aid, Chinese scientific lexicon
https://doi.org/10.1515/9783110749854-007
106
Jingrao Li, Agnès Tutin
1 Introduction Le genre du discours scientifique se caractérise par un ensemble d’expressions préfabriquées qu’il faut maîtriser pour être pleinement intégré à la communauté de discours académique (Swales 1990). Cela recouvre des expressions qui sont liées à des notions clés de la pratique scientifique (par exemple, la collecte et l’analyse des données), mais aussi à des expressions liées au métadiscours (tel que défini par Hyland 2005), à la façon d’écrire la science, de se positionner, de guider le lecteur. Ce lexique scientifique transdisciplinaire, incluant des ressources phraséologiques correspondant à des locutions et des collocations, a été traité dans une base lexicale, la base LST-SHS, dans notre équipe1 (Jacques/Tutin 2018 ; Hatier et al. 2016), et des études sont en cours pour le repérage des routines sémantico-rhétoriques (Ji 2022). Une description syntaxique et sémantique simple de ces éléments a été proposée dans la base LST-SHS, mais un accès à la fois plus structuré et plus intuitif à ces données reste à effectuer pour proposer un outil d’aide à la rédaction pour les apprentis chercheurs, où le rôle des corpus serait central. Dans cette étude, nous souhaitons proposer une réflexion sur l’organisation d’une base de données phraséologiques à destination des apprentis chercheurs organisée autour des principes suivants : a) une organisation onomasiologique, basée sur un métalangage simple, exploitant des mécanismes analogiques b) un accès sémasiologique, intégrant des relations lexicales ; c) un accès par la traduction, en particulier pour un public sinophone. Nous présentons tout d’abord la notion de phraséologie scientifique transdisciplinaire, puis précisons les différents types d’expressions rencontrées et le traitement qui a été effectué dans la base LST-SHS. Enfin, nous esquissons les différents modes d’accès envisagés pour faciliter une utilisation en autonomie pour l’aide à la rédaction.
2 Qu’est-ce que la phraséologie scientifique transdisciplinaire ? Propre au discours scientifique, la phraséologie scientifique transdisciplinaire est l’ensemble des expressions polylexicales qui ne renvoient pas aux objets d’étude des disciplines scientifiques, mais plutôt aux procédures, méthodes et éléments
Voir la ressource (version bêta) sur : lst.demarre-shs.fr. [dernière consultation : 17.11.2021].
Quels traitements pour la phraséologie scientifique
107
du raisonnement propres au genre des écrits scientifiques. Ce lexique transversal aux différentes disciplines (même si certaines expressions sont particulièrement fréquentes dans certaines familles de discipline) porte ainsi sur plusieurs types d’éléments comme les suivants : – L’activité scientifique et l’évaluation : collecter des données, effectuer une analyse, résultats encourageants – Le raisonnement scientifique : nous arrivons à la conclusion, c’est pourquoi… – Le métadiscours et le métatexte : dans un premier temps, comme on l’a vu, au contraire Les expressions citées ci-dessus traversent en effet largement les disciplines scientifiques et sont plus caractéristiques du genre du discours scientifique même que des domaines particuliers. Ainsi, nous retrouverons facilement dans un premier temps ou effectuer une analyse aussi bien en sociologie, qu’en biologie ou en linguistique, comme en attestent les exemples ci-dessous. 1.
Dans un premier temps, je présenterai les trois échelles qui permettent de catégoriser les phénomènes sociaux. [article, sociologie]
2.
Dans un premier temps, nous analyserons le contexte particulier dans lequel apparaît pour quoi. Dans un second temps, nous étudierons comment pour quoi se démarque de l'adverbe pourquoi et dans un troisième temps… [article, linguistique]
3.
Dans un premier temps, nous avons effectué une analyse de la variance (ANOVA) à mesures répétées sur les TR avec deux variables intra-sujets… [thèse, biologie]
4.
Afin de nous assurer de la robustesse de nos résultats, nous effectuons nos analyses en utilisant successivement trois valeurs distinctes pour fixer la distance maximale à la frontière… [article, sociologie]
5.
Nous avons effectué une analyse du corpus français en tentant de mettre en rapport des connaissances interlinguistiques de l'ontologie définies pour le domaine économique avec les connaissances intralinguistiques propres au français. [thèse, linguistique]
Ce lexique intéresse depuis longtemps les linguistes du français et de l’anglais (Phal 1972 ; Coxhead 2000 ; Pecman 2004 ; Drouin 2007 ; Paquot 2010 ; pour une synthèse, voir Jacques/Tutin 2018). Les spécificités phraséologiques de ce lexique ont également été soulignées, en particulier dans le domaine de l’English for Academic Purposes où diverses ressources ont été discutées (par exemple, Gledhill 2000 ; Biber 2004 ; Pecman 2007 ; 2018) et constituées (Biber/Gray 2010 ; Acker-
108
Jingrao Li, Agnès Tutin
mann/Chen 2013 ; Granger/Paquot 2015), mais peu de ressources sont disponibles à l’heure actuelle pour le français. Dans le cadre de notre équipe au LIDILEM, des ressources phraséologiques de locutions et collocations ont été constituées dans le cadre du projet TermITH (Jacques/Tutin 2018 ; Hatier et al. 2016) dans la base LST-SHS,2 et des études sont en cours pour le repérage des routines sémantico-rhétoriques (Ji/Tutin 2019 ; Ji 2022). Nous souhaitons ici réfléchir à l’exploitation de ces ressources pour l’aide à la rédaction, en particulier pour les étudiants en sciences humaines.
3 Diversité de la phraséologie transdisciplinaire La phraséologie scientifique transdisciplinaire n’est pas fondamentalement différente de celle de la langue générale, et elle présente à ce titre une certaine hétérogénéité. Dans notre équipe, nous avons identifié les expressions de cette phraséologie transdisciplinaire en appliquant les méthodes de la linguistique outillée à un grand corpus diversifié d’articles scientifiques de 5 millions de mots dans le domaine des sciences humaines (Hatier 2016 ; Hatier et al. 2016 ; Jacques/Tutin 2018). Nous nous nous sommes appuyées sur la distinction classique établie par plusieurs auteurs (Bally 1909 ; Mel’čuk 2013, par exemple) pour les notions de locutions et de collocations. Le troisième type d’expressions intégrées inclut les routines, qui sont des formules stéréotypées, propres au genre (cf. Ji 2022 ; Tutin/Ji 2022). La Figure 1 synthétise les trois types d’expressions abordés dans ce projet.
Phraséologie scientifique transdisciplinaire
Locutions point de vue dans un premier temps
Collocations faire une hypothèse affirmer clairement
Routines Il est crucial/essentiel/important de noter/remarquer ..
Figure 1 : Les grands types d’expressions de la phraséologie transdisciplinaire.
La ressource (version bêta) est librement accessible sur : http://lst.demarre-shs.fr. [dernière consultation : 17.11.2021]
Quels traitements pour la phraséologie scientifique
109
Les locutions transdisciplinaires sont des expressions polylexicales surreprésentées dans les articles scientifiques et présentes dans plusieurs disciplines (pour la méthode d’extraction de ces expressions, voir Tutin 2018). Ces locutions (par exemple, point de vue, mettre au jour, de taille, dans un premier temps) présentent une faible compositionnalité sémantique et sont, de ce fait, traitées comme une unité lexicale à part entière, comme les lexies simples. Dans le cadre de notre ressource, ces éléments – au nombre de 408 dont 279 adverbes – sont traités de la même façon que les lexies simples. La base qui les recense intègre un numéro d’acception, une glose, une classe et une sous-classe sémantique (nous reviendrons à la section suivante sur le traitement sémantique). Le Tableau 1 présente quelques exemples de ces expressions. Tableau 1 : Exemples de locutions transdisciplinaires dans la base LST du Lidilem. Catégorie Lemme Variante Acception Glose graphique Termith
Source
Classe et sous-classe sémantique
A
de taille
de taille
DEM
importance/ positif
Adv
dès lors
dès lors_ à partir de ce moment
DEM
temporalité/ chronologie
Nom
compte- compte rendu rendu
compterendu
Wiktionnaire communication_ support/ document
V
faire face
faire face
considérable, très important
rapport, exposé ou relation de certains faits
DEM
relation/ #opposition
Les collocations transdisciplinaires, qui constituent le deuxième type, sont des associations syntagmatiques privilégiées des lexies du lexique transdisciplinaire. Ce sont davantage des associations lexicales que des unités lexicales. Ces expressions (à peu près 1500) sont extraites à l’aide de configurations syntaxiques, en utilisant l’outil Lexicoscope développé par Olivier Kraif et Sascha Diwersy (par exemple, Kraif 2016), et un traitement simple en est proposé, y compris quelques fonctions lexicales de la Lexicologie Explicative et Combinatoire (par exemple, Mel’čuk et al. 1995). Quelques exemples d’expressions apparaissent dans le Tableau 2. Dans la version en ligne de la base LST développée par Sylvain Hatier, les associations apparaissent sous la forme d’un réseau, selon leur importance et l’usager peut directement accéder à la description de la collocation, puis à des exemples authentiques issus du corpus d’articles scientifiques (cf. Figure 2)
110
Jingrao Li, Agnès Tutin
Tableau 2 : Différentes configurations syntaxiques des collocations avec des exemples (et les Fonctions Lexicales correspondantes). Collocation
Structure
difficilement compatible différence fondamentale élément d'analyse tout au long de la période dresser un bilan les résultats soulignent renforcer considérablement
Adv – Adj Nom – Adj Nom – Prep – Nom Prep – Nom Verbe – Nom Nom – Verbe Verbe – Adv
Fonction Lexicale Import Sing Oper Magn
Figure 2 : Du réseau de collocations aux exemples authentiques.
Le troisième type d’expression abordé, les routines, s’apparente en partie aux clichés de Mel’čuk (2020) et aux « routines conversationnelles » de l’oral par certains aspects (Coulmas 1981 ; Klein/Lamiroy 2011). Ce sont des motifs récurrents, ayant souvent un statut de phrase, construit autour d’un prédicat ou d’une classe de prédicats sémantiques, dont les arguments sont actualisés dans l’énonciation et ayant une fonction rhétorique spécifique. On pourra par exemple mentionner une routine impliquant les verbes de constat comme la suivante : (comme) on/nous le voir/constater/observer (LOC)
où LOC présente le lieu du constat. Les exemples (6) et (7) illustrent cette routine. 6.
Comme on peut le voir en Tableau 1, le premier facteur comprend les trois items de performance approche et explique 30,9 % de la variance. [article, psychologie]
7.
Comme on peut le constater, cette méthode porte une attention extrême aux commentaires et à la personnalité de chacun des participants. [article, information-communication]
Quels traitements pour la phraséologie scientifique
111
Ces routines sont particulièrement nombreuses dans les expressions qui indiquent le guidage du lecteur, qu’il s’agisse d’indiquer la structure du texte, de préciser certaines formulations ou d’attirer l’attention du lecteur sur certains points. Le Tableau 3 présente quelques exemples des routines mises en évidence par Ji (2022), en cours de recensement à partir du même corpus que les locutions et collocations.3 Tableau 3 : Typologie des routines de guidage du lecteur (Ji 2022). Typologie fonctionnelle des routines de guidage du lecteur dans les écrits scientifiques Structuration
Annonce de plan
–
dans la partie suivante, nous montrons…
Annonce de l’objet/l’objectif
–
l’objectif de l’article est d’examiner …
Navigation textuelle
Renvoi intratextuel
–
comme nous l’avons signalé auparavant...
Renvoi intertextuel
–
Voir aussi l’article de X
–
on peut conclure que...
–
on peut aussi dire que…
–
cela ne veut pas dire que ; ceci ne signifie pas …
Conclusion Métalinguistique Reformulation Réparation
Précision Définition – terminologique Dénomination –
nous utilisons la notion X pour désigner…
–
le terme (« » ) renvoie à...
Emprunt terminologique
–
j'emprunte l'expression à quelqu’un...
Mise en évidence
–
il est important/fondamental/essentiel de noter/remarquer…
(Co) Constat
–
on voit ici …
Focus
–
le principal problème est…
Désignation
Topicalisation
nous pouvons alors définir X comme...
Les ressources développées dans notre équipe ont été exploitées pour des études de type linguistique, ou dans une optique de Traitement Automatique des Langues (Jacquey et al. 2018). Quelques exploitations didactiques ont été proposées, comme celles de Yan et al. (2019). Le lexique phraséologique constitué, compor-
Pour une présentation détaillée de la méthode utilisant les « arbres lexico-syntaxiques récurrents », voir Tutin et al. (2022).
112
Jingrao Li, Agnès Tutin
tant déjà quelques traitements syntaxiques et sémantiques, nous paraît également être un bon point de départ pour la constitution d’un outil d’aide à la rédaction, à la fois pour les étudiants francophones et allophones. Nous discutons comment cette ressource peut être adaptée à cette fin dans la section suivante.
4 D’une ressource phraséologique à un outil d’aide à la rédaction Les ressources constituées dans le cadre du projet TermITH (locutions et collocations) et plus récemment, autour des routines pourraient être adaptées dans un outil d’aide à la rédaction pour les apprentis chercheurs en sciences humaines. Cet outil se présenterait sous la forme d’une plateforme en ligne, avec une ergonomie simple, testée auprès d’utilisateurs. Pour l’utilisation d’un dispositif de ce type en autonomie, plusieurs modes d’accès peuvent être retenus. Parmi ceux-ci, nous pouvons penser à : a) un accès onomasiologique notionnel, proche d’une ontologie représentant les connaissances, et un accès à partir des fonctions rhétoriques ; b) à un accès plus classique de type sémasiologique, incluant des associations lexicales, ou ; c) à un accès à partir de la traduction depuis la langue maternelle pour les locuteurs allophones.
4.1 Un accès onomasiologique notionnel et rhétorique 4.1.1 Le classement de Hatier et al. (2016) Un premier traitement sémantique du LST a été effectué dans notre équipe, basé sur des propriétés distributionnelles, déterminées à partir d’une étude rigoureuse sur le corpus TermITH présenté plus haut (Hatier 2016 ; Hatier et al. 2016 ; Jacques/ Tutin 2018). À chaque unité lexicale, simple ou composée ont été associées des classes et des sous-classes sémantiques selon des principes distributionnels observés sur corpus. La base d’origine comporte 38 classes sémantiques avec plus de deux-cents sous-classes. La Figure 3 présente un exemple de traitement pour la classe sémantique de l’espace et les sous-classes associées (par exemple, dimension ou domaine). À l’instar des classifications proposées par Pecman (2004) ou Siepmann (2006), le lexique regroupe sous une même étiquette notionnelle plusieurs expressions dont le contenu sémantique présente des similitudes. Par exemple, sous la notion « objectif », nous avons visée, viser, but, objectif, fin, finalité. Comme indiqué plus haut, un classement des données en fonction du champ sémantique (analyse, inten-
Quels traitements pour la phraséologie scientifique
113
Figure 3 : Un exemple de classe sémantique du LST et ses réalisations lexicales.
sité, évaluation, appartenance, changement…) est proposé, combiné avec le classement selon la nature des lexies (adjectif, adverbe, verbe, nom…), en utilisant des critères distributionnels. Par exemple, la sous-classe « domaine » de la classe « espace » a pour test d’appartenance : Le N s’étend, donc les noms qui peuvent remplacer le N sont classés en tant que membres de la sous-classe « domaine », tels que cadre, champ, domaine, secteur (Jacques/Tutin 2018, 45).
4.1.2 Notre classement Toutefois, les classes et sous-classes sémantiques présentées plus haut conviennent davantage au Traitement Automatique des Langues qu’à un usage didactique. La recherche onomasiologique existante semble complexe, car les concepts sont abstraits pour un utilisateur sans formation préalable. Prenons un exemple : la classe sémantique « ancrage-construction » comporte des lexies « servant à la construction du modèle d’analyse : problématique, hypothèses, conceptualisation, définition, réflexion, références », mais cette définition n’est pas suffisamment transparente pour des apprenants. Il faudra simplifier le métalangage en employant des étiquettes notionnelles plus intuitives, éprouvées à partir d’expérimentations auprès des usagers visés. À côté d’un accès plus rhétorique, que nous examinerons ci-dessous, il nous paraît toutefois tout à fait pertinent d’intégrer des aspects davantage notionnels, liés à l’ontologie de la démarche scientifique, à la façon du modèle proposé par
114
Jingrao Li, Agnès Tutin
Pecman (2004). Ces notions apparaissent à la fois utiles pour maîtriser le lexique de la science, mais aussi pour comprendre le fonctionnement de la démarche scientifique, qui reste difficile à appréhender pour des apprentis chercheurs, aussi bien francophones qu’allophones. Par exemple, il apparaîtra important de comprendre qu’il existe plusieurs types d’approches, qualitative/quantitative/ comparative/théorique/empirique/descriptive (cf. Figure 4). En s’appropriant le lexique, principalement les mots simples, les locutions et un sous-ensemble de collocations, les apprentis chercheurs apprennent également à maîtriser les notions d’une démarche scientifique.
Figure 4 : Un exemple d’accès onomasiologique notionnel.
À côté des aspects notionnels, liés à l’ontologie du domaine, il apparaît utile d’intégrer les fonctions discursives et rhétoriques qui servent à structurer le texte, commenter le propos ou introduire un point de vue. Plusieurs entreprises lexicographiques en anglais, français et espagnol proposent un accès de ce type par des fonctions discursives (Granger/Paquot 2015 ; Alonso Ramos et al. 2017 ; Davis/Morley 2018) comme les suivantes : introduire le sujet, indiquer l’organisation du texte, contraster, donner des exemples, présenter les conclusions. Ces fonctions paraissent souvent plus intuitives que les étiquettes notionnelles vues plus haut. Prenons l’exemple de l’Academic Phrasebank (Davis/Morley 2018), qui est une ressource largement utilisée en anglais, d’un accès très immédiat. Les données sont y organisées en fonction des parties du discours scientifique (introduction, méthodologie, résultats, conclusion…) et des fonctions discursives (être prudent, être critique, comparer et contraster, donner des exemples…). Les fonctions sont accompagnées de paragraphes d’explication. Cette ressource est bien structurée et les utilisateurs arrivent
Quels traitements pour la phraséologie scientifique
115
aux informations souhaitées assez rapidement, bien que les dénominations soient parfois un peu opaques. Dans la base ARTES (Pecman 2018), les fonctions discursives sont organisées d’une manière hiérarchique. Par exemple, dans le classement des fonctions discursives, on relève : « annoncer les grandes lignes de son étude », « décrire les conditions dans lesquelles la recherche est réalisée », « exprimer son point de vue… ». Les dénominations des fonctions discursives sont claires pour les apprenants. Si l’on choisit « annoncer les grandes lignes de son étude » et que l’on clique sur « rechercher », nous obtiendrons les sous-types comme « évoquer le sujet de son étude », « présenter les objectifs de recherche », « évoquer son positionnement ou le contexte théorique dans lequel s’inscrit le travail ». En cliquant sur « évoquer le sujet de son étude », nous avons les expressions comme le présent article examine…, une étude porte sur qch, donner un aperçu de…. Par rapport aux fonctions discursives utilisées dans l’Academic Phrasebank, l’organisation hiérarchique et la dénomination explicite des fonctions dans ARTES semblent plus pratiques pour les apprenants. Nous nous inspirerons de cette structure dans l’organisation de la ressource LST-SHS, qui intègrera dans cette optique des lexies simples (principalement des adverbiaux à fonction discursive), des collocations et des routines. Un exemple de traitement envisagé pour la structuration textuelle apparaît dans la Figure 5. Structurer le texte Annoncer le plan Transition entre les parties Conclure ....
Conclure pour conclure en conclusion en guise de conclusion nous pouvons conclure...
Figure 5 : Un exemple d’accès onomasiologique à fonction rhétorique.
116
Jingrao Li, Agnès Tutin
4.2 Un accès sémasiologique avec des liens lexicaux La recherche du mot ou de l’expression justes passe aussi par la vérification d’une expression choisie par l’utilisateur. L’apprenti chercheur pourra ainsi chercher à vérifier que l’expression qu’il emploie est bien attestée dans la base lexicale. Par exemple, une association peu naturelle, typique des « erreurs » lexicales produites par les étudiants non-natifs (Yan 2017) comme faire une étude n’apparaît pas dans la base du LST. En revanche, la recherche de collocations autour du nom étude permettra d’identifier des expressions synonymes plus adaptées comme mener une étude ou procéder à une étude. L’observation de la fréquence de l’expression et les exemples associés faciliteront ensuite la sélection de la collocation par l’apprenti chercheur. D’une manière générale, les associations lexicales paradigmatiques et syntagmatiques apparaissent essentielles dans une optique d’aide à la rédaction. Les relations paradigmatiques relient des unités lexicales qui n’apparaissent pas en cooccurrence immédiate, comme la relation de synonymie. Les relations syntagmatiques relient des lexies apparaissant en relation de cooccurrence, comme des collocations. Ces éléments sont particulièrement importants pour répondre aux besoins rédactionnels des apprentis chercheurs, en particulier pour les étudiants non natifs, comme on le verra en 4.3. Dans cette perspective, une ressource a été élaborée pour la langue générale par deux chercheuses canadiennes, Hamel/Caws (2010) : Dire Autrement est un dictionnaire de reformulation pour les apprenants de français langue seconde. Il vise à améliorer la capacité des étudiants à reformuler le discours pour, d’une part, éviter des répétitions lexicales gênantes, et d’autre part, favoriser l’acquisition de liens de paraphrase et leur réutilisation dans des contextes comparables. Ce dictionnaire est organisé autour de trois types de relations lexicales : des liens de collocations (comme faire une hypothèse, remplir les exigences), des liens paradigmatiques (la relation de synonymie, d’antonymie, de nominalisation...) et des liens de paraphrase (ex : Paul respecte Pierre et Paul éprouve du respect pour Pierre, Hamel/Milićević 2007, 28). L’idée que les unités lexicales entretiennent des relations et constituent une forme de réseau nous intéresse et permet d’envisager le lexique scientifique comme un ensemble structuré. Dans Hamel/Caws (2010), l’organisation des liens de collocations et de dérivé sémantique fait appel aux Fonctions Lexicales, par exemple, Magn (faim) = de loup, S0 (analyser) = analyse. Cependant, les fonctions lexicales semblent destinées aux linguistes et difficiles à comprendre pour le grand public, en particulier pour les Fonctions Lexicales syntagmatiques (associées aux collocations). C’est pour cela que dans notre projet nous avons proposé d’utiliser des étiquettes spécifiques plus simples pour coder les collocations (Tutin/Lareau 2020), comme le montrent quelques exemples de la base LST dans le Tableau 4.
Quels traitements pour la phraséologie scientifique
117
Tableau 4 : Traitement des associations lexicales syntagmatiques dans la base LST. Collocations du LST
Fonction Lexicale
Étiquette sémantique
apporter une réponse approche comparative approche conceptuelle approche qualitative argument principal article de revue associer étroitement assumer le rôle assumer pleinement assurer une fonction
Real
Parvenir Type Type Type essentiel/important Type Fortement avoir fortement avoir
Import Magn Oper Magn Oper
Dans ce cadre, le nom des fonctions lexicales a été simplifié dans des étiquettes plus parlantes (Magn → fortement, Oper1 → avoir, …). Par ailleurs, d’autres associations spécifiques ont été créées, comme « type » qui renvoie à des types de concepts (une approche comparative est un type d’approche) qui servent à introduire des sortes d’hyponymes.4 À peu près 40% des collocations peuvent être codées par ces étiquettes sémantiques et parmi celles-ci, les plus fréquentes sont comme dans la langue générale les notions d’intensité (Magn) et de verbe support (Oper1). Pour l’aide à la rédaction, il faudra évaluer la faisabilité de l’utilisation de ces étiquettes sémantiques, mais un emploi assez transparent pour l’utilisateur peut être opéré, en utilisant la même étiquette sémantique pour créer une analogie.
Expression entrée approche qualitative
Expression entrée question centrale
Même étiquette « type »
Même étiquette « import »
méthode qualitative recherche qualitative analyse qualitative
question cruciale question essentielle question fondamentale
Figure 6 : Recherche d’expressions synonymes à travers les étiquettes sémantiques des FL syntagmatiques.
Des étiquettes comme « Type » sont plus génériques que celles qui correspondent à des Fonctions Lexicales standard (comme « Magn »). Elles apparaissent utiles pour le classement des notions scientifiques.
118
Jingrao Li, Agnès Tutin
Ainsi, si l’utilisateur saisit les expressions approche qualitative ou question centrale, il pourra obtenir des synonymes des expressions par l’intermédiaire des étiquettes sémantiques comparables. Il sera aussi bien entendu utile de présenter les collocations par structure syntaxique, comme cela apparaît au Tableau 2 et ainsi que cela est effectué classiquement dans les dictionnaires de collocations comme le Dictionnaire des Combinaisons de mots (Le Fur 2007). Enfin, il sera utile de développer les relations paradigmatiques entre les unités lexicales, et outre les relations classiques de synonymie ou d’antonymie, d’intégrer des relations morpho-syntaxiques comme les nominalisations (analyser → analyse) ou les dérivations adjectivales (contradiction → contradictoire). Un élément essentiel à tous ces niveaux sera de proposer des exemples attestés dans les corpus, un peu à la façon d’outils d’aide à la rédaction commerciaux comme Antidote ou le Robert Correcteur, dont l’ergonomie est tout à fait remarquable.
4.3 Un accès par la traduction 4.3.1 Une enquête pour identifier les besoins rédactionnels auprès des étudiants sinophones L’objectif de notre base est de proposer un accès en autonomie facilitant l’écriture scientifique dans le domaine des sciences humaines. À côté des accès onomasiologiques et sémasiologiques en français, nous prévoyons également la possibilité de passer par une étape de traduction, en particulier pour les étudiants sinophones. Les étudiants chinois forment la troisième communauté des étudiants étrangers en France derrière les Marocains et les Algériens,5 ce qui nous incite à réfléchir sur les moyens d’adapter cette ressource aux besoins spécifiques de ce public. Nous concevons une adaptation de la ressource pour le chinois, en l’enrichissant par un accès sémasiologique en chinois. Avant d’entreprendre ce travail, nous avons effectué une enquête auprès d’un ensemble d’étudiants chinois pour sonder leurs besoins, et nous avons élaboré un questionnaire pour évaluer l’utilité de la traduction. 26 étudiants en sciences humaines (droit, information et communication, linguistique, FLE…) ont répondu au questionnaire. 8 sont en doctorat, 12 en master et 6 en licence, et tous ont un niveau de français B2 ou plus selon le CECR (Cadre européen commun de référence pour les langues).
Source : MESRI-SIES (2019).
Quels traitements pour la phraséologie scientifique
119
Les résultats de notre enquête montrent que tous les étudiants sont confrontés à des difficultés lorsqu’il faut choisir les lexies appropriées et employer les connecteurs logiques et les phrases d’articulation adéquats pour assurer la cohérence du texte dans les rédactions académiques. Presque tous sont préoccupés par la répétition des formulations (94 % toujours ou très souvent). En ce qui concerne les habitudes rédactionnelles, 80 % des étudiants ont l’habitude d’organiser les idées en chinois pendant la rédaction et 95 % recourent aux dictionnaires bilingues et aux traducteurs automatiques comme outils d’aide à la rédaction (principalement, 法语助手 (fǎ yǔ zhù shǒu),6 Google translate et Deepl). Les réponses concernant la question de la traduction se révèlent intéressantes. 86.5 % des étudiants pensent en effet que la traduction les aide à identifier les informations souhaitées, mais nous avons observé des nuances dans leurs attentes. Les étudiants débutants en rédaction scientifique tirent profit d’une traduction directe, mais les étudiants plus avancés cherchent avant tout à diversifier leur vocabulaire et à éviter les répétitions (au moins la moitié des étudiants). Pour ces derniers, la navigation dans la base à travers les accès onomasiologiques et sémasiologiques présentés dans les sections précédentes sera particulièrement utile. Dans notre questionnaire, un test lexical a été réalisé et il a été demandé aux étudiants de choisir parmi les collocations proposées celles qui peuvent exprimer un sens donné. Suite à l’analyse des réponses produites, nous constatons qu’ils distinguent difficilement le lexique général du lexique scientifique transdisciplinaire et que leur répertoire lexical est relativement restreint. Par exemple, plusieurs étudiants estiment que les expressions faire une étude, s’appuyer grandement sur, changer beaucoup, proposer des opinions sont pertinentes, alors qu’elles sont peu spécifiques du genre des écrits scientifiques. En revanche, évoquer une hypothèse ou changer sensiblement sont peu reconnus par les apprenants. Cela confirme les difficultés éprouvées par les étudiants pour reconnaître et produire les collocations adaptées, comme analysé par Yan (2017). Cette chercheuse observe en particulier que les erreurs collocationnelles commises par ces apprenants concernent souvent l’emploi de noms imprécis comme chose (cf. exemple 1), ou des collocatifs inappropriés (cf. exemple 2) : (1)
Cependant, au fur et à mesure du développement de la relation entre la linguistique et la théorie de la traduction, on commence à croire qu’il n’y a que la linguistique qui pourra décrire et expliquer un flot de choses dans la traduction. (Correction proposée : décrire et expliquer tous les éléments qui interviennent dans la traduction) (Yan 2017, 231).
(2)
Nous essayons quand même de proposer un peu d’opinions sur les problèmes discutable (sic) dans le domaine de traduction. (Correction proposée : Nous essayons égale-
Un dictionnaire franco-chinois en ligne largement utilisé par les apprenants sinophones du français en Chine.
120
Jingrao Li, Agnès Tutin
ment de donner nos opinions sur certains sujets à discussion dans le domaine de traduction) (Yan 2017, 231).
En somme, ce questionnaire révèle la pertinence de l’étude du lexique scientifique transdisciplinaire et l’intérêt d’un accès par la traduction en chinois. Il nous permet aussi d’entrevoir les préoccupations principales des apprenants dans la rédaction sur le plan lexical : la répétition, la distinction entre le lexique général et le lexique scientifique, et le besoin d’acquérir les éléments phraséologiques. L’accès par la traduction en chinois s’avère également bénéfique pour éviter la répétition et identifier les bonnes collocations. Nous allons le montrer dans la partie suivante.
4.3.2 Une base bilingue français-chinois Nous inspirant du dictionnaire LEAD (Louvain English for Academic Purposes Dictionary, Granger/Paquot 2015) qui permet aux apprenants de choisir leur langue maternelle et obtenir les résultats dans cette langue, nous souhaitons offrir un accès sémasiologique à la phraséologie par la traduction en chinois, avec un traitement différencié entre les collocations et les locutions. Dans cette perspective, l’accès aux collocations et aux routines passera par la traduction des lexies simples, tandis que les locutions, traitées comme les lexies simples (voir la partie 3), seront directement accessibles à partir de la traduction. 4.3.2.1 Méthodologie de la traduction Pour mettre en place cette base bilingue, nous avons effectué un travail de traduction des 1297 lexies simples du LST-SHS (noms, verbes, adjectifs et adverbes)7 vers le chinois. À cette fin, nous avons utilisé un sous-corpus scientifique du BCC (BLCU Corpus Center),8 ainsi qu’une liste du lexique scientifique chinois (Xue 2017) pour vérifier la traduction du LST-SHS. L’intérêt pour le LST du chinois se développe, car de plus en plus d’étudiants étrangers viennent étudier en Chine ces dernières années, et leur besoin rédactionnel dans le domaine des écrits scientifiques en chinois attire l’attention des didacticiens du chinois langue étrangère. Ainsi, plusieurs travaux de recherche sur ce sujet ont été menés récemment (Gao/
La traduction des locutions (par exemple, étude de cas, mettre en exergue) est en cours. BCC : « BLCU Corpus Center » est une base de données en chinois développée par l’université de Langue et de Culture de Pékin (BLCU). Elle inclut les sous-corpus des journaux, des textes littéraires, des blogs, des textes scientifiques et des textes en chinois classique. Pour la validation de la traduction, nous avons recouru à son sous-corpus composé des écrits scientifiques (480 millions mots). Site du sous-corpus scientifique : http://bcc.blcu.edu.cn/customize [dernière consultation : 18.11.2021].
Quels traitements pour la phraséologie scientifique
121
Liu 2016 ; Li et al. 2020), essentiellement sur l’analyse des besoins rédactionnels ou sur l’importance de l’enseignement des écrits scientifiques. Peu d’études abordent précisément l’aspect lexical, hormis les travaux de Huang/Xue (2018) qui analysent les caractéristiques linguistiques du lexique scientifique chinois, et le mémoire de Xue (2017) qui a débouché sur une liste du lexique scientifique chinois dans le domaine de la linguistique. Cette dernière liste comporte 5187 unités lexicales issues d’un corpus de 2.5 millions de mots composé d'articles de recherches en linguistique chinoise, intégrant des lexies simples, des collocations et des locutions, comme 结构 (jié gòu : ‘structure’), 认为 (rèn wéi : ‘estimer’), 结果表明 (jié guǒ biǎo míng : ‘les résultats montrent que…’), 事实上 (shì shí shàng : ‘en fait’), 一般来说 (yì bān lái shuō : ‘de façon générale’). Cette liste est pour nous un premier point de référence pour vérifier la traduction, bien que cette ressource soit limitée au domaine de la linguistique et qu’elle comporte surtout des lexies simples. Dans la ressource française du LST-SHS, chaque mot est accompagné d’exemples en corpus, ce qui nous permet d’effectuer la traduction des exemples en chinois pour identifier le mot équivalent. La traduction est tout d’abord observée dans des outils comme Deepl et Linguee, et vérifiée par deux linguistes natives chinoises à partir d’observations effectuées dans un sous-corpus scientifique du BCC. La traduction est validée si elle apparaît au moins trois fois dans les domaines des sciences humaines et sociales du sous-corpus scientifique du BCC. Nous avons aussi vérifié la présence des traductions dans la liste du lexique scientifique chinois développé par Xue (2017). Le Tableau 5 présente quelques exemples des traductions effectuées. Pour faciliter l’accès aux lexies du français, des commentaires pédagogiques sont introduits. Ce sont des points d’attention pour la didactique du lexique français, comme les nuances entre les synonymes et les connotations. Par exemple, pour la ligne 1, quand nous cherchons en chinois 决定 (jué dìng), nous obtiendrons conditionner et déterminer, qui présentent des différences sémantiques qu’il sera utile d’indiquer aux apprenants dans ces commentaires pédagogiques (cf. Tableau 5). Les explications aident l’apprenant à choisir le mot correspondant, ce qui lui permettra d’accéder aux collocations adéquates à travers le mot simple. Par exemple, l’apprenant choisira d’abord déterminer pour obtenir dans un second temps la collocation déterminer la valeur. Quand un mot en français a plusieurs traductions en chinois, nous proposons la traduction la plus fréquente, en indiquant le nombre d’occurrences dans le corpus BCC et dans la liste du lexique scientifique chinois de Xue, ainsi qu’un exemple en chinois. Nous indiquons les autres traductions possibles dans la colonne « synonyme », de façon à proposer un accès multiple à partir du chinois à la base LST-SHS. Les accès par synonymes renverront à la traduction modèle avec les informations qui l’accompagnent.
考虑 (到)
决定... (是...的 条件)
Présence dans la liste du lexique scientifique chinois de Xue () Exemple en chinois correspondant
Oui 考虑到许多变量的 Fréquence : 复杂模型确实很难 构建
Oui 规则的正确性决定 Fréquence : 着其结果的有效性
Mot en Nombre chinois d’occurrences dans BCC
Prendre en considération (Verbe)
Conditionner (Verbe)
Equivalent LST en français
Commentaires pédagogiques
Des modèles complexes prenant en considération de nombreuses variables sont en effet difficiles à construire
La justesse des règles À distinguer de conditionne la validité du résultat déterminer : A conditionne B : A est une condition importante de la réalisation de B. A détermine B : A agit comme la cause directe d’un événement B, le provoquer, le décider
Exemple en français extrait du LST
Tableau 5 : Des exemples de traduction du lexique scientifique transdisciplinaire en chinois.
决定着... 制约...
Synonymes
122 Jingrao Li, Agnès Tutin
Non
Non
在其他 条件相 同的情 况下
总而言 之
总而言之, 刚才关 于这些差异的讨论 不应停留在学术思 考的层面
在其他条件相同的 情况下, 当企业将 经济影响纳入其决 定中时, 就会鼓励 技术多样性 Pour conclure Le débat qui vient d’être mené à (ADV) propos de ces différences, pour conclure, ne doit pas en rester au niveau de la réflexion académique
Toutes choses Toutes choses égales par égales par ailleurs, la diversité technologique ailleurs (ADV) est encouragée lorsque les firmes incorporent les conséquences économiques dans leurs décisions d’adoption
Quels traitements pour la phraséologie scientifique
123
124
Jingrao Li, Agnès Tutin
4.3.2.2 L’accès aux locutions et aux collocations par la traduction Comme nous l’avons évoqué précédemment, les locutions du français sont traitées comme les lexies simples. Si l’utilisateur cherche à exprimer le sens 再次 (zài cì : ‘encore une fois’), il obtiendra plusieurs locutions : une_nouvelle_fois, une_fois_de_plus, à_nouveau, dont il pourra obtenir la description détaillée (définition, classe sémantique, les autres traductions possibles en chinois, les exemples du corpus en français et traduits en chinois, ainsi que les mots de la même sousclasse sémantique). En ce qui concerne les collocations, elles sont accessibles dans notre ressource sous l’entrée de la base, comme dans le dictionnaire phraséologique HARTAS (Alonso Ramos 2001). Dans notre cas, l’accès aux collocations en français passe par la traduction des lexies simples. Par exemple, si on cherche à exprimer le sens de 极大改变 (jí dà gǎi biàn : ‘changer d’une façon importante’), on peut taper le verbe 改变 (gǎi biàn : ‘changer’) en chinois et clique sur « rechercher ». Nous obtiendrons les équivalents en français du verbe 改变 (gǎi biàn : ‘changer’) : modifier, varier et transformer. On pourra sélectionner le verbe le mieux adapté en examinant les propriétés syntaxiques et sémantiques (types d’agent) et consultant les définitions correspondantes (cf. Figure 7). Si l’on sélectionne le deuxième sens du verbe modifier, nous arriverons sur la Figure 8, avec la glose du verbe, sa classe sémantique, et les exemples tirés du corpus. En cliquant sur ‘collocation’, nous accèderons aux collocations significatives, comme modifier sensiblement.
Figure 7 : L’exemple d’accès aux collocations par la traduction (1).
Quels traitements pour la phraséologie scientifique
125
Figure 8 : L’exemple d’accès aux collocations par la traduction (2).
Comme nous pouvons le constater, dans la ressource du LST-SHS, à travers la recherche par la traduction en chinois, nous pouvons offrir plusieurs possibilités pour exprimer le même sens – dans la mesure où la lexie chinoise peut se traduire par plusieurs équivalents français, ce qui pourra permettre aux apprenants de varier leurs formulations. Cependant, la traduction de l’ensemble des ressources phraséologiques, surtout pour les collocations et les routines, n’est pas envisageable à court terme pour trois raisons : du point de vue linguistique, une telle base bilingue françaischinois incluant la phraséologie serait particulièrement utile, mais le manque de corpus bilingues alignés français-chinois dans le domaine du discours scientifique rend cette tâche difficile à envisager. Du point de vue didactique, même si la langue maternelle joue un rôle important dans l’apprentissage, il apparaît préférable de s’approprier directement les éléments phraséologiques en langue cible (GonzálezRey 2017, Cavalla 2018), car ces éléments, avec une faible compositionnalité, ne sont pas toujours équivalents dans les deux langues. Enfin, d’un point de vue pratique, il existe plus d’un millier de collocations dans la ressource LST-SHS, dont la traduction impliquerait un important travail manuel.
126
Jingrao Li, Agnès Tutin
5 Conclusion Conçue comme une aide à la rédaction utilisable en autonomie, la base du lexique scientifique transdisciplinaire LST-SHS est appelée à s’enrichir de plusieurs accès complémentaires pour les utilisateurs : a) un accès par notions, renvoyant aux grands domaines de l’activité scientifique, et par fonctions rhétoriques et discursives, b) un accès sémasiologique, incluant des relations lexicales syntagmatiques et paradigmatiques ; c) un accès par la traduction, prévu pour des utilisateurs sinophones, particulièrement demandeurs de ce type d’approche, surtout lorsqu’ils sont de niveau intermédiaire. Cette dernière approche rejoint la tendance dans les ressources lexicographiques d’aide à la rédaction à prendre en compte la traduction et la langue maternelle des utilisateurs (cf. projets LEAD et ARTES), ce qui paraît adapté à leurs besoins. Outre l’intérêt didactique, ce travail de traduction permettra de mener des études contrastives sur le lexique scientifique en chinois et en français et sera une ressource utile pour les applications de traduction. La base constituée devra également prendre en compte d’autres éléments essentiels pour les usagers, comme la fréquence de l’expression et la possibilité d’accéder à des exemples variés au-delà des exemples déjà sélectionnés, à partir d’un système de traitement de corpus comme le Lexicoscope (Kraif 2016). Il sera également pertinent de proposer aux utilisateurs de stocker leur historique de recherche, de façon leur permettre de revenir sur les notions explorées. Enfin, à l’instar de Hamel/Caws (2010), nous pensons qu’il est essentiel, pour mieux comprendre les interactions apprenant-tâche-outil, d’effectuer des tests auprès des usagers. Hamel (idem) a ainsi effectué des expériences d’utilisation des apprenants en analysant le temps et les efforts consacrés à la tâche de consultation des outils, ainsi que ce que les apprenants en retirent. Par rapport aux questionnaires ou entretiens avec des utilisateurs, l’observation directe sur la façon d’employer la ressource permet de mieux corréler la tâche, le comportement (ce que font les apprenants) et la performance (ce qui est enseigné/appris, si l’apprenant atteint son objectif de recherche ou non) (Raby 2005). Notre prochaine étape sera donc de construire un prototype de la ressource LST-SHS à partir des pistes mentionnées dans ce chapitre et de le tester sur le terrain avant l’élaboration de la ressource définitive.
Quels traitements pour la phraséologie scientifique
127
Bibliographie Ackermann, Kirsten/Chen, Yu-Hua, Developing the academic collocation list (ACL). A corpus-driven and expert-judged approach, Journal of English for academic purposes 12:4 (2013), 235–247. Alonso Ramos, Margarita, Construction d'une base de données des collocations bilingue françaisespagnol, Langages 143 (2001), 5–27. Alonso Ramos, Margarita/García-Salido, Marcos/Garcia, Marcos, Exploiting a corpus to compile a lexical resource for academic writing. Spanish lexical combinations, in: Iztok, Kosem/Tiberius, Carole/Jakubíček, Miloš/Kallas, Jelena/Krek, Simon/Baisa, Vít (edd.), Proceedings of 2017 eLex conference, Brno, Lexical Computing CZ s.r.o., 2017, 571–586. Bally, Charles, Traité de stylistique française, vol. 1, Paris, Klincksieck, 1909. Biber, Douglas, University language. A corpus-based study of spoken and written registers, Amsterdam/ Philadelphia, John Benjamins, 2006. Biber, Douglas/Conrad, Susan/Cortes, Viviana, If you look at… Lexical bundles in university teaching and textbooks, Applied linguistics 25:3 (2004), 371–405. Biber, Douglas/Gray, Bethany, Challenging stereotypes about academic writing. Complexity, elaboration, explicitness, Journal of English for academic purposes 9:1 (2010), 2–20. Coulmas, Florian (ed.), Conversational routine. Explorations in standardized communication situations and prepatterned speech, The Hague, Mouton, 1981. Coxhead, Averil, A new academic word list, TESOL Quarterly 34:2 (2000), 213–238. Cavalla, Cristelle, La phraséologie en classe de FLE, Les langues modernes 1 (2009). Davis, Mary/Morley, John, Facilitating learning about academic phraseology. Teaching activities for student writers, Journal of learning development in higher education, Special Edition : ALDinHE Conference (2018), https://doi.org/10.47408/jldhe.v0i0.468. Drouin, Patrick, Identification automatique du lexique scientifique transdisciplinaire, Revue française de linguistique appliquée 12:2 (2007), 45–64. Fontenelle, Thierry, Towards the construction of a collocational database for translation students, Meta. Journal des traducteurs/Meta. Translators’ journal 39:1 (1994), 47–56. Gao, Zengxia/Liu, Fuying, 论学术汉语在对外汉语教学中的重要性,云南师范大学学报 14:2 (2016), 44–51. Gledhill, Christopher, Collocations in science writing, Tübingen, Gunter Narr Verlag, 2000. González-Rey, Isabel, PHRASÉOTEXT – Le français idiomatique. Une méthode d’enseignementapprentissage en phraséodidactique du FLE, in : Soutet, Olivier/Sfar, Inès/Mejri, Salah (edd.), La phraséologie. Théories et applications, Paris, Éditions Honoré Champion, 2017, 299–316. Granger, Sylviane/Paquot, Magali, Customising a general EAP dictionary to meet learner needs, in : Paquot, Magali/Granger, Sylviane (edd.), Proceedings of eLexicography in the 21st century. New challenges, new applications, Louvain, Presses Universitaires de Louvain, 2010, 87–96. Granger, Sylviane/Paquot, Magali, Electronic lexicography goes local. Design and structures of a needsdriven online academic writing aid, Lexicographica 31:1 (2015), 118–141. Hamel, Marie-Josée/Milićević, Jasmina, Analyse d’erreurs lexicales d’apprenants du FLS. Démarche empirique pour l’élaboration d’un dictionnaire d’apprentissage, Revue canadienne de linguistique appliquée 10 (2007), 25–45. Hamel, Marie-Josée/Catherine, Caws, Usability tests in CALL Development. Pilot Studies in the context of the Dire autrement and Francotoile projects, CALICO Journal 27:3 (2010), 491–504. Hatier, Sylvain/Augustyn, Magdalena/Tran, Hoai/Yan, Rui/Tutin, Agnès/Jacques, Marie-Paule, French cross-disciplinary scientific lexicon extraction and linguistic analysis, in: Tinatin, Margalitadze/
128
Jingrao Li, Agnès Tutin
George, Meladze (edd.), Proceedings of the XVII Euralex international congress. Lexicography & linguistic diversity, Tbilissi, Ivane Javakhishvili Tbilisi State University, 2016, 355–366. Hatier, Sylvain, Identification et analyse linguistique du lexique scientifique transdisciplinaire. Approche fouillée sur corpus d’article de recherche en SHS, Thèse de doctorat, Université Grenoble Alpes, 2016. Huang, Qiqing/Xue, Lei,汉语国际教育视角下的学术汉语词汇特点研究, 第十三届国际汉语教学研 讨会论文选 13 (2018), 20–29. Hyland, Ken, Metadiscourse. Exploring interaction in writing, New York, Bloomsbury Publishing, 2005. Jacques, Marie-Paule/Tutin, Agnès (edd.), Lexique transversal et formules discursives des sciences humaines, Londres, ISTE Editions, 2018. Jacquey, Evelyne/Kister, Laurence/Marcon, Mario/Barreaux, Sabine, Termes complexes et langues de spécialité en sciences humaines et sociales. Que nous apprennent les textes intégraux ?, Meta. Journal des traducteurs/Meta. Translators’ journal 63:1 (2018), 7–29. Ji Yujing, Les routines de guidage du lecteur dans les articles de recherche en SHS, in : Luodonpää-Manni, Milla/Grossmann Francis/Tutin Agnès (edd.), Les routines discursives dans le discours scientifique oral et écrit, Grenoble, UGA éditions, 2022. Ji, Yujing/Tutin, Agnès, Les routines métalinguistiques dans les écrits scientifiques en français, Studii de lingvistica 9:2 (2019), 177–200. Klein, Jean René/Lamiroy, Béatrice, Routines conversationnelles et figement, in : Anscombre, Jean Claude/Mejri, Salah (edd.), Le figement linguistique. La parole entravée, Paris, Champion, 2011, 195–214. Kraif, Olivier, Le lexicoscope. Un outil d’extraction des séquences phraséologiques basé sur des corpus arborés, Cahiers de lexicologie 108 (2016), 91–106. Le Fur, Dominique (ed.), Dictionnaire des combinaisons de mots. Les synonymes en contexte, Paris, Le Robert, 2007. Li, Haiyan/Zhang, Wenxian/Xin, Ping, 本科留学生学术汉语写作课需求调查与课程建设——以北京 大学本科留学生学术汉语写作通选课为例,国际汉语教学(中英文)5:1 (2020), 51–60. Mel’čuk, Igor, Clichés and pragmatemes, Neophilologica 32 (2020), 9–20. Mel’čuk, Igor, Tout ce que nous voulions savoir sur les phrasèmes, mais..., Cahiers de lexicologie 102 (2013), 129–149. Mel’čuk, Igor/Clas, André/Polguère, Alain, Introduction à la lexicologie explicative et combinatoire, Louvain-la-Neuve, Duculot, 1995. Paquot, Magali, Academic vocabulary in learner writing. From extraction to analysis. Research in corpus and discourse, London, Bloomsbury Publishing, 2010. Pecman, Mojca, Phraséologie contrastive anglais-français. Analyse et traitement en vue de l’aide à la rédaction scientifique, Thèse de doctorat, Université Nice Sophia Antipolis, 2004. Pecman, Mojca, Approche onomasiologique de la langue scientifique générale, Revue française de linguistique appliquée 12:2 (2007), 79–96. Pecman, Mojca, Langue et construction de connaisSENSes. Energie lexico-discursive et potentiel sémiotique des sciences, Paris, L’Harmattan, 2018. Phal André, Vocabulaire général d’orientation scientifique, VGOS. Part du lexique commun dans l’expression scientifique, Paris, Didier, 1972. Raby, Françoise, A user-centered ergonomic approach to CALL research, in : L. Egbert, Joy/Petrie, GinaMikel (edd.), CALL research perspectives, Hillsdale (NJ), Lawrence Erlbaum, 2005, 179–190. Siepmann, Dirk, Collocations et dictionnaires d'apprentissage onomasiologiques bilingues. Questions aux théoriciens et pistes pour l'avenir, Langue française 150 (2006), 99–117.
Quels traitements pour la phraséologie scientifique
129
Swales, John, Genre analysis. English in academic and research settings, Cambridge, Cambridge University Press, 1990. Tutin, Agnès, Traitement sémantique par analyse distributionnelle des noms transdisciplinaires des écrits scientifiques, Actes de TALN, Toulouse, 5–8 juin 2007. Tutin, Agnès/Ji, Yujing, Comment modéliser les routines sémantico-rhétoriques dans le discours scientifique ?, in : Luodonpää-Manni, Milla/Grossmann, Francis/Tutin, Agnès (edd.), Les routines discursives dans le discours scientifique oral et écrit, Grenoble, UGA éditions, 2022. Tutin, Agnès, Les expressions polylexicales transdisciplinaires dans les articles de recherche en sciences humaines. Retour d’expérience, in : Jacques, Marie-Paule/Tutin, Agnès (edd.), Lexique transversal et formules discursives des sciences humaines, Londres, ISTE Editions, 2018, 73–89. Tutin, Agnès/Lareau, François, Fonctions lexicales et collocations transdisciplinaires du discours scientifique des sciences humaines, Colloque Radelas, 20–21 février 2020, Grenoble. Xue, Lei, 基于汉语语言学论文语料库的学术汉语词汇析取及特征研究, Mémoire de master, Université Normale de Yunnan, 2017. Yan, Rui, Étude des constructions verbales scientifiques dans une perspective didactique. Utilisation des corpus dans le diagnostic des besoins langagiers en FLE à l'aide des techniques de TAL, Thèse de doctorat, Université Grenoble Alpes (ComUE), 2017. Yan, Rui/Tran, Thi Thu Hoai/Cavalla, Cristelle, Un corpus pour l’enseignement des routines langagières en FLE, Études en didactique des langues 31 (2019), 93–108.
Daniela Liliana Dincă, Chiara Preite
Présence et traitement des collocations verbales dans les vocabulaires juridiques français Résumé : Dans cet article, nous voulons apporter quelques éléments de réflexion sur le traitement des phrasèmes de type collocation verbale dans les vocabulaires juridiques français formés autour de deux classes d’objet : [action, poursuite, procès, recours] et [plainte, réclamation, requête, réquisitoire] que nous avons inventoriées dans trois ouvrages lexicographiques français : la seconde édition du Vocabulaire du juriste débutant (Lerat 2017a), le Dictionnaire phraséologique plurilingue du droit (Lerat 2017b), ainsi que le Dictionnaire des cooccurrences (Beauchesne 2001). À partir de ce corpus, nous nous proposons de répertorier, par comparaison, les collocations verbales recensées dans les trois vocabulaires juridiques français afin de souligner l’utilité d’un futur ouvrage lexicographique dédié exclusivement aux collocations verbales. En fin de compte, nous soulignons l’idée que l’intérêt pour l’analyse lexicographique des collocations verbales se justifie pleinement par son prolongement dans des domaines connexes comme la traduction juridique ou la pédagogie des langues spécialisées, notamment la langue du droit. Mots-clés : phrasème, collocation verbale, classes d’objets, verbe terminologique, vocabulaire juridique Abstract: This paper is intended to provide insights into the treatment of verbal collocations in French legal vocabularies, formed around two classes of objects : [action, prosecution, trial, recourse] and [complaint, claim, request, indictment] that we have inventoried in three French lexicographical works : the second edition of Vocabulaire du juriste débutant (Lerat 2017a), Dictionnaire phraséologique plurilingue du droit (Lerat 2017b), and Dictionnaire des cooccurrences (Beauchesne 2001). Based on this corpus, we propose to list, by comparison, the verbal collocations encountered in the three French legal vocabularies, in order to highlight the usefulness of a future lexicographic work dedicated exclusively to verbal collocations. Ultimately, we emphasize the fact that the interest in the lexicographical analysis of verbal collocations is fully justified by its extension to related fields such as legal translation or the teaching methodology of specialized languages, namely of legal language.
https://doi.org/10.1515/9783110749854-008
132
Daniela Liliana Dincă, Chiara Preite
Keywords: phraseme, verbal collocation, object classes, verb terminology, legal vocabulary
1 Introduction L’exigence d’introduire les collocations verbales dans les ouvrages lexicographiques spécialisés est ressentie de manière pressante depuis longtemps,1 surtout pour ce qui est du choix et du placement des éléments à retenir dans un ordre préétabli. C’est d’ailleurs l’argument qui soutient l’idée que l’étude des unités phraséologiques dans leur dimension lexicographique mérite d’être élargie au vocabulaire juridique2 en tant qu’objectif indépendant ou à des fins de traduction. Il convient de préciser que nous utilisons le terme de vocabulaire juridique dans le sens que lui donnent, entre autres, Gérard Cornu et Pierre Lerat, pour lesquels il s’agit de dictionnaires juridiques et d’ouvrages lexicographiques spécialisés, consacrés aux termes appartenant au domaine juridique. Il est également vrai que, pour Lerat (2021), « un terme n’étant rien d’autre qu’un mot appelant une définition stricte, vocabulaire juridique et terminologie juridique sont synonymes ». Le traitement que le vocabulaire spécialisé lié à une pratique professionnelle reçoit dans un dictionnaire peut donc amener à la production d’une sorte de lexicographie terminologique, voire un « premier niveau de la terminographie » (Lerat 1995, 173), dans un continuum qui se différencie pour des aspects d’ordre pragmatique plutôt que théorique.3 Nous nous intéressons donc à la terminologie juridique, telle qu’adoptée dans un vocabulaire juridique, notamment pour ce qui est de la fonction4 que ce dernier pourrait remplir dans la production active et dans la traduction des collocations verbales, rappelant que le rédacteur et le traducteur juridique se situent à mi-chemin entre la langue du droit (LD), c’est-à-dire la langue spécialisée, et la
À ce propos, voir entre autres : Pavel (1993) ; Clas (1994) ; L’Homme (1998a) ; Fuertes-Olivera et al. (2012) ; Bergenholtz/Gouws (2013) ; Orlandi/Giacomini (2016) ; Bárdosi (2017). À ce propos, voir entre autres : Groffier/Reed (1990) ; Perilli (2009) ; Forget (2014) ; Scurtu/ Dincă (2015) ; Dincă/Preite (2019). Pour une synthèse des points de vue autour des convergences et des divergences entre terminologie et lexicographie spécialisée, voir Cacchiani/Preite (2015). Bergenholtz/Tarp (1995) distinguent plusieurs fonctions qu’un ouvrage lexicographique peut remplir. Dans ce cas il s’agit de fonctions orientées à la communication (communication-oriented), qui ciblent la compétence linguistique active, comme la présence d’informations utiles pour résoudre des problèmes de réception, de production et de traduction (thème ou version) de textes. Elles s’ajoutent aux fonctions orientées à la connaissance disciplinaire (knowledge-oriented).
Présence et traitement des collocations verbales
133
langue générale (LG). Et cela pour plusieurs raisons : le verbe qui relève de la collocation verbale vient souvent de la langue générale ; le nom fait plus volontiers partie des vocabulaires spécialisés, alors que les verbes tendent à être négligés ;5 les erreurs sont souvent provoquées par la fausse impression que, si le verbe appartient à la LG, il est alors très facile à traduire. Par contre, les difficultés de traduction relèvent du fait que ces verbes assument dans la LD le rôle de cooccurrents précis pour un terme spécialisé, alors qu’ils peuvent être aussi des termes en soi. Cela en fait des « polysèmes externes », appartenant à la fois à la LG et à la LD, où ils acquièrent une « charge » spécifique, identifiable à leur contenu intellectuel, à « la part du signifié qui a un sens au regard du droit » (Cornu 1990, 93–94), laquelle reste souvent opaque et ne parvient à être saisie de la part d’un profane ou d’un traducteur non expert. Après avoir précisé le cadre théorique dans lequel nous mènerons notre analyse (§ 2), par la définition et la différenciation de concepts tels que phrasème et collocation verbale lexicale et conceptuelle dans le cadre des langues spécialisées, nous procéderons à inventorier la présence, dans trois vocabulaires, dont deux juridiques (§ 3), des collocations verbales lexicales formées autour de deux « classes d’objets » (Gross 1994 ; Le Pesant/Mathieu-Colas 1998), à savoir : action, poursuite, procès, recours et : plainte, réclamation, requête, réquisitoire. Ensuite, nous nous proposons de mettre en évidence, par comparaison, le traitement des informations lexicographiques apportées par les trois ouvrages retenus pour l’analyse des collocations verbales lexicales, avec un intérêt particulier à l’égard des verbes collocatifs. Enfin (§ 4), nous discuterons les fonctions que le recensement lexicographique des collocations verbales lexicales et conceptuelles peut remplir pour la production active d’un rédacteur et/ou d’un traducteur juridique.
2 Cadre théorique Avant de démarrer notre recherche méta-lexicographique, il convient de préciser le cadre théorique dans lequel elle se situe, en distinguant d’abord les concepts de « phrasème » et de « collocation » pour arriver ensuite à la classification des collo Il faut pourtant reconnaitre que depuis longtemps L’Homme (1998b, 69) insiste sur le fait que « les verbes spécialisés doivent […] faire l’objet d’une description lexicographique », qu’ils soient liés à une unité nominale ou pas. De même selon Lerat (2005, 62), qui adopte de nombreux verbes dans les nomenclatures de ses vocabulaires juridiques, « tout ce qui relève de la dimension syntagmatique du langage, à commencer par la construction syntaxique des verbes, des noms et des adjectifs, tend à être négligé au profit de noyaux cognitifs plus ou moins récurrents au sein de familles de mots et plus ou moins permanents à travers l’histoire ».
134
Daniela Liliana Dincă, Chiara Preite
cations verbales en deux sous-classes : « collocations lexicales » ou « collocations conceptuelles », sans oublier la terminologie utilisée dans le domaine des langues spécialisées. En premier lieu, nous essayons de retracer la relation entre le « phrasème » et la « collocation ». Pour le dire avec Mel’čuk, « un phrasème est un syntagme non libre » (2003, 6) ou « un énoncé multilexémique non libre » (2013, 136), et il en propose une distinction en trois classes majeures : « locutions », « collocations » et « clichés », les collocations se situant à mi-chemin entre les locutions et les clichés. En outre, Mel’čuk précise que la collocation6 est pour lui un « phrasème lexical compositionnel » (Mel’čuk 2013, 136), ou un semi-phrasème : « L’un de ses constituants, disons, A, est choisi librement, pour son sens ; ce constituant s’appelle la base de collocation (dans notre exemple, c’est café). L’autre constituant, c’est-à-dire B – le collocatif – est sélectionné en fonction du premier (dans notre exemple, c’est noir) » (Mel’čuk 2003, 6). Enfin, pour Tutin (2010, 1081), « la plupart des collocations sont inscrites dans un schéma prédicat-argument où le prédicat est le collocatif et l’argument la base ». C’est d’ailleurs la raison pour laquelle l’étude des collocations verbales est liée à la notion de classe d’objets, afin de rendre compte des rapports entre les prédicats et les arguments dans des constructions véhiculant des notions juridiques que Lerat appelle « schémas d’arguments juridiques » (Lerat 2002a) ou « schémas d’énoncés » (Lerat 2002b). La présentation des schémas d’arguments et des classes d’objets associées s’avère être très fructueuse pour la phase de production active, qu’il s’agisse de rédaction spécialisée ou de traduction. Les expressions prédicatives, qui peuvent être verbales, nominales et adjectivales, exigent des arguments (des objets) pour être saturées syntaxiquement. En deuxième lieu, précisons brièvement que, dans le domaine des langues spécialisées, plusieurs auteurs ont proposé, entre autres, des dénominations spécifiques comme, par exemple, « phraséologisme » (Pavel 1993), « combinaison lexicale spécialisée » (L’Homme 1998a), « cooccurrence » (Gémar 1991 ; Larivière 1998) et « phraséoterme » ou « collocation terminologique »7 (Gréciano 1997), cette dernière nous paraissant la plus précise pour faire référence aux seules collocations, laissant donc de côté les autres types de phrasèmes.
Ce qui reprend la terminologie de Hausmann (1979) pour qui la collocation est formée d’une base et d’un collocatif. Silva et al. (2004, 352) choisissent elles aussi de parler de « collocations terminologiques » et expliquent qu’elles peuvent être soit « constituées par deux lexèmes, l’un possédant le statut de terme mono ou multilexémique et l’autre celui de non-terme […] ; soit […] par deux lexèmes, dont les deux peuvent être des termes mono ou multilexémiques ». Les deux constructions ainsi obtenues ne coïncident pas avec les unités terminologiques multilexémiques, puisque la collocation terminologique – qui nous intéresse ici – ne renvoie pas à un seul concept et produit un sens spécifique en langue spécialisée.
Présence et traitement des collocations verbales
135
En dernier lieu, il nous reste à approfondir la distinction8 entre les collocations verbales lexicales et les collocations verbales conceptuelles. D’un côté, les collocations verbales lexicales partent d’une base nominale pour préciser la liste des collocatifs verbaux ; si la base nominale est le terme action, celle-ci appelle les collocatifs verbaux suivants : entreprendre, déclencher, engager, entamer, intenter, introduire ; et, de l’autre côté, les collocations verbales conceptuelles prennent comme point de départ le verbe pour identifier les classes d’objets qui le saturent, par exemple, le verbe engager accepte comme arguments de la classe d’objets les termes suivants : action, poursuite, procès, recours. Pour ce qui est de cette distinction, selon Perilli (2009, 227), la LD montre une tendance vers « la formalité expressive nette, une aptitude plus accentuée du domaine de spécialité à forger des collocations conceptuelles », qui ne peuvent donc pas être négligées.
3 Présentation et analyse du corpus Afin de repérer les collocations verbales du français juridique contemporain qui forment notre corpus d’étude, nous avons effectué une recherche dans trois ouvrages lexicographiques, dont les deux premiers sont spécialisés, à savoir le Vocabulaire du juriste débutant (Lerat 2017a) et le Dictionnaire phraséologique plurilingue du droit (Lerat 2017b, 4) qui considère les entrées de sa nomenclature comme des « étiquettes de concepts partagés ». Par contre, le troisième est un dictionnaire monolingue qui traite de la combinatoire des noms et qui servira donc de point de comparaison : le Dictionnaire des cooccurrences rédigé par Jacques Beauchesne (2001). Dans le Tableau 1, nous allons résumer les caractéristiques des trois dictionnaires retenus pour leur relation avec la présente étude en rapportant le terme vedette, le domaine de manifestation, le corpus et la destination. Tableau 1 : Tableau illustrant les corpus lexicographiques analysés. Titre
Terme Domaine de vedette manifestation
Corpus
Destination
Dictionnaire de cooccurrences Beauschesne ()
Nom
Littérature Presse
Praticiens de la langue, rédacteurs et traducteurs
Langue générale + Langue spécialisée Monolingue
Proposée à plusieurs reprises par Heid (1994) ; L’Homme/Bertrand (2000).
136
Daniela Liliana Dincă, Chiara Preite
Tableau 1 (suite) Titre
Terme Domaine de vedette manifestation
Corpus
Destination
Vocabulaire du juriste débutant Lerat ( ; a)
Nom/ Verbe
Langue spécialisée Monolingue
Législation Public spécialisé, européenne étudiants de droit et traducteurs
Dictionnaire phraséologique plurilingue du droit Lerat (b)
Nom/ Verbe
Langue spécialisée Plurilingue (fr., all, angl, es., it., avec définitions en français)
Législation Public semi-expert : européenne le citoyen
Malgré la destination différente, de la mise en parallèle des trois ressources lexicographiques ressortent non seulement les points divergents, mais aussi les éléments communs concernant les critères pris en compte. En fait, le terme vedette est le Nom dans les trois ouvrages lexicographiques, mais il est concurrencé par le Verbe dans le cas des deux ouvrages de Pierre Lerat qui le considère comme une entrée lexicographique pertinente pour le travail des traducteurs qui disposeront ainsi des informations sur les arguments du verbe et sur son régime prépositionnel : « La prise en compte des verbes permet celle des types de sujets et d’objets typiques, ainsi que des prépositions et articles » (Lerat 2007). En ce qui concerne les domaines de manifestation et le corpus analysé, le Dictionnaire de cooccurrences couvre la langue générale (écrivains de langue française, journaux, magazines) et la langue de spécialité, tandis que les deux dictionnaires de Lerat sont des dictionnaires spécialisés consacrés à la législation européenne. Pour ce qui est de leur finalité, si les deux premiers dictionnaires sont des dictionnaires monolingues, utiles « aux praticiens de la langue, aux rédacteurs, aux traducteurs », le Dictionnaire juridique plurilingue s’adresse à un public « semi-expert », c’est-à-dire « le citoyen en tant que ressortissant, contribuable, électeur, client, héritier, locataire, propriétaire, emprunteur etc. » (Lerat 2017b, 4).
3.1 Collocations verbales lexicales groupées autour de la classe d’objet Pour présenter les collocations verbales lexicales que nous avons repérées autour des termes bases groupés dans les deux classes d’objets [action, poursuite, procès, recours] et [plainte, réclamation, requête, réquisitoire], nous avons choisi de les représenter graphiquement dans des tableaux mettant d’abord en évidence les points communs et les différences pour les trois ouvrages lexicographi-
Présence et traitement des collocations verbales
137
Tableau 2 : Tableau illustrant les CV de la classe d’objets . Le Dictionnaire des cooccurrences
Vocabulaire du juriste débutant
.
Le Dictionnaire phraséologique plurilingue du droit
ACTION CV (V+N) Points communs
-Exercer une action Intenter Introduire
Engager une action -
Engager une action Exercer Intenter Introduire
Action civile (= demande de dommages-intérêts), action directe (= action contre le débiteur de son débiteur), action en garantie (= action contre un garant), action mixte (= action pour la reconnaissance d’un droit et l’exécution d’une obligation), action oblique (= action à la place du débiteur), action publique (= poursuite devant une juridiction pénale), action réelle (= pour défendre un droit réel, cf. réel)
Action en garantie ; action en réparation de dommages ; action en restitution
CV(V+N) Déclencher une action Différences Entamer Former Se désister d’une ~ N + ADJ N+N
(jur.) civile, criminelle, délictueuse, dilatoire, judiciaire, juridique, pénale, recevable
.
POURSUITE CV (V+N) Points communs
Engager une poursuite
Engager des poursuites Introduire une poursuite
Engager des poursuites -
138
Daniela Liliana Dincă, Chiara Preite
Tableau 2 (suite) Le Dictionnaire des cooccurrences
Vocabulaire du juriste débutant
Le Dictionnaire phraséologique plurilingue du droit
CV(V+N) Arrêter, commencer, continuer, Différences déclencher, diriger, encourir, entamer, entreprendre, exercer, faire, initier, instituer, intenter, suspendre une/des/les ~(s) ; renoncer, se soustraire, s’exposer ; surseoir à une/des/ aux ~(s) ; se désister d’une ~ ; être, se mettre à l’abri des ~s ; être l’objet de ~s N+Adj
~ acharnée, débridée, effrénée, folle, (in)fructueuse, laborieuse, mouvementée, rigide, vaine
.
PROCÈS CV (V+N) Points communs
Avoir un procès Faire Être engagé/impliqué Intenter
CV (V+N) Abandonner, ajourner, casser, Différences conduire, couvrir, engager, enliser, entreprendre, éterniser, gagner, instruire, interrompre, introduire, juger, mener, (r)ouvrir, perdre, plaider, poursuivre, présider, prolonger, réclamer, réformer, régler, remettre, remporter, reporter, réviser, soutenir, subir, suivre, terminer, traîner, trancher, vider un ~ ; assister, donner lieu, mettre fin à un ~ ; embarquer qqn, l’emporter, intervenir, paraître comme témoin, se
Faire un procès Intenter
Avoir un procès Être en Intenter
Présence et traitement des collocations verbales
139
Tableau 2 (suite) Le Dictionnaire des cooccurrences
Vocabulaire du juriste débutant
Le Dictionnaire phraséologique plurilingue du droit
constituer/se porter partie civile, témoigner, triompher dans un ~ ; se désister d’un ~ ; juger/ statuer sur le fond d’un ~ ; aimer les ~ ; être (perpétuellement), passer en ~ CV (N+V) Un/le ~ démarre, est en cours, Différences languit, s’engage, se referme sur un acquittement, se termine à l’amiable, s’éternise, s’ouvre, traîne N+Adj
Bon, célèbre, coûteux, épineux, (in)équitable, exceptionnel, expédié, expéditif, fabriqué, fleuve, grand, hâtif, honnête, imperdable, inextricable, ingagnable, interminable, (in) juste, (in)justifié, long, mauvais, (largement) médiatisé, petit, pourri, régulier, retentissant, ruineux, scandaleux, sensationnel, spectaculaire, truqué
.
RECOURS CV (V+N) Points communs
Examiner Exercer Introduire
CV(V+N) Différences
Exercer un recours Introduire
Examiner Exercer Introduire (recours)
Admettre un recours, Déposer, Lancer, Présenter, Refuser, Rejeter un ~
Former
140
Daniela Liliana Dincă, Chiara Preite
ques analysés. Nous avons également jugé opportun d’ajouter les combinaisons nominales possibles pour les deux classes d’objets : Nom+Nom et Nom+Adjectif. La consultation du Tableau 2 met en relief la richesse du Dictionnaire des cooccurrences pour ce qui est des collocations de tout type : N+N, N+ADJ, V+N, ce qui justifie pleinement son objectif combinatoire, qui est celui de trouver les cooccurrences des termes vedettes. Beauchesne ajoute également une rubrique dans laquelle la base nominale passe en première position pour devenir elle-même le premier actant du verbe : par exemple, un procès démarre, un procès est en cours, un procès s’engage, etc. Pour ce qui des deux dictionnaires de Lerat, il convient de remarquer que ceux-ci mettent un accent particulier sur les collocations verbales les plus fréquentes, formées autour des termes groupés dans la classe d’objet . À titre d’exemple, on peut citer les collocations verbales engager une action et introduire une poursuite qui ne figurent pas dans le Dictionnaire de Beauchesne.
3.2 Collocations verbales lexicales groupées autour de la classe d’objet Pour la classe d’objet , nous avons identifié quatre termes : plainte, réclamation, requête, réquisitoire, que nous avons inventoriés dans les trois ouvrages lexicographiques, conformément au Tableau ci-dessous : Tableau 3 : Tableau illustrant les CV de la classe d’objets .
Le Dictionnaire des cooccurrences
.
Vocabulaire du juriste débutant
Le Dictionnaire phraséologique plurilingue du droit
Porter plainte Déposer une plainte
Porter plainte -
PLAINTE CV (V+N) Points communs
Déposer une plainte
Présence et traitement des collocations verbales
141
Tableau 3 (suite)
Le Dictionnaire des cooccurrences
Vocabulaire du juriste débutant
Le Dictionnaire phraséologique plurilingue du droit
CV(V+N) Articuler, émettre, étouffer, exhaler, Différences marmonner, pousser, proférer une/des ~(s) ; se laisser aller à des ~(s) ; souffrir sans une ~ ; Écouter, étouffer, formuler, recevoir une/des ~(s) ; se répandre en ~s ; mettre une sourdine à ses ~s Adresser, classer, écouter, engager, examiner, faire, formuler, introduire, poursuivre, prendre en considération, recevoir, régler, repousser, retirer, transmettre une ~ ; donner lieu/suite, renoncer à une ~ ; débouter qqn, se désister de sa ~ N + ADJ N+N
(Gémissement) affectée, aiguë, amère, confuse, déchirante, étouffée, faible, inarticulée, longue, lugubre, mélodieuse, modulée, monotone, sourde, voilée (Doléances) absurde, amère, continuelle, déraisonnable, frivole, injustifiée, juste, lassante, malvenue, véhémente (jur.) anonyme, (bien, mal) fondée, (in) justifiée, (il)légitime
.
Formules de plainte standardisées ; plainte et observations
RÉCLAMATION CV (V+N) Points communs
Adresser une réclamation Envoyer Présenter
Adresser une réclamation -
CV(V+N) Accueillir, admettre (favorablement), Contester Différences agréer, appuyer, déposer, écarter, écrire, étayer, exposer, faire, formuler, juger, prendre en considération, refuser, rejeter, soulever, soutenir, traiter une/des ~(s)
Adresser une réclamation Envoyer Présenter Régler à l’amiable une réclamation
142
Daniela Liliana Dincă, Chiara Preite
Tableau 3 (suite)
Le Dictionnaire des cooccurrences
N + ADJ N+N
Vocabulaire du juriste débutant
(Plainte) contestable, courtoise, fausse, (bien, mal) fondée, immotivée, importante, inacceptable, indue, irrecevable, juste, (in)justifiée, légitime, perpétuelle (récrimination) continuelles, énergiques, incessantes, indignées, perpétuelles, pressantes, sans fin, virulentes
.
Le Dictionnaire phraséologique plurilingue du droit Procédures extrajudiciaires de réclamation
REQUÊTE CV (V+N) Points communs
-
Formuler une requête Introduire une requête Introduire une requête Présenter une requête
CV(V+N) Différences
-
N + ADJ N+N
À la requête de, sur requête de, Requête en cassation, maître des requêtes au Conseil d’État
-
.
✶
sur requête de toute partie intéressée ; ✶✶ requête non fondée en droit ; à la requête d’un obligataire ; requête introductive d’instance
RÉQUISITOIRE -
–
-
CV(V+N) Dresser un ~ Différences Préparer Prononcer Soutenir Répondre à un ~
–
–
CV (V+N) Points communs
Présence et traitement des collocations verbales
143
Tableau 3 (suite)
N + ADJ N+N
Le Dictionnaire des cooccurrences
Vocabulaire du juriste débutant
Le Dictionnaire phraséologique plurilingue du droit
Admirable, accablant, bref, cinglant, féroce, foudroyant, froid, implacable, long, modéré, redoutable, scandaleux, sévère, solennel, vibrant, vif, vigoureux, violent
Réquisitoire du ministère public
Si, pour la classe d’objet , nous avons constaté que les deux vocabulaires juridiques de Lerat enregistrent les collocations verbales les plus fréquentes, dans le cas des termes groupés autour de la classe d’objet , on remarque le même caractère figé des constructions verbales : porter plainte, déposer une plainte (collocations qui ne sont pas dans la liste assez riche de Beauchesne : adresser, classer, écouter, engager, examiner, faire, formuler, introduire, poursuivre, prendre en considération, recevoir, régler, repousser, retirer, transmettre une plainte ; donner lieu/suite, renoncer à une plainte ; débouter qqn, se désister de sa plainte). En même temps, nous voulons mettre en évidence les traits suivants : a. l’absence des termes dans les ouvrages lexicographiques consultés : le terme requête dans Le Dictionnaire des cooccurrences et le terme réquisitoire dans les deux dictionnaires de Lerat ; b. le caractère accidentel des collocations verbales recensées dans les trois ouvrages lexicographiques qui ne sont pas des ressources dédiées exclusivement à l’enregistrement des phrasèmes. On peut illustrer ce cas par le terme réclamation qui n’a pas le même traitement dans les trois ressources lexicographiques : Tableau 4 : Les collocations verbales avec le terme réclamation. Le Dictionnaire des cooccurrences
Vocabulaire du juriste débutant
Le Dictionnaire phraséologique plurilingue du droit
Adresser une réclamation Envoyer Présenter
Adresser une réclamation -
Adresser une réclamation Envoyer Présenter
144
Daniela Liliana Dincă, Chiara Preite
Tableau 4 (suite) Le Dictionnaire des cooccurrences
Vocabulaire du juriste débutant
Le Dictionnaire phraséologique plurilingue du droit
D’autres CV Accueillir, admettre (favorablement), agréer, appuyer, déposer, écarter, écrire, étayer, exposer, faire, formuler, juger, prendre en considération, refuser, rejeter, soulever, soutenir, traiter une/des ~(s)
Contester
Régler à l’amiable
4 Perspectives lexicographiques Après avoir recensé et examiné la présence des collocations verbales lexicales dans les trois ouvrages retenus, il convient de se demander quel est le traitement lexicographique à adopter pour les collocations terminologiques, surtout dans la perspective de l’enseignement de la LD et de la traduction juridique. Dans cette perspective, deux directions nous paraissent possibles.
4.1 De la base nominale vers les collocatifs verbaux En premier lieu, pour le traitement lexicographique des collocations verbales, il est possible d’aller de la base nominale vers les collocatifs verbaux d’autant plus que le choix du verbe, étant une question de spécificité de chaque langue, doit répondre aux exigences dictées par la fonction de production active de la terminologie juridique. Deux arguments se dressent en faveur de cette approche allant de la base nominale vers les collocatifs verbaux. D’une part, selon Hausmann (1998, 73), les deux éléments de la collocation n’ont pas le même statut : « [l]a dissymétrie des composants de la collocation : le statut des deux partenaires combinés n’est pas égal : la base est un mot autosémantique véhiculant un concept précis, alors que le collocatif est un mot synsémantique, le constituant caractérisant, interdépendant de la base, prenant généralement un sens particulier ». Cela signifie que la base est autonome ou autosémantique et, par conséquent, appelle le collocatif et que ce dernier devient un mot dépendant, à savoir synsémantique. Il s’ensuit que les dictionnaires doivent inclure la base nominale, soit le terme spécialisé, pour aller vers les collocatifs verbaux.
Présence et traitement des collocations verbales
145
D’autre part, Mel’čuk (2013, 238) souligne le caractère compositionnel des collocations qui ne jouissent pas d’autonomie : « […] comme une collocation n’est pas une unité lexicale (= une lexie) de plein droit, elle – de même que les autres phrasèmes compositionnels, à savoir les clichés – ne doit pas posséder son entrée et son article de dictionnaire : elle est décrite à l’intérieur de l’article de sa base ». En plus, le choix du verbe est mis en relation avec le sujet de la phrase en tant que premier actant (Actant 1), mais aussi avec la base nominale (Actant 2) qui opère une distinction sur ses collocatifs verbaux. Par exemple, si le terme base recours (Actant 2) appelle les collocatifs verbaux connaître, intenter, former, ouvrir, maintenir, poursuivre et introduire, ceux-ci sélectionnent, à leur tour, l’Actant 1 conformément au tableau ci-dessous : Tableau 5 : La base nominale recours et ses actants. Actant Sujet de la phrase
Collocatif verbal
Actant Objet de la phrase
Connaître
Recours
Intenter Former
Ouvrir
Maintenir Poursuivre Introduire
En effet, pour connaître recours, le sujet est une institution judiciaire, pour intenter ou former recours, c’est une institution législative, le verbe ouvrir sélectionne comme Actant 1 le nom générique institution et, quand s’il s’agit d’un citoyen, celui-ci maintient, poursuit ou introduit un recours.
4.2 Du collocatif verbal vers la base nominale En deuxième lieu, il est possible de choisir la direction contraire et donc d’aller du collocatif verbal vers sa base nominale. Cette démarche nous semble répondre non seulement aux exigences dictées par la fonction de réception, mais aussi par celle de production active dans le cas des collocations verbales conceptuelles. Par conséquent, cette direction se révèlerait particulièrement utile en lexicographie spécialisée, grâce à l’inventaire des classes conceptuelles de la langue juridique
146
Daniela Liliana Dincă, Chiara Preite
qui se combinent avec les verbes polysémiques externes à la LG ayant également un sens dans la terminologie juridique. Pour appuyer notre hypothèse, on pourrait faire référence aux théories mettant l’accent sur l’importance du verbe : « la sémantique des cadres » (Fillmore 1982), « les classes d’objets » (Gross 1994), « la lexicologie explicative et combinatoire » (Mel’čuk et al. 1995). Dans ce sens, Le Pesant/Mathieu-Colas (1998, 28) font appel à l’analyse des classes d’arguments pour résoudre l’ambiguïté liée à la polysémie des prédicats. Dans le tableau ci-dessous, nous avons représenté le comportement combinatoire du verbe adopter. Une assemblée délibérante adopte des termes faisant partie des classes conceptuelles suivantes : [acte juridique], [motion], [directive], [règlement] ; tandis qu’un actant Ø apparaît dans la phrase : la loi est adoptée. Tableau 6 : Le collocatif verbal adopter et ses actants. Actant Sujet de la phrase
Collocatif verbal
Actant Objet de la phrase
Adopter
[acte juridique] [motion] [directive] [règlement]
Adopter
[loi]
Enfin, nous empruntons à Lerat (2021, 33) un dernier argument qui considère que les prédications juridiques peuvent résoudre la polysémie dans les dictionnaires : « Il y a là une façon de rendre compte de la polysémie en lexicographie spécialisée ».
5 Réflexions conclusives En guise de conclusion, on pourrait dire que l’analyse comparative des trois ressources lexicographiques considérées a mis en évidence l’importance et le rôle des collocations verbales dans la LD. Cela provoque l’exigence de la part des traducteurs de se servir de dictionnaires spécialisés de collocations verbales structurés autour de la base nominale, avec un accent particulier sur la prise en compte de la structure syntaxique des termes, organisée en fonction de leurs principaux actants (sujet ou objet de la phrase). Ce point de vue est également soutenu par Bergenholtz/Tarp (2003, 176) selon qui l’une des fonctions que les dictionnaires spécialisés devraient remplir concerne précisément la traduction de textes depuis et vers une langue étrangère.
Présence et traitement des collocations verbales
147
Pour soutenir notre position, nous citons aussi Perilli (2009, 240) qui, en jurilexicographie, souligne cette idée des rapports syntagmatiques et paradigmatiques entre la base et ses collocatifs : « Le lexique n’est plus une simple liste de lemmes à recenser par ordre alphabétique, mais un véritable réseau, un système articulé de liaisons et de rapports syntagmatiques et paradigmatiques dont il faut rendre compte ». Dans ce sens, un dictionnaire monolingue ou multilingue de collocations verbales serait un instrument de travail indispensable pour les traducteurs ou les professionnels du domaine, de même que pour le public semi-expert, situant le collocatif verbal au centre d’une relation syntagmatique qu’il établit avec ses arguments ou les classes d’objets.
Bibliographie Bardósi, Vilmos, Du phrasème au dictionnaire. Études de phraséographie franco-hongroise, Budapest, Eötvös Kiadó, 2017. Bergenholtz, Henning/Gouws, Rufus, A lexicographical perspective on the classification of multiword combination, International journal of lexicography 27:1 (2013), 1–24. Bergenholtz, Henning/Tarp, Sven, Manual of specialized lexicography, Amsterdam, Benjamins, 1995. Bergenholtz, Henning/Tarp, Sven, Two opposing theories. On H.E. Wiegand’s recent discovery of lexicographic functions, Hermes. Journal of linguistics 31 (2003), 171–196. Cacchiani, Silvia/Preite, Chiara (edd.), Lexi-Term. Approches plurielles de la lexicographie spécialisée et de la terminologie/terminographie, RILA. Rivista italiana di linguistica applicata 3 (2014), 11–22. Clas, André, Collocations et langues spécialisées, Meta. Journal des traducteurs/Meta. Translators’ journal 39:4 (1994), 576–580. Cornu, Gérard, Linguistique juridique, Paris, Montchrestien, 1990. Dincă, Daniela/Preite, Chiara, Les collocations verbales dans le discours juridique. De la terminologie à la phraséologie, Phrasis. Studi fraseologici e paremiologici 3 (2019), 136–147. Faber, Pamela/Marquez Linares, Carlos/Vega Expósito, Miguel, Framing terminology. A processoriented approach, Meta. Journal des traducteurs/Meta. Translators’ journal 50:4 (2005), https://doi.org/10.7202/019916ar. Fillmore, Charles, Towards a descriptive framework for spatial deixis, in : Jarvell, Robert J./Klein, Wolfgang (edd.), Speech, place and action. Studies in deixis and related topics, London, Wiley, 1982, 31–59. Forget, Patrick, La phraséologie chez les jurilexicographes, in : Mac Aodha, Mairtin (ed.), Legal lexicography. A comparative perspective, London, Ashgate, 2014, 223–264. Fuertes-Olivera, Pedro/Nielsen, Sandro/Niño Amo, Marta, Classification in lexicography. The concept of collocation in the accounting dictionaries, Lexicographica 28 (2012), 293–307. Gémar, Jean-Claude, Terminologie, langue et discours juridiques. Sens et signification du langage du droit, Meta. Journal des traducteurs/Meta. Translators’ journal 36:1 (1991), 275–283. Gréciano, Gertrud, Collocations rythmologiques, Meta. Journal des traducteurs/Meta. Translators’ journal 42:1 (1997), 33–44.
148
Daniela Liliana Dincă, Chiara Preite
Groffier, Ethel/Reed, David, La lexicographie juridique. Principes et méthodes, Cowanswille, Yvon Blais, 1990. Gross, Gaston, Classes d’objets et description des verbes, Langages 115 (1994), 15–30. Hausmann, Franz Josef, Un dictionnaire des collocations est-il possible ?, Travaux de linguistique et de littérature 17:1 (1979), 187–195. Hausmann, Franz Josef, O diccionario de colocacions. Criterios de organizacion, in : Ferro Ruibal, Xesús (ed.), Acta do I coloquio galego de fraseoloxia, Santiago de Compostela, Xunta de Galicia, 1998, 63–81. Heid, Ulrich, On the way words work together. Topics in lexical combinatories, in : Martin, Willy/Meijs, Willem/Moerland, Margreet/ten Pas, Elsemiek/van Sterkenburg, Piet (edd.), Euralex 1994 proceedings, Amsterdam, Vrije Universiteit, 1994, 226–257. Larivière, Louise, Valeur sémantique du verbe dans les collocations verbales spécialisées, TTR. Traduction, terminologie, rédaction 11:1 (1998), 173–197. Le Pesant, Denis/Mathieu-Colas, Michel, Introduction aux classes d’objets, Langages 131 (1998), 6–33. Lerat, Pierre, Les langues spécialisées, Paris, Presses Universitaires de France, 1995. Lerat, Pierre, Vocabulaire juridique et schémas d’arguments juridiques, Meta. Journal des traducteurs/ Meta. Translators’ journal 47:2 (2002), 155–162 (=2002a). Lerat, Pierre, Un niveau d’analyse privilégié pour les langues de spécialités européennes. Le schéma d’énoncé, in : Schena, Leo/Soliman, Luciana T. (edd.), Prospettive linguistiche della nuova Europa, Milano, Egea, 2002, 67–77 (=2002b). Lerat, Pierre, Le vocabulaire juridique entre langue et texte, in : Gémar, Jean-Claude/Kasirer, Nicholas (edd.), Jurilinguistique, Montréal, Thémis, 2005, 59–70. Lerat, Pierre, La terminologie juridique, International journal for the semiotics of law – Revue internationale de sémiotique juridique 34 (2021), 1173–1213. L’Homme, Marie-Claude, Combinaisons lexicales spécialisées. Regroupement des mots clés par classes conceptuelles, in : Daille, Béatrice/Williams, Geoffrey (edd.), La collocation, Nantes, IRIN, 1998 (= 1998a). L’Homme, Marie-Claude, Le statut du verbe en langue de spécialité et sa description lexicographique, Cahiers de lexicologie 73:2 (1998), 61–84 (= 1998b). L’Homme, Marie-Claude, Le verbe terminologique un portrait de travaux récent, in : Troisième congrès mondial de linguistique française – CMLF, Paris, EDP Sciences, 2012, 93–107. L’Homme, Marie-Claude/Bertrand, Claudine, Specialized lexical combinations. Should they be described as collocations or in terms of selectional restrictions?, in : Heid, Ulrich/Evert, Stefan (edd.), Proceedings of 9th EURALEX international congress, Stuttgart, Inst. für Maschinelle Sprachverarbeitung, 2000, 497–506. Mel’čuk, Igor/Clas, André/Polguère, Alain, Introduction à la lexicologie explicative et combinatoire, Paris/Louvain-la-Neuve, Duculot, 1995. Mel’čuk, Igor, Collocations dans le dictionnaire, Szende, Thomas (ed.), Les écarts culturels dans les dictionnaires bilingues, Paris, Honoré Champion, 2003, 19–64. Mel’čuk, Igor (ed.), Tout ce que nous voulions savoir sur les phrasèmes, mais …, Cahiers de lexicologie 102:1 (2013), 129–149. Orlandi, Adriana/Giacomini, Laura, Defining collocation for lexicographic purposes. From linguistic theory to lexicographic practice, Bern, Peter Lang, 2016. Pavel, Silvia, La phraséologie en langue de spécialité. Méthodologie de consignation dans les vocabulaires terminologiques, Terminologies nouvelles 10 (1993), 67–82. Perilli, Fabio, Combinaisons lexicales et jurilexicographie. Le traitement des collocations terminologiques dans un dictionnaire de spécialité, in : Chessa, Francesca/Dotoli, Giovanni (edd.), Les dictionnaires
Présence et traitement des collocations verbales
149
de spécialité. Une ouverture sur les mondes, Fasano/Paris, Schena Editore/Alain Baudry, 2009, 227–243. Polguère, Alain, Towards a theoretically-motivated general public dictionary of semantic derivations and collocations for French, in: Heid, Ulrich/Evert, Stefan (edd.), Proceedings of 9th EURALEX international congress, Stuttgart, Inst. für Maschinelle Sprachverarbeitung, 2000, 517–527. Silva, Raquel/Costa, Rute/Ferreira, Fátima, Entre langue générale et langue de spécialité. Une question de collocations, Études de linguistique appliquée 135:3 (2004), 347–359. Scurtu, Gabriela/Dincă, Daniela, Pour un dictionnaire juridique français-roumain des collocations verbales, RILA. Rivista italiana di linguistica applicata 3 (2015), 113–127. Tutin, Agnès, Le traitement des collocations dans les dictionnaires monolingues de collocations du français et de l’anglais, in : Neveu, Frank/Toke, Muni/Durand, Jacques/Klingler, Thomas/Mondada, Lorenza/Prévost, Sophie (edd.), Congrès mondial de linguistique française – CMLF 2010, Paris, EDP Sciences, 2010, 1075–1090.
Dictionnaires Beauchesne, Jacques, Dictionnaire des cooccurrences, Montréal, Guérin, 2001. Lerat, Pierre, Vocabulaire du juriste débutant, Paris, Ellipses, 22017 (= 2017a). Lerat, Pierre, Dictionnaire phraséologique plurilingue du droit, Paris, La Maison du Dictionnaire, 2017 (= 2017b).
Michela Tonti
Le phraséoterme à la confluence de la langue naturelle, de la langue de spécialité et des néoformations « Ajustement cosmétique », « injonction de diversité », « fonction contrôle gestion garde-fou » et bien d’autres Résumé : La terminologie polylexicale est examinée dans son articulation entre langue de spécialité et langue générale d’un côté et sa nature savante ou courante de l’autre, sans négliger les nouvelles créations terminologiques. Le cadre retenu est celui de la phraséologie scientifique du domaine de la comptabilité. Par le biais d’une recherche systématique, il s’impose de fixer un instantané d’un usage terminologique, détecté à l’aide d’une recherche guidée par corpus spécialisé et conduite en même temps sur un corpus généraliste. Le corpus expérimental bâti en puisant dans la base de données ProQuest est exploité à partir de la version 3.0 de l’outil d’acquisition automatique TermoStat (Drouin 2003). Le matériel réuni s’échelonne sur un laps de temps qui va de 1999 à 2016. Les résultats de l’extraction font premièrement l’objet d’une opération de tamisage visant à cerner une réelle saillance terminologique et conceptuelle des données réunies. Le classement de celles-ci est réalisé en fonction de leur attestation dans IATE, BelTerme, Lingua-PC online, TERMIUM Plus, Grand Dictionnaire Terminologique. L’originalité conceptuelle des néoformations repérées constitue un critère supplémentaire de sélection, dont l’observation des propriétés syntaxiques et sémantiques à la confluence avec la langue naturelle s’impose. Mots-clés : Traitement Automatique des Langues, sémantique et syntaxe de phraséotermes nouveaux, langue de spécialité de la comptabilité, nature savante et/ou courante, terminologie incrémentale Abstract: As well as identifying new terminological creations, we examine how polylexical terminology is articulated between specialized and general language on the one hand, and its educated or colloquial nature on the other. The framework chosen is scientific phraseology in the field of accounting. It is necessary to obtain a picture of a terminological usage by systematic research, which is detected thanks to the guided research on a specialized corpus and simultaneously on a general language corpus. The experimental corpus, built by drawing on the ProQuest database, is combined with version 3.0 of the automatic acquisition tool TermoStat (Drouin 2003). The material collected spans a period of time from 1999 https://doi.org/10.1515/9783110749854-009
152
Michela Tonti
to 2016. The results of the extraction are first sifted in order to identify a real terminological and conceptual salience of the data collected. The data is organized based on where it has been verified, including in IATE, BelTerme, Lingua-PC online, TERMIUM Plus, and the Grand Dictionnaire Terminologique. An additional criterion for selection is the conceptual uniqueness of the neoformations thus detected, which necessitates the observation of their syntactic and semantic characteristics when they coincide with natural language. Keywords: automatic language processing, semantics and syntax of new phrase words, specialized language of accounting, educated and/or colloquial nature, incremental terminology
1 Introduction Les besoins de nomination des professionnels relevant d’un domaine spécialisé se traduisent par l’acte de nommer à partir d’une terminologie qui n’est qu’une langue de spécialité plus riche, une partie inséparable de la langue naturelle, inconcevable sans celle-ci. Cependant, le stock des phrasèmes1 disponibles a besoin de nouveaux termes pour pouvoir répondre aux exigences croissantes et mouvantes de locuteurs, certes avisés et expérimentés, mais qui ont tout de même besoin d’associer un terme à un concept nouveau. Pas de terminologie sans domaine. Un terme ne prend son sens que dans son domaine d’emploi particulier. Un même terme peut avoir des sens différents suivant les domaines et parfois même il peut servir à désigner des notions différentes d’un secteur à l’autre au sein d’un même domaine. Le cadre retenu est celui de la phraséologie spécialisée afférant au domaine de la comptabilité puisant dans un corpus qui sera présenté dans le détail. Le corpus brasse le domaine de la comptabilité dans ses trois principales branches : la comptabilité financière, la comptabilité de gestion et la gestion financière. Nous nous questionnons sur l’importance de la polylexicalité terminologique en nous interrogeant sur sa nature savante ou courante et en examinant l’articulation entre langue de spécialité et générale, configurée en phraséologie spécialisée d’un côté et en nouvelles créations terminologiques de l’autre. Par le biais d’une recherche systématique qui n’a guère la prétention d’être exhaustive, nous nous proposons donc de fixer un instantané d’un usage terminologique (Dubuc 1985) afférant au domaine de la comptabilité, détecté à un moment et à un endroit donné à l’aide d’une
Il nous appartient de justifier notre choix du métalangage adopté dans notre § 2. Nous anticipons que la terminologie utilisée est empruntée à Gréciano (1997).
Le phraséoterme à la confluence de la langue naturelle
153
recherche guidée par corpus spécialisé et conduite en même temps sur un corpus généraliste. À partir du cadre méthodologique allant de l’extraction à la validation des données, tel qu’il est préconisé par Cabré (1998), nous nous proposons de découvrir, autant que possible, une batterie de collocations inédites parce qu’elles ne sont pas renseignées dans les ressources terminologiques consultées et ce, dans la perspective bien que modeste d’un enrichissement des savoirs terminologiques qui, pour l’heure, ne sont pas attestés dans ces bases de données mêmes. Il s’agit de : IATE, FranceTerme, BelTerme, Le grand dictionnaire terminologique (désormais GDT), TERMIUM Plus, Lingua-PC et TERMDAT.2 Dans un premier temps, nous définirons le corpus d’appui que nous avons bâti à partir de la base de données ProQuest portant sur un macro-domaine qui a trait à la comptabilité dans son ensemble. Le corpus sera exploité à partir de la version 3.0 de l’outil d’acquisition automatique TermoStat (Drouin 2003 ; 2004). Nous plaçant dans une perspective comparatiste, nous allons dresser une liste de candidatstermes qui nous servira de base empirique et lexicographique pour détecter et identifier l’attestation de ces candidats-termes dans un deuxième corpus de référence de grande envergure : frTenTen17 (conçu en 2017, 10 milliards de tokens environ). Pour ce faire, nous allons mettre en perspective notre corpus d’appui avec frTenTen17. Les résultats de l’extraction feront premièrement l’objet d’une opération de tamisage visant à cerner une réelle saillance terminologique et conceptuelle des données réunies : à cet effet, la distribution quantitative fournit un critère de sélection (Sinclair 1991, 70). Deuxièmement, ils seront classés en fonction de leur attestation dans une sélection de bases de données terminologiques existantes. Cette fouille outillée nous permet de cerner des formations intéressantes du point de vue terminologique qui seront catégorisées et analysées en fonction des modèles de néologie terminologique recensés par Humbley (2018) et des critères syntactico-sémantiques et lexicaux permettant de distinguer plus clairement les expressions de la langue générale des candidats-néologismes relevant de la langue de spécialité. Des approfondissements statistiques seront également effectués.
Les ressources terminologiques relèvent respectivement des contextes suivants : base de données terminologiques de l’Union européenne ; base de données consacrée aux termes publiés au Journal officiel de la République française par la Commission d’enrichissement de la langue française ; banque terminologique de la Fédération Wallonie-Bruxelles ; banque de fiche terminologique de l’Office québécois de la langue française ; banque de données terminologiques du Gouvernement du Canada ; banque de données terminologique du Canton de Berne ; banque de données terminologique de l’administration fédérale suisse.
154
Michela Tonti
Nous consacrerons notre troisième partie à l’analyse d’études de cas qui s’avèrent des phraséotermes nouveaux3 n’apparaissant dans aucune des bases de données consultées. Nous allons procéder à une classification qui prendra en compte les termes monolexicaux, à savoir des noms génériques qui restent des outils d’approximation comme « manager » sans le collocataire « de terrain » ou bien le terme polylexical « fonction gestion de contrôle » que seule la spécification par collocataires (Gréciano 1997, 34) rend contextuellement efficaces. En guise d’exemple, nous mentionnons « fonction gestion de contrôle garde-fou » plutôt que « discrète » ou « omnipotente ». Nous allons démontrer que si la langue générale semble l’emporter là où un nouveau besoin de nomination s’impose, il n’en demeure pas moins vrai que parmi les collocations des phraséotermes spécialisés détectés, certains d’entre eux sont le produit de formatifs savants (Gréciano 1997, 34) comme rescrit social, n’apparaissant dans aucune ressource terminologique avec le collocataire « social ». Ce dernier joue pleinement son rôle spécificateur alors que seul fiscal est retenu dans la plupart des supports terminologiques (IATE, FranceTerme, BelTerme, GDT, TERMIUM Plus, Lingua-PC et TERMDAT). L’originalité conceptuelle des dénominations terminologiques détectées constituera un critère supplémentaire de sélection pour l’analyse des études de cas dont nous observerons les propriétés syntaxiques et sémantiques à la confluence avec la langue naturelle. Cet article se propose de jeter les jalons d’une base empirique de données saillantes pour la phraséologie de notre domaine de comptabilité. Puisque nous nous appuyons sur une démarche d’extraction semi-automatique des données, nos extractions ne sont pas définissables au préalable selon les méthodes de classement des unités phraséologiques en langue de spécialité préconisées par une partie de la littérature existante dont nous esquissons les assises des principales approches en §2.
2 Quels termes pour définir en langue de spécialité ? Des modèles théoriques À l’instar de Pavel (1993), nous inscrivons la langue de spécialité (désormais LS) dans une vision de la langue comme norme sociale. La LS partage avec la langue générale (désormais LG), sa grammaire et une partie de son patrimoine lexicosémantique mais elle en fait un usage sélectif et créatif, ce qui nous permet de la décrire en termes de système conceptuel et de désignation (terminologie), de discours et de thème (phraséologie), de collectivité et d’usages (norme sociale). Le
Selon Gréciano (1997) un phraséoterme est un terme polylexical (1997, 34).
Le phraséoterme à la confluence de la langue naturelle
155
discours thématique met systématiquement en question le savoir communément admis, ce qui entraîne des ajouts, des déplacements et des suppressions dans le réseau conceptuel. Au plan du langage, une révision renouvelée du savoir spécialisé est source de nouvelles désignations (néologie formelle). Pavel considère les unités terminologiques comme un sous-ensemble de la phraséologie d’une LS. Par phraséologie LS nous entendons la combinatoire syntagmatique des unités terminologiques prises comme noyaux de cooccurrences usuelles ou privilégiées dans un texte de spécialité. Ces solidarités lexicales présentent divers degrés de figement, de commutabilité, de compactage, de fréquence, de prévisibilité lexicosémantique qui sont évalués lors de la sélection des unités phraséologiques. Les particularités phraséologiques d’une LS résultent de deux facteurs extralinguistiques : la nature imprédictible du renouveau conceptuel et l’évolution du langage (norme sociale) dans la communauté qui les adopte. Nous avançons dans notre excursus, en nous appuyant sur des travaux de Gréciano (1993 ; 1997). Elle distingue trois étapes sur le chemin vers la modélisation phraséologique. D’abord le phrasème se distingue comme « générateur terminologique » (Gréciano 1993) : phénomènes à dénommer (sciences/techniques) et contextes institutionnalisés (droit/administration) réclament l’usage normatif du phraséoterme. Le phrasème est aussi générateur discursif sur le plan structural et thématique ; en troisième lieu, le phrasème est aussi générateur lexicographique. Nous ne retenons que la perspective du phrasème comme générateur terminologique : « les phrasèmes et les termes sont des groupement préférentiels » (Thoiron/Béjoint cité par Gréciano 1993) puisqu’ils garantissent tous deux « l’acquisition du savoir et la diffusion de l’information » (Blampain cité par Gréciano 1993). À l’appui de cette certitude dorénavant convainquante pour les spécialistes, Gréciano (1993) mentionne l’étude sur corpus qui révèle le phrasème comme le meilleur des termes : le phrasème est constamment au service de la dénomination secondaire, un signe constitué d’autres signes et donc polylexical. Le phrasème est « remotivable et remotivé selon ses formatifs constitutifs, il devient alors icône-image, figure au sens esthétique du terme ». S’intéressant à la terminologie de l’imagerie médicale, Gréciano (1997) remarque que les termes monolexicaux de ce domaine sont des noms génériques qui restent des outils d’approximation que seule la spécification par collocataires rend contextuellement opératoires. L’insensibilité à la collocation, voire une combinatoire syntagmatique zéro est l’indice langagier de la non-productivité des monotermes « extrasystole » et « tachycardie » (par exemple) qui se solidarisent en termes polylexicaux, en phraséotermes, puisque le collocataire devient responsable de la phraséologisation du terme. « Tachycardie » se lie à « sinusale », « auriculaire » etc., donc l’affinité de la dénomination descriptive du symptôme pathologique exprimée par le noyau/base/collocateur est lexicalisée avec l’ancrage anatomique assuré par le collocataire. Gréciano affirme qu’il y a « liage notionnel entre collocateurs
156
Michela Tonti
et collocataires [...] la référentialisation dominant dans le collocataire, la description dans le collocateur du phraséoterme » (1997, 35). Dans le cadre de la Lexicologie Explicative et Combinatoire (LEC), la modélisation des unités phraséologiques ou phrasèmes (locutions et collocations) s’appuie sur le classement des unités multilexémiques non libres qu’en propose Mel’čuk (2008 ; 2013). Ce classement se base sur deux paramètres de base des unités multilexémiques, qui permettent de distinguer les unités multilexémiques libres des unités non libres, à savoir leur liberté sur l’axe paradigmatique et leur liberté sur l’axe syntagmatique. Pour les locutions, le locuteur n’a aucune liberté sur l’axe syntagmatique, alors que pour les collocations, qui se composent de deux lexies différentes, il existe un degré de liberté dans l’application de règles suffisamment générales. Quant à la définition de la collocation, selon Polguère/ Mel’čuk (2006), Frassi et al. (2020), entre autres, c’est une unité phraséologique qui se compose de deux éléments distincts : une base et un collocatif où la base est toujours autonome, alors que le collocatif ne peut pas fonctionner sans sa base. De nombreux linguistes admettent que dans une collocation, la base contrôle son collocatif (Hausmann 1989 ; Hausmann/Blumenthal 2006 ; Polguère/Mel’čuk 2006 ; Frassi et al. 2020). La LEC prévoit deux types de collocations, leur formalisation étant déterminée par le système des fonctions lexicales : d’une part, les collocations formalisées par des fonctions lexicales standard qui sont présentées pour les deux classes majeures – fonctions paradigmatiques (lien de type synonymique) et fonctions syntagmatiques (propriété de combinatoire) – et, de l’autre, les collocations formalisées par des fonctions lexicales non standard. Pour de plus amples approfondissements sur l’implication des fonctions lexicales dans la structuration des modèles lexicaux de type réseaux lexicaux, nous renvoyons à Mel’čuk/ Polguère 2021. La LEC distingue également trois types de locutions : locutions fortes (sémantiquement opaques), locutions faibles (sémantiquement transparentes) et locutions semi-compositionnelles (degré moyen d’opacité/transparence). De récents projets comme la base de données DIACOM-fr portant sur la terminologie du commerce en diachronie élaborée par Paolo Frassi et son équipe s’inscrit dans le modèle théorique proposé par la LEC (Frassi 2021). Selon Frassi et al. (2020), les collocations non standard s’apparentent davantage aux locutions faibles qu’aux collocations au vu de l’activité de lexicalisation propre aux langues de spécialité qui se proposent de dénommer de nouveaux realia. Après avoir traité les concepts de locution et de collocation sur la base des apports des travaux théoriques mentionnés, il nous semble utile d’aborder une autre distinction assez problématique en LS, celle d’unité terminologique multilexémique et de collocation terminologique. Selon Silva et al. (2004, 352), les unités terminologiques multilexémiques sont « des unités linguistiques complexes, composées au minimum par deux lexèmes et dont la combinaison morphosyntaxique totale a
Le phraséoterme à la confluence de la langue naturelle
157
pour fonction de dénommer un concept ». Les trois auteures proposent l’utilisation du néonyme « collocation terminologique » pour ces unités terminologiques multilexémiques, qui peuvent, du point de vue morphosyntaxique, présenter deux cas de figure : a) soit elles sont constituées par deux lexèmes, l’un possédant le statut de terme mono ou multilexémique et l’autre celui de non-terme ; b) soit elles sont constituées par deux lexèmes, dont les deux peuvent être des termes mono ou multilexémiques. Lorsque la relation de dépendance entre les éléments de la construction qui au départ est une simple collocation terminologique se solidifie, un changement intervient par l’acquisition d’un degré bien plus fort de cohésion lexicale entre les éléments, faisant ainsi perdre à la collocation terminologique son statut pour prendre celui d’unité terminologique. À l’issue de cette mise au point sur la réflexion théorique et conceptuelle à propos des collocations entre LG et LS, il nous semble que les hypothèses émises par Gréciano quant au liage notionnel entre collocateur et collocataire, ce dernier étant le responsable de la phraséologisation du collocateur, conviennent à notre propos. Par ailleurs, nous empruntons le métalangage de cette linguiste ainsi que celui d’unité terminologique selon la conceptualisation proposée par Silva et al. (2004).
3 Vers une première extraction automatique de listes de candidats-termes : une recherche systématique Le matériel réuni à partir de la base de données ProQuest comporte 245 documents s’échelonnant sur un laps de temps qui va de 1999 à 2016, ce qui constitue un atout aussi bien du point de vue de la nouveauté de ses observables que de son implantation, car on ne peut pas « jug[er] de l’implantation d’un terme en dehors d’une certaine diachronie » (Depecker 1997, 9–10).4 Ce corpus d’appui ayant une valeur d’échantillonnage des termes-candidats composés, fruit d’une fouille de collocations inédites, exemples de néologie incrémentale (Humbley 2018) du domaine que nous explorons, il est de dimensions suffisamment considérables pour sa représentativité. Il comporte 980000 mots et se compose d’un florilège de textes techniques : revues scientifiques et notamment la Revue française de comptabilité (134 articles), la revue Comptabilité Contrôle Audit (65 articles), le Journal de l’École de Paris de Management (3 articles), La Revue des thèses (6 articles), guides opérationnels (4),
Nous rappelons que Depecker (1997) approfondit l’étude de l’aménagement terminologique en diachronie.
158
Michela Tonti
ouvrages spécialisés (23), feuilles de travail en audit interne (6). Une liste de candidats-termes est dressée au moyen du logiciel TermoStat Web 3.0, en appliquant la technique mise au point par Patrick Drouin qui porte sur la comparaison d’un corpus de référence de LG réunissant 560000 formes différentes issues du quotidien français Le Monde (2002) : notre corpus de LS est mis en regard de ce dernier corpus de presse écrite incluant des suppléments d’économie et de finance. L’analyse a été conduite appliquant deux catégories d’extraction : le nom et l’adjectif. L’extraction des candidats-termes comporte 2499 unités terminologiques ; dans une perspective comparatiste, notre corpus d’appui éminemment technique a été déposé dans la plateforme Sketch Engine. Notre deuxième corpus de comparaison est frTenTen, se composant de textes glanés sur la Toile. Relevant de la famille du corpus TenTen, la cueillette comporte essentiellement des documents en libre accès qui tiennent compte des variations diatopiques d’expression française de France, de Belgique et de Suisse mais aussi canadienne et africaine. Il a l’avantage d’exploiter une plus grande variété de typologies textuelles, comprenant également des formes de discours moins surveillées, comme les blogs et les forums. Cette deuxième phase exploratoire a permis d’effectuer l’extraction automatique d’une deuxième liste de candidats-termes (1000 environ) issue du croisement de notre corpus de comptabilité et du corpus de référence frTenTen dans un but comparatiste. La méthodologie d’extraction s’est appuyée sur la fonction keywords. Certes, ce dernier corpus est le plus riche en occurrences en général au niveau quantitatif. Cependant, à l’aune du parallèle dressé entre les deux listes, parallèle qui serait réalisable à l’aide d’un filtrage semi-automatique mais que nous avons pour l’heure effectué par sélection manuelle, un constat s’impose en termes de fréquences d’usage terminologique, nous allons en rendre compte par la suite. Il est également utile de signaler que la liste des termes polylexicaux dressée à l’aide de TermoStat 3.0 prévoyait également des collocations prépositionnelles alors que la liste d’extraction à partir de Sketch Engine ne comporte que la combinatoire nom+adjectif. Pour une comparaison sélective efficace, nous avons dépouillé et supprimé tous les termes polylexicaux prépositionnels. Sur 40 termes complexes communs aux deux listes, choisis en fonction d’une grandeur scalaire de difficulté selon les critères de leur spécificité technique et conceptuelle,5 il en découle les résultats suivants :
À cet effet, nous avons consulté un expert-comptable, Pietro Moretti auquel nous adressons nos remerciements les plus vifs. Il nous a aidée à dresser une liste des termes complexes comportant une difficulté conceptuelle à grandeur variable progressive. Le classement des termes suit la logique suivante : d’une difficulté moindre de compréhension et de conceptualisation parce que le terme relève d’un domaine de vulgarisation à une difficulté croissante au vu de la technicité et de la spécificité pointue des termes qui occupent le bas de la liste (Tableau 2).
Le phraséoterme à la confluence de la langue naturelle
159
Tableau 1: Étude comparative portant sur l’extraction automatique du corpus Comptabilité à l’aide de TermoStat 3.0 et de l’extraction automatique réalisée par frTenTen : bilan d’une sélection. Termes complexes balanced scorecard audit interne norme ifrs business mode auditeur externe capitaux propres accruals discrétionnaires asymétrie informationnelle actionnaire minoritaire audit externe norme ias actionnaire majoritaire don manuel traitement comptable investisseur institutionnel actif net régime fiscal
Occurrences – Compt.
Occurrences – FrTenTen
Occurrences rel. – Compt.
Occurrences rel. – FrTenTen
,% ,% ,% ,% ,% ,%
,% ,% ,% ,% ,% ,%
,%
,%
,%
,%
,% ,% ,%
,% ,% ,%
,% ,%
,% ,%
,%
,%
,% ,% ,%
,% ,% ,%
Le classement des termes renseignés dans le Tableau 1, répond à un critère quantitatif à partir de la plus grande fréquence d’apparition du terme dans notre corpus d’appui et éminemment tourné vers la langue de spécialité de la comptabilité que nous avons expressément dénommé Comptabilité, vers le plus faible nombre d’occurrences au sein du même corpus de spécialité.
160
Michela Tonti
Tableau 2 : Classement d’une sélection de termes complexes au vu de leur degré croissant de complexité conceptuelle et de spécificité. Variation scalaire et progressive de la Terme difficulté conceptuelle du terme complexe correspondant .
régime fiscal
.
capitaux propres
.
Nombre des Nombre des occurrences au occurrences au sein sein de frTenTen de Comptabilité
traitement comptable
.
auditeur externe
.
accruals discrétionnaires
.
balanced scorecard
Ces données nous d’inférer que l’impact de l’usage de ces collocations en termes de fréquences absolues paraîtrait à première vue nettement supérieur dans frTenTen par rapport à l’autre corpus, du moins pour ce qui est des termes complexes « régime fiscal », « capitaux propres » et « traitement comptable » qui auraient un caractère moins technique que les termes correspondant au bas de la liste, décidément plus fréquents dans le corpus de spécialité. Donc, ce que Habert (2000) résume par la formule « gros, c'est beau » semblerait confirmé. Auroux (1998) posait la question de ce que les linguistes allaient chercher sur le terrain et puisque nous nous questionnons sur l’impact des usages des termes polylexicaux spécialisés, c’est bien leur fréquence relative qu’il faut observer. L’impact, la saillance quantitative des termes complexes repérés est plus élevée au sein de notre corpus spécialisé ; au vu de sa plus petite taille, le quotient de notre effectif (le nombre d’occurrences absolues) divisé par le volume total de mots de notre corpus, nous permet de constater que finalement il serait utile de se poser la question : « Des corpus pour tous ou des corpus pour tout ? ». Depuis qu’on parle de corpus en linguistique et qu’on soulève la question de leur « représentativité », des corpus pour tous et des corpus pour tout ne conviendraient pas lorsqu’on manie les outils terminologiques d’un domaine hautement spécialisé du point de vue conceptuel.
Technique de management pour traduire la mission, l’objectif de la société dans des résultats concrets.
Le phraséoterme à la confluence de la langue naturelle
161
Tableau 3 : Échantillon d’une sélection de termes complexes et leur nombre d’occurrences au sein de nos corpus. Terme
Occurrences – Occurrences – Occurrences rel. – Occurrences rel. – Compt. FrTenTen Compt. FrTenTen ,E-
balanced scorecard
,
business mode
,
,E-
accruals discrétionnaire
,E-
target costing
,E-
,E-
accounting standards
,E-
,E-
La fréquence relative des termes de la sélection nous paraît intéressante à deux égards : le répertoire terminologique de la comptabilité d’expression française puise de manière irréfutable dans les ressources terminologiques existantes en langue anglaise.8 Sans égarer notre focalisation qui ne porte pas sur les emprunts, il est deuxièmement intéressant de remarquer que frTenTen apparaît inefficace pour tester les usages et les contextes d’usage de la terminologie spécialisée. Nous attirons en revanche l’attention sur la composition adjectivale « accrual discrétionnaire » constituée d’un emprunt suivi de son expansion adjectivale qui est un exemple type de néologie incrémentale (Humbley 2018). Grâce à l’ajout d’un élément qui signale la présence d’un trait conceptuel, nous parvenons à la création d’un hyponyme. Nous allons revenir sur cet exemple dans la partie consacrée aux termes complexes ne figurant pas dans les bases de données consultées.9
4 Quels formatifs pour des termes polylexicaux de comptabilité ? La recherche phraséologique a produit de nombreuses études sur la nature et la productivité des formatifs intervenant dans les termes complexes. Gréciano (1997) souligne qu’en phraséologie générale, la polylexicalité se manifeste par des consti-
Nous souhaitons préciser que nous empruntons ce code pour rappeler que neuf zéros suivent après la virgule. Il est utile de rappeler que dans le domaine de la comptabilité, l’adoption de normes internationales d’inspiration anglo-saxonne est manifeste. Par souci de clarté, nous précisons à nouveau la liste des bases de données consultées à cet effet : IATE, FranceTerme, BelTerme, GDT, TERMIUM Plus, Lingua-PC et TERMDAT.
162
Michela Tonti
tuants de la langue commune, la phraséologie spécialisée n’est pas pour autant le produit de formatifs exclusivement savants. L’auteure affirme même que la cohabitation entre LG et LS se dégage comme régularité de 5 domaines présentés avec une graduation à phraséologie plus ou moins technique : médecine, économie, sport, administration, politique. À cet effet, nous avons puisé dans la liste des candidats-termes établie à l’aide de TermoStat 3.0 comportant des termes polylexicaux prépositionnels.10 En revanche, les termes monolexicaux11 sont des noms génériques qui restent des outils d’approximation, seule la spécification par collocataires les rend contextuellement opératoires. Voici la sélection que nous avons repérée des trois combinatoires autour de formatifs généraux et spéciaux. Tableau 4 : Repérage des combinatoires autour de formatifs généraux et spéciaux. Combinatoire : collocateur courant avec collocataire savant ( au total)
Combinatoire : collocateur savant et collocataire courant ( au total)
Combinatoire : collocateur savant et collocataire savant ( au total)
code de déontologie ; convention de quasi-usufruit ; coût de revient ; demande de rescrit ; démarche de yield✶ ; droit d’usufruit ; écarts actuariels cumulés ; effet de dilution ; exercice de survenance ; période de viduité ; pratique de gouvernance ; président de cheng ; réseau de guanxi ; risque de radiation ; sens de Piaget ; société de lbo (leverage buy out) ; taux d’actualisation ; test d’impairment✶ ; travail de priorisation
clause de remploi ; continuum de clause de quasi-usufruit ; communications personnelles ; imf quote-part de mali à but lucratif (institution de microfinance) ; injonction de diversité ; mali de fusion ; mali technique affecté ; mémorandum de présentation ; méta-analyse quantitative ; présomption de manipulation originale ; ratio de productivité ; rescrit social ; sursis d’imposition✶
Au vu de son ampleur, nous ne pouvons pas rendre disponible cette liste. Nous empruntons la terminologie de Gréciano (1997). Il s’impose également de souligner la question de la polysémie des termes : l’acception de la langue générale n’est pas forcément la même que le sens de nos termes du Tableau 4 en langue de spécialité. En guise d’exemple nous mentionnons un échantillon de trois termes : 1. yield, 2. impairment et 3. imposition que nous avons signalés par le caractère spécial ✶ dont nous fournissons la traduction en langue générale pour les deux premiers termes. Ils correspondent respectivement à 1. production, récolte et 2. détérioration ou affaiblissement, https://www.larousse.fr/dictionnaires/anglais-francais [consulté le 27 octobre 2021]. Pour le terme imposition nous proposons la définition du TLFi : « Action d'obliger à subir ou à faire une chose généralement désagréable, pénible ou difficile ; Action, manière de soumettre à un impôt ; Par métonymie, le plus souvent au pluriel : Résultat de cette action ; impôt », http:// stella.atilf.fr [consulté le 27 octobre 2021]. La valeur discursive de la polysémie fera l’objet d’un travail
Le phraséoterme à la confluence de la langue naturelle
163
La combinatoire comportant un collocateur courant et un collocataire savant s’avère la plus productive (nous avons repéré 19 exemples). Nous citons en guise d’exemple, la collocation « réseau de guanxi ». Le terme guanxi qui signifie littéralement « la porte des relations humaines » se réfère au statut et à l’intensité d’une relation entre deux parties. Dans une société collectiviste, le guanxi entre deux parties tend à prendre en considération d’autres parties externes mais issues du même réseau relationnel. La pensée confucéenne exposant que les hommes n’existent qu’à travers la relation avec autrui, les Chinois pénétrés de confucianisme sont, de ce fait, naturellement soucieux de développer leur guanxi. Le guanxi comme principe culturel fort de la société chinoise appliqué au domaine professionnel est un outil au service de l’intelligence économique (Laulusa/Eglem 2008). Il est par ailleurs intéressant de constater que cette valeur semble également jouer un rôle de mécanisme de contrôle opéré en amont en phase de recrutement des managers. Dans l’univers entrepreneurial chinois, il est préférable de recruter des managers à travers son réseau de guanxi qui impose le respect des règles de socialisation et exerce un contrôle sur les personnes dignes de confiance. Cette composante ancrée dans la culture chinoise met en avant des caractéristiques saillantes où le collocataire permet de faire la différence par rapport à « réseau » tout court. Dans un « réseau de guanxi », il en découle qu’aucune distinction n’intervient entre le milieu des affaires et les relations personnelles ; il s’agit d’une orientation à long terme pour laquelle des relations personnelles doivent être tissées avant de pouvoir faire des affaires ou espérer un entretien d’embauche. De ce fait, un terme monolexical comme « réseau » se solidarise en phraséoterme puisque le collocataire permet la phraséologisation du terme en le chargeant d’une valeur culturelle partagée au sein de la société chinoise. Certes, le terme « réseau » n’est pas innocent car d’après la fiche rédigée par l’Office québécois de la langue française en 2004 et disponible dans le GDT pour les domaines afférant à la gestion, au travail et à l’économie, il désigne « un système facilitant la mise en relation d'individus, d'associations, d'organismes ou d'entreprises afin qu'ils puissent travailler en liaison les uns avec les autres dans un esprit de coopération », mais il préserve une distinction claire entre les affaires et les relations personnelles sans qu’une relation soit forcément tissée au préalable. Or, serait-il grossièrement envisageable de comparer la collocation « réseau de guanxi » à l’expression française « faire jouer ses relations » ?
à venir. À propos de l’étude de la variation linguistique dans la communication spécialisée, nous renvoyons à l’ample littérature sur la théorie communicative de la terminologie élaborée par Cabré (1998), à la théorie sociocognitive de Temmerman (2000) et à la socioterminologie de Gaudin (2003).
164
Michela Tonti
La combinatoire entre collocateur savant et collocataire courant comporte 12 exemples de collocations. Nous analysons la collocation « injonction de diversité ». La fiche recensée dans TERMIUM Plus et rédigée le 13 avril 2012, définit le collocateur « injonction » comme une « Ordonnance du tribunal enjoignant à une partie de s'abstenir, jusqu'à nouvel ordre, de faire tel ou tel acte ».13 Le GDT prévoit également une fiche terminologique rédigée par l’Office québécois de la langue française en 2014, dont la définition d’« injonction » est la suivante : « Ordonnance de la cour enjoignant à une personne physique ou morale de ne pas faire ou de cesser de faire quelque chose, ou d'accomplir une opération déterminée, sous peine de sanctions déterminées par la loi ». Une évolution importante se dessine : si une injonction se définissait auparavant par une interdiction, elle peut correspondre d’ores et déjà à l’imposition à accomplir, à mettre en place un principe ou un système déterminés. Nous avons retenu le pan de texte suivant, afin de pouvoir apprécier notre collocation en contexte : « L' au sein des conseils d'administration, ambitionne de transformer les différences de sensibilité et de références culturelles parmi les administrateurs hommes et femmes en performance durable pour l'entreprise. Mais ces différences de sensibilité et de référents culturels sont-elles en soi créatrices de valeur pour les parties prenantes ? La réponse à cette question est loin d'être évidente. [...] L'exigence de diversité dans le domaine du gouvernement d'entreprise est-il un simple moyen d'améliorer la performance d'une entreprise ? Rien n'est moins sûr dans la mesure où l'impact réel de la diversité et notamment de la diversité de genre sur la qualité des décisions prises par une équipe est largement incertain » (Pasqualini/Noël 2013, 41).
Le texte s’interroge sur l’exigence de diversité dans le domaine du gouvernement d’entreprise et sur le fait que, selon certains, il s’agit d’un simple moyen d’amélioration de la performance d’une entreprise, alors que pour d’autres, cela serait plutôt à interpréter comme un souci de parité se diffusant dans la société. Cet exemple montre, dans la lignée de l’étude de la dimension discursive des collocations (Pecman 2012) que notre travail n’a pas seulement pour fonction de marquer les profils cooccurrentiels spécifiques à une langue donnée mais également les sens qui se dégagent à partir d’association de termes récurrents dans une discipline et un texte donné. Sans nous détourner du propos prioritairement linguistique, il semble donc que la collocation terminologique « injonction de diversité » prône une politique de diversité, à savoir une exigence vertueuse qui impose une mise en application positive d’un principe plutôt que son interdiction. Dans l’ensemble des 12 collocations retenues, nous remarquons une combinatoire avec collocataire savant parce que composé d’un sigle : « imf » suivi du complé-
Aglion (1947).
Le phraséoterme à la confluence de la langue naturelle
165
ment de nom « à but lucratif ». Le sigle correspondant à la description « institution de microfinance » est certes connu par les professionnels du domaine de la finance et de la banque. En effet, il s’agit d’une organisation qui fournit des services à petite échelle, tels que l’épargne, le crédit et autres services financiers de base, à des personnes à faible revenu qui n’ont pas accès ou difficilement accès aux banques et aux services financiers traditionnels (GDT Office québécois de la langue française 2008). Dans le lexique de spécialité, l’homonymie est particulièrement diffusée parmi les sigles (Bertaccini et al. 2006), ce qui implique une connaissance extra-linguistique ; en plus d’« institut de microfinance », « imf » peut être également glosé par « institut maçonnique de France » et par « institut mennaisien de formation ». Des réglages de sens en contexte et, notamment, la spécification apportée par le collocataire courant à but lucratif, permettent de cerner le domaine de référence, tout en différenciant les institutions de microfinance ayant un statut d’organisation à but non lucratif des sociétés dont l'objectif principal est la réalisation de bénéfices. Pour conclure, nous avons remarqué la combinatoire collocateur savant+collocataire savant dans les exemples : « clause de quasi-usufruit » et « quote-part de mali ». Le domaine d’emploi de ces termes est respectivement celui du droit civil et de la comptabilité de gestion. Si le concept de « quasi-usufruit » ne rencontre pas de formes synonymiques parce que la fiche du GDT datant de 1974 n’en comporte pas, tout en nous informant qu’il s’agit d’un usufruit portant sur une chose consomptible, le deuxième exemple de terme complexe : « quote-part de mali » est intéressant à l’égard de la synonymie en terminologie. Bien qu’il ne s’agisse pas ici de l’un des axes d’exploration de notre travail, nous constatons que le terme mali dans le GDT rencontre la concurrence synonymique de « écart défavorable » et de « écart négatif », dont la définition donnée est la suivante : « Excédent des produits d'exploitation prévus sur les produits réels ; excédent des charges réelles sur les charges prévues ; excédent des coûts réels engagés sur les coûts de revient standard » (Dictionnaire de la comptabilité et de la gestion financière, 2006). Cet exemple nous permet de saisir la complexité des usages réels de la terminologie de notre domaine. La synonymie se présente comme un phénomène complexe, « physiologique » (Bertaccini et al., 2006) qui permet au système de fonctionner au mieux tout en valorisant son dynamisme et son enracinement dans certains sous-domaines. En l’occurrence, dans notre corpus, seul le terme mali est employé dans la combinatoire avec collocateur savant « quote-part » pour signifier la part de l’écart négatif entre l’actif net, positif ou négatif, reçu par l’entité absorbante et suite à une fusion de sociétés (Simons 2015). Force est de constater que dans notre corpus, le concept de « quote-part de mali » affiche son enracinement dans un sous-domaine bien ciblé relevant de la comptabilité de ges-
166
Michela Tonti
tion du régime des fusions des sociétés,14 ce qui paraît confirmer la remarque de Bertaccini et al. concernant l’importance de la synonymie en terminologie, l’emploi des termes et leur ancrage dans un secteur d’activité aux contours bien définis. À cet effet, il est utile de remarquer que le synonyme proposé par le GDT « écart défavorable » intervient au sein de notre corpus dans un article portant sur une étude du rôle des contrôleurs de gestion (Bollecker/Niglis, 2009).15 Il est évident que dans les contextes où la fonction discursive, voire communicative oblige, la LG emporte le domaine. Nous quittons l’analyse de la sélection de combinatoires comportant des formatifs spéciaux et généraux issus de notre corpus de langue de spécialité pour explorer la néoterminologie du patrimoine de la comptabilité.
5 Vers une liste de collocations terminologiques inédites : dépouillement de la liste d’extraction des termes complexes TermoStat 3.0 À l’aune de deux critères, à savoir et en premier lieu, un critère d’exclusion appliqué aux termes complexes attestés au préalable dans les bases de données consultées et deuxièmement un critère de pertinence conceptuelle des termes complexes détectés ne figurant dans aucune des bases de données retenues et citées ci-dessous, nous allons éclairer un échantillon de termes complexes émergeant de notre liste de 2499 termes polylexicaux créée à l’aide de TermoStat qui répondrait convenablement à notre quête initiale : serait-il envisageable de repérer des collocations terminologiques inédites au sein du patrimoine terminologique de la comptabilité et de l’économie d’entreprise ? Nous fournissons la liste des ressources terminologiques consultées : IATE, FranceTerme, Belterme, TERMDAT, Lingua-PC, GDT, TERMIUM Plus. Nous présentons un échantillon de distributions de termes complexes partiellement attestés dans les ressources respectives.
Pour de plus amples approfondissements, nous renvoyons au site du Bulletin Officiel des Finances Publiques et à l’onglet Impôts, https://bofip.impots.gouv.fr/bofip/7256-PGP.html/identi fiant=BOI-IS-FUS-10-50-10-20181003#Definition_du_mali_20 [Dernière consultation : 21.11.2021]. « Il y a des moments dans le processus, où les chefs de fabrication m’ont regardé de travers, notamment quand je participais à des réunions de direction. Ils avaient l’impression que je dénonçais des écarts défavorables. Dans ces cas, j’essaye de leur transmettre un signal qui les rassure ». (Propos d’un analyste financier de l’entreprise d’agrochimie).
Le phraséoterme à la confluence de la langue naturelle
167
Occurrences
Termes complexes partiellement attestés dans les bases de données consultées 10 9 8 7 6 5 4 3 2 1 0
9
9 8
3
3 2
réunion d' intégration
système d' confusion de opération de offres d' travail de incitation patrimoine confusion de acquisition priorisation patrimoine amicales Termes complexes
Figure 1 : Distribution des termes complexes partiellement attestés dans les ressources terminologiques consultées.
Nous souhaitons attirer l’attention sur la dernière donnée figurant dans le graphique : « travail de priorisation », terme-syntagme composé du collocateur « travail » et de son collocataire « de priorisation » qui joue pleinement son rôle spécificateur. Son contexte d’usage est le suivant : « Les managers ont fait finalement assez conventionnel en réservant, de fait, les réunions de Codir aux dimensions économiques et financières, le reste étant traité plus localement, souvent dans les usines » (Essid/Berland 2011, 72). Trois fiches terminologiques sont prévues par le GDT à cet effet, créées en 2006 elles conviennent de l’importance d’établir des priorités dans la gestion des tâches d’entreprise. TERMIUM Plus recense le terme complexe priorisation du travail dans une fiche remontant à 1997, le noyau est inversé mais la portée conceptuelle demeure invariée. Bien que sa survie terminologique semble consolidée, IATE ne lui accorde qu’une seule entrée et uniquement pour le domaine des transports aérien et spatial dans l’acception de « priorisation des inspections au sol ». Dans notre fouille de termes complexes à collocations terminologiques inédites, nous renseignons la liste complète que nous avons détectée, à l’aide du graphique suivant :
168
Michela Tonti
Collocations inédites non recensées dans les bases de données consultées rescrit social
1 2 2
fonction contrôle de gestion omnipotente
3 3 3 3 3 3
holding de reprise Termes complexes
allocataires de quotas ordinateur à roues
4 4 4 4
échantillons d'estimation cause de nonqualité
5 5
accruals discrétionnaires
6 manager de terrain
8 9 9
régime frais de santé
12 12
apporteurs de ressources
13 score d'inefficience
14 0
2
4
6 8 10 Occurrences
12
14
16
Figure 2 : Distribution des collocations inédites non recensées dans les bases de données consultées.
Nous retenons les collocations suivantes qui ne sont pas attestées dans nos ressources terminologiques : « rescrit social » « manager de terrain » « accruals discrétionnaires », « ajustement non discrétionnaire » « ajustement cosmétique » « fonction contrôle de gestion discrète », « garde-fou », « partenaire » ou « omnipotente » Dans le souci de vérifier si un modèle de néologie terminologique s’impose, il semble encore une fois que le modèle incrémental que nous avons auparavant signalé pour le terme complexe « accruals discrétionnaires » caractérise l’échantillon ci-proposé (au total 18 termes complexes). Avant d’explorer la démarche incrémentaliste, il nous appartient d’expliquer les collocations « accruals discrétionnaires » et « ajustement non discrétionnaire », pour lesquelles nous observons une interchangeabilité dans les emplois terminologiques. À savoir, le terme accruals désigne l’ensemble des ajustements qui permettent de passer d’une comptabilité de caisse à une comptabilité d’engagement. Les accruals correspondent à l’écart entre le résul-
Le phraséoterme à la confluence de la langue naturelle
169
tat net et le flux de trésorerie d’activité. C’est un indicateur synthétique qui agrège l’ensemble des variables sur lesquelles les dirigeants peuvent intervenir pour influencer les résultats. Les « accruals discrétionnaires » sont, autrement dit, la composante manipulable des accruals (Elleuch Hamza 2008) alors que les ajustements « normaux » sont liés aux évolutions économiques de l’entreprise. Seule la partie discrétionnaire des accruals peut faire l’objet d’une gestion de résultat. Des ajustements, certes, mais qui ne sont guère « cosmétiques » comme il en découle des contextes d’usage repérés en corpus. En revanche, la collocation « ajustement cosmétique » intervient pour signifier des retouches, des camouflages pour aménager la façade des produits financiers tunisiens qui mal s’agenceraient avec les préceptes financiers de la Charia (Lévy/Rezgui 2012). La connotation négative dont le collocataire courant « cosmétique » serait porteur affecte également les services de l’OMC,16 aux dires de l’auteur de l’article traitant de l’efficacité du bureau d’audit interne de l’OMC : « L'OMC compte un bureau d'audit interne – et encore, seulement depuis 2008 – mais ne se prête guère à l'audit externe. En interne, […] le personnel fait preuve d'une surprenante capacité d'autoréflexivité, exerçant un sens critique aiguisé et s'exprimant volontiers sur les difficultés rencontrées par l'organisation. En revanche, il n'est pas question qu'un tiers extérieur vienne donner son avis sur l'organisation. Les demandes croissantes des pays émergents de réformer les processus de décision n'ont donné lieu qu'à des changements cosmétiques » (Schemeil 2014, 32–33).
De surcroît, si le comité d’audit était perçu comme un mécanisme cosmétique aussi bien au sein d’une organisation internationale que d’une entreprise (Compernolle 2009), d’après de récents travaux sur l’efficacité du comité d’audit, il est désormais ressenti comme un mécanisme pouvant avoir des effets substantiels, des effets sur les auditeurs externes, et par ricochet sur leur indépendance. Certes, il ne nous appartient pas de juger de la véracité de ces propos mais il nous semble que du point de vue linguistique, le collocataire « cosmétique » préserve un caractère de vacuité alors qu’« ajustement » convient aussi bien pour signifier un arrangement peu orthodoxe que pour illustrer un mécanisme de prise de décision factuelle et efficace, ce qui s’applique à la collocation « accruals discrétionnaires ». Pour conclure, le collocataire apporte son trait saillant et distinctif au collocateur dans l’unité « rescrit social » ; si un « rescrit » désigne selon le GDT « Interprétation officielle d'un texte donnée par l'Administration sur la demande d'un administré », nous concluons qu’il s’agit d’une interprétation officielle d’un texte donné par l’Administration en matière de prévoyance sociale. Par ailleurs, le site de l’URSSAF (Unions de recouvrement des cotisations de sécurité sociale et d’allo-
Organisation Mondiale du Commerce.
170
Michela Tonti
cations familiales)17 recense le « rescrit social » en tant que « dispositif permettant d’obtenir une décision explicite de l’organisme de recouvrement sur l'application, à une situation précise, de la réglementation ». Désormais, la demande de rescrit social peut porter sur l’ensemble de la législation relative aux cotisations et contributions de Sécurité sociale contrôlées par ces organismes. Cette procédure est également applicable aux autres cotisations et contributions sociales contrôlées par ces organismes dès lors que leur assiette est identique à celle des cotisations et contributions de Sécurité sociale ».18 Cela montre l’ancrage de cette collocation dans les supports institutionnels. Le collocataire « de terrain » dans la collocation « manager de terrain » joue pleinement son rôle de spécificateur. Appartenant à la hiérarchie intermédiaire, le « manager de terrain » renoue avec la notion de débrouillardise domestique, étymologiquement, le verbe « manager » signifie bien conduire ses affaires de ménage, sa maison, son bien. Au XXIème siècle, on rejoint cette notion de débrouillardise domestique correspondant ici à la facilité d’aller à l’encontre de ses collaborateurs. Le collocataire fonctionne en tant que spécificateur et semblerait hautement terminogène.
Termes complexes avec expansion adjectivale
Catégorisation conceptuelle d'un terme complexe
fonction contrôle de gestion omnipotente
2
fonction contrôle de gestion partenaire
3
fonction contrôle de gestion garde-fou
4
fonction contrôle de gestion discrète
6
0
1
2
3 4 Occurrences
5
6
7
Figure 3 : Distribution de la collocation « fonction contrôle de gestion » suivie d’un spécificateur.
Les URSSAF sont des organismes privés chargés d’une mission de service public, relevant de la branche « recouvrement » du régime général de la sécurité sociale (source Wikipedia). https://www.urssaf.fr/portail/home/utile-et-pratique/le-rescrit-social.html?ut=outils-en-ligne [dernière consultation : 23.11.2021].
Le phraséoterme à la confluence de la langue naturelle
171
Attestée en 2008 au sein de notre corpus technique, la métaphore garde-fou a pour fonction de déterminer le concept et la méthode sur lesquelles repose la fonction gestion de contrôle, une méthode contraignante qui ne laisserait guère de place à la créativité des commerciaux et des responsables marketing. Humbley (2018), dans son étude sur les modèles néologiques en terminologie, souligne que la prépondérance des unités nominales en terminologie n’a pas empêché de nombreux linguistes, surtout ces dernières années, d’étudier les autres catégories grammaticales susceptibles de remplir des fonctions terminologiques, soit en tant qu’élément autonome, soit comme partie d’un syntagme nominal. Il cite Portelance (2000, 149) qui adopte une démarche incrémentaliste lorsqu’elle se penche sur ce qu’elle appelle « les adjectifs terminogènes » de la matrice [N+Adj.]. L’analyse met en lumière des séquences généralement figées, auxquelles d’autres éléments peuvent s’adjoindre, représentées par la matrice : [N+ N +prep. + N + Adj.], « fonction contrôle de gestion discrète » en serait le prototype. « Contrôle » : complément du nom « fonction » ; « de gestion » : complément du nom « contrôle » ; « discrète » : adjectif qualificatif.
6 Bases de données : mise au clair des termes recensés À partir de l’état des lieux que nous avons effectué dans les bases de données IATE, FranceTerme, Belterme, TERMDAT, Lingua-PC, GDT, TERMIUM Plus, nous dressons le tableau suivant :
Aucune fiche correspondante
Range accrual Aucune fiche correspondante
Belterme Accrual
Lingua-PC
Comptabilité basée sur Comptabilité l'exercice ; Comptabilité d’exercice ; Accrual d’exercice ; Accrual accounting accounting Domaine : Finances publiques Domaine : Comptabilité ; finance
TERMDAT
Synonymes de accrual accounting suivant l’ordre par lequel ils sont proposés par la base de données. Accrual accounting est signalé en tant qu’ anglicisme, son emploi n’est pas préconisé.
Domaine : Comptabilité ; finance
FranceTerme
IATE
Bases de données
Accrual
TERMIUM Plus
Domaine : Domaine : Comptabilité, Comptabilité comptabilité générale générale Gestion budgétaire et financière
Accrual
GDT
Tableau 5 : Mise au point des entrées et de leur combinatoire attestée dans sept bases de données terminologiques consultées.
172 Michela Tonti
Auteur : Prospectus de produits financiers de différents émetteurs [..] Auteur : DFF, Services linguistiques centraux, [] Auteur : IFAC, IPSAS, , ch.
Auteur : Office québécois de la langue française,
(suite)
Auteur : Ménard, Louis, et al. Dictionnaire de la comptabilité et de la gestion financière : anglais-français avec index français-anglais. Toronto, Institut canadien des comptables agréés, [..].
Le phraséoterme à la confluence de la langue naturelle
173
Définition : Système d'intérêts courus variables en fonction du nombre de jours où le taux de référence est compris dans une fourchette fixée.
IATE
Tableau 5 (suite)
FranceTerme
Belterme Définition : Méthode de comptabilisation qui consiste à tenir compte, dans la détermination du résultat net d'une entité, des produits et des charges découlant des opérations d'un exercice lorsque les produits sont gagnés et les charges engagées, sans considération du moment où les opérations sont réglées par un encaissement ou un décaissement ou de toute autre façon.
TERMDAT Définition : Convention comptable qui prévoit la comptabilisation d’opérations et d’autres événements au moment où ils se produisent.
Lingua-PC
Bases de données
Définition : Comptes résultant de l'application du principe de l'indépendance des exercices et de celui du rapprochement des produits et des charges.
GDT
Définition : Élément d'actif auquel correspond un produit au titre de biens ou de services qui ont été vendus ou fournis, mais qui n'ont pas été encaissés, facturés ou n'ont pas encore fait l'objet d'un accord formalisé avec le client ou le débiteur.
TERMIUM Plus
174 Michela Tonti
Domaine : Finance
Auteur : Journal officiel du //
Domaine : Économie, Statistique
Auteur : Base de données Euterpe [..] Définition : opération qui consiste à atténuer les irrégularités d'une distribution de fréquences dues aux fluctuations d'échantillons.
Définition : Changement brusque de parité, lié à une modification de données économiques exogènes (par exemple,
Ajustement
Ajustement Aucune fiche correspondante
Auteur : AFF, Terminologie relative au NMC, [..]
Domaine : Comptabilité et finances
Compte d'ajustement
Ajustement
Définition : Opération comptable consistant à ajouter aux données comptabilisées une ligne correspondant à des opérations non recensées ou à des erreurs de comptabilisation, pour équilibrer un compte.
Auteur : Leclère D., L’essentiel de la comptabilité analytique, , p.
Domaine : Comptabilité, gestion, finances publiques
Ajustement linéaire
Définition : Procédure mise en œuvre en vue de rétablir la concordance
Auteur : Institut Canadien des Comptables Agréés, . Article tiré du Dictionnaire de la comptabilité et de la gestion financière.
Domaine : Comptabilité, tenue des livres
Ajustement
(suite)
Auteur : Ménard, Louis, et al., Dictionnaire de la comptabilité et de la gestion financière : anglais-français avec index français-anglais. Toronto : Institut canadien des comptables agréés, . [..]
Domaine : Comptabilité générale, comptabilité publique
Ajustement
Le phraséoterme à la confluence de la langue naturelle
175
IATE
Tableau 5 (suite)
modification de taux d'intérêt directeur à court terme), allant audelà de ce que nécessite l'évolution des équilibres de long terme.
FranceTerme
Belterme
TERMDAT
Définition : Différence d’incorporation entre la comptabilité financière et la comptabilité analytique, lorsque les charges présentes dans la comptabilité financière ne concernent pas l’activité principale et doivent être exclues ou lorsque les charges concernant l’activité
Auteur : Andersen, Bula,
Domaine : Comptabilité, Finances publiques
Ajustement objectif
Lingua-PC
Bases de données
entre deux comptes ou deux séries de données.
GDT
Définition : Procédure mise en œuvre en vue de rétablir la concordance entre deux comptes ou deux séries de données
TERMIUM Plus
176 Michela Tonti
Aucune fiche correspondante
Aucune fiche correspondante
Aucune fiche correspondante
Auteur : ISB, Louis Belle, ..
Domaine: Gestion
Fonction contrôle de gestion Aucune fiche correspondante
Fonction contrôle de gestion
principale ne figurent pas dans la comptabilité financière et doivent être ajoutées dans la comptabilité analytique.
Aucune fiche correspondante
(suite)
Aucune fiche correspondante
Le phraséoterme à la confluence de la langue naturelle
177
IATE
Tableau 5 (suite)
FranceTerme
Belterme Définition : Fonction, qui est assumée par les personnes ayant le pouvoir décisionnel pour un projet, un programme, un système d'applications ou un portfolio (gestion, gestion de programme [responsable de programme], direction de programme, direction stratégique).
TERMDAT
Lingua-PC
Bases de données GDT
TERMIUM Plus
178 Michela Tonti
fiches ; aucune fiche correspondante
Définition : Assurer le management de. Note : Ce terme ne doit pas se prononcer à l'anglaise.
Auteur : Révision de l'arrêté du novembre . Journal officiel du //
Domaine : Économie et gestion d’entreprise
Manager Manager et tous les collocateurs recensés Domaine : dans Termdat Économie et – Manager de médias gestion diplômé ; d’entreprise – manager en transports publics Auteur : diplômé ; Journal Officiel – manager en du mai publication avec diplôme fédéral (DF) ; Définition : – manager de Chef de produit remontées qui applique la mécaniques avec mercatique à diplôme fédéral ; l'ensemble de la – manager en chaîne commerce de détail allant de la avec diplôme fédéral ; détection d'une catégorie de besoins à leur satisfaction.
Manager
Définition : Personne qui est chargée d’analyser, de planifier et de gérer les initiatives de changement et de prodiguer des conseils à cet égard. [d’après TERMIUM (Web), ]
Auteurs : Valière N. et Pilloud J., Loup y es-tu ? (Web, )
Domaine : Technologies de l’information et de la communication
Manager du changement
Manager de terrain Aucune fiche correspondante
(suite)
Aucune fiche correspondante
Le phraséoterme à la confluence de la langue naturelle
179
IATE
Tableau 5 (suite)
Définition : Chef de produit qui applique la mercatique à l'ensemble de la
Auteur : Journal officiel du //
Manageur de produits Domaine : Économie et gestion d’entreprise
FranceTerme
Belterme – marketing manager diplômé ES ; – manager en tourisme ; – manager de systèmes ; – manager de promotion ; – manager d'imprimerie ; – manager technique ; – manager d'équipement ; – manager d'entreprise ; – manager d'exportation ; chaîne allant de la détection d'une catégorie de besoins à leur satisfaction. – manager logistique ; – manager sportif ; – manager de galerie ;
TERMDAT
Lingua-PC
Bases de données GDT
TERMIUM Plus
180 Michela Tonti
Domaine : Tous domaines
Définition: interprétation fournie par l'Administration fiscale, à la demande d'un contribuable, de certaines dispositions précises de la loi dans leur application à une opération ou un montage financier qu'envisage ce contribuable. Il s'agit d'une Domaine : Tous domaines
Rescrit Domaine : Impôts, droit financier et droit fiscal
Rescrit fiscal
Auteur : Auteur : Journal Officiel du Journal Officiel Auteur : // du // Le grand dictionnaire terminologique, Définition : Définition : « rescrit Interprétation Interprétation fiscal » (Internet, officielle d’un officielle d’un //) texte donnée par texte donnée l’Administration par sur la demande l’Administration d’un administré sur la demande d’un administré.
Rescrit
Rescrit fiscal
Rescrit
– manager en construction ; – manager de projet ; – manager du personnel ; – manager Order Processing ; – manager de production.
Aucune fiche correspondante
Définition : Interprétation fournie par l'Administration fiscale, à
Auteur : Institut Canadien des Comptables Agréés,
Rescrit Domaine : Économie
(suite)
Aucune fiche correspondante
Le phraséoterme à la confluence de la langue naturelle
181
procédure par laquelle un contribuable sollicite, à propos d'un projet, l'avis préalable de l'administration. Celle-ci est liée par la position qu'elle a prise si la demande a été formulée de bonne foi et si le contribuable a fourni une information complète. En vigueur en Belgique depuis [], la technique du ruling est pratiquée avec un succès certain au Canada, en GrandeBretagne, en France et aux Pays-Bas.
IATE
Tableau 5 (suite)
FranceTerme
Belterme Interprétation écrite fournie par l'administration fiscale, à la demande du contribuable, de certaines dispositions précises de la loi dans leur application à une ou plusieurs opérations projetées par ce dernier. Le grand dictionnaire terminologique, « rescrit fiscal » (Internet, //)
TERMDAT
Lingua-PC
Bases de données
Auteur : Commission d'enrichissement de la langue française (France), FranceTerme,
Domaine : Droit, gestion
Rescrit
la demande d'un contribuable, de certaines dispositions précises de la loi dans leur application à une opération ou à un montage financier qu'envisage ce contribuable.
GDT
TERMIUM Plus
182 Michela Tonti
Dans le cas où une personne physique ou morale a un doute sur des déclarations fiscales ou sur ses droits face à un texte fiscal de l'administration, elle peut demander la position officielle de cette administration par écrit. Cet écrit, le rescrit fiscal, engage l'administration sur les contrôles ultérieurs qui pourraient être faits à l'encontre de la personne physique ou morale. Définition : Interprétation officielle d'un texte donnée par l'Administration sur la demande d'un administré.Rescrit Domaines :Droit, gestion Auteur : Office québécois de la langue française, Définition : Interprétation fournie par l'Administration fiscale, à la demande du contribuable, de certaines dispositions précises de la loi dans leur application à une ou plusieurs opérations projetées par ce dernier.
Le phraséoterme à la confluence de la langue naturelle
183
184
Michela Tonti
À une lecture du tableau, il est indéniable que les possibilités de combinatoires qui s’ouvrent à nos yeux sont fort amples. En guise d’exemple, nous retenons que TERMDAT introduit 21 matrices globalement constituées par la séquence nom+adjectif pour le terme « manager ». La pertinence de ces combinatoires est tout à fait justifiée par le potentiel terminogène de l’adjectif qui a une force conceptuelle insoupçonnée. Or, aucune des bases consultées ne recense les collocations inédites réunies dans les figures 2 et 3, alors qu’elles circulent dans les textes de professionnels avisés : cela marque l’exigence d’une mise à jour constante de ces outils.
7 Conclusion À l’aune de notre recherche qui s’appuie sur un corpus de langue de spécialité représentatif aussi bien en raison de son envergure que de son authenticité, nous dressons le constat qu’au sein du domaine de la comptabilité et pour les combinatoires possibles, des formatifs savants alternent avec des formatifs de la langue générale bien que les collocataires savants qui jouent pleinement leur rôle de spécificateur soient légèrement plus nombreux. L’exploration des combinatoires envisageables a permis de mettre en valeur la portée culturelle de certains collocataires mobilisés comme celui de guanxi qui apporte une connotation insoupçonnée au terme réseau. La compétence phraséologique peut guider la constitution du savoir encyclopédique. La langue spécialisée, qui sous son aspect collocationnel est plus naturelle que formelle, exige une intégration complémentaire de la langue courante et de la langue savante. Par ailleurs, nous avons essayé de replacer la phraséologie dans le domaine de l’analyse du discours et de la structuration informationnelle du texte, c’est-àdire de la construction du sens au niveau du texte grâce aux analyses que nous avons menées. L’analyse de la collocation « injonction de diversité », par exemple, prône dans le texte sélectionné une politique de diversité, à savoir une exigence vertueuse qui impose une mise en application positive d’un principe plutôt que son interdiction, contrairement à la définition fournie par le GDT. L’analyse des collocations spécifiques à un domaine de connaissances a mis également en évidence le rôle spécifique de la collocation « quote-part de mali » au sein d’un sousdomaine fort ciblé qui exclut de pouvoir avoir recours aux formes synonymiques consignées par les bases de données terminologiques consultées, notamment GDT et TERMIUM Plus. Cela s’avère d’importance capitale pour bien cerner les contextes d’usage pour certains professionnels comme les interprètes et les traducteurs.
Le phraséoterme à la confluence de la langue naturelle
185
Dans un deuxième temps et dans une perspective d’enrichissement des savoirs terminologiques, nous avons détecté une batterie de collocations inédites au sein du panorama terminologique de la comptabilité que nous avons dépouillé. Le modèle néologique à expansion incrémentale semble s’imposer comme modèle de prédilection. Ce travail d’exploration néologique a été conduit grâce à la consultation de sept bases terminologiques de grande envergure. L’absence des termes complexes repérés nous permet de conclure qu’une sorte de zone grise au sein des bases de données consultées semblerait persister dans la définition de la pertinence conceptuelle d’une expansion adjectivale. Il nous semble important de souligner que les termes complexes renseignés dans les graphiques 2 et 3, mériteraient d’intégrer les ressources terminologiques pour leur créativité et valeur ajoutée ; d’autant plus que certaines de ces collocations comme « rescrit social » circulent abondamment au sein des sites institutionnels ou des communautés de publics avisés. Finalement, s’il est indéniable que l’étude jusqu’ici menée n’a qu’une valeur expérimentale et que des fiches terminologiques pour la validation des termes complexes pointus s’imposent, une évidence a ainsi pris forme : la détection de nouveaux termes complexes dans le domaine technique abordé nécessite d’outils plus consistants que le corpus que nous avons créé.
Bibliographie Aglion, Raoul, Dictionnaire juridique : anglais-français, New York, Brentano’s, 1947. Auroux, Sylvain, La raison, le langage et les normes, Paris, PUF, 1998. Belterme : http://www.franca.cfwb.be/bd/bd.htm [dernière consultation : 21.11.2021]. Bertaccini, Franco/Prandi, Michele/Sintuzzi, Samantha/Togni, Silvia, Tra lessico naturale e lessici di specialità. La sinonimia, in : Bombi, Raffaella/Cifoletti, Guido/Fusco, Fabiana/Innocente, Lucia/ Orioles, Vincenzo (edd.), Studi linguistici in onore di Roberto Gusmani, Alessandria, Edizioni dell'Orso, 2006, 171–192. Bollecker, Marc/Niglis, Patricia, L’adhésion des responsables opérationnels aux systèmes de contrôle. Une étude du rôle des contrôleurs de gestion, Comptabilité contrôle audit 15 (2009), 133–157. Cabré, Maria Teresa, La Terminologie. Théorie, méthode et applications, Ottawa, Les Presses de l’Université d’Ottawa, 1998. Compernolle, Tiphaine, La construction collective de l’indépendance du commissaire aux comptes. La place du comité d’audit, Comptabilité contrôle audit 3 (2009), 91–116. Depecker, Loïc (ed.), La mesure des mots. Cinq études d'implantation terminologique, Rouen, Publications de l'Université de Rouen, 1997. Drouin, Patrick, Term extraction using non-technical corpora as a point of leverage, Terminology 9 (2003), 99 –117. Drouin, Patrick, Detection of domain specific terminology using corpora comparison, in : Proceedings of the language resources and evaluation conference (LREC), Lisbon, ELRA, 2004, 79–82, http://www. lrec-conf.org/proceedings/lrec2004/pdf/49.pdf [dernière consultation : 21.11.2021].
186
Michela Tonti
Dubuc, Robert, Manuel pratique de terminologie, Brossard, Linguatech, 1985. Elleuch Hamza, Sarra, Les spécificités de la gestion des résultats des entreprises tunisiennes à travers une démarche par entretiens, La comptabilité, le contrôle et l’audit entre changement et stabilité, 2008, CD-ROM, https://halshs.archives-ouvertes.fr/halshs-00524887/document [dernière consultation : 21.11.2021]. Essid, Moez/Berland, Nicolas, Les impacts de la RSE sur les systèmes de contrôle, Comptabilité contrôle audit 2 (2011), 59–88. Frassi, Paolo, DIACOM-fr une base de données terminologiques de type diachronique, Cahiers de lexicologie 118 (2021), 23–49. Frassi, Paolo/Calvi, Silvia/Humbley, John, Fouille de textes et repérage d’unités phraséologiques, in : Terminologie & ontologie. Théories et applications. Actes de la conférence TOTh 2019, Chambéry, Presses Universitaires Savoie Mont Blanc, 2020, 321–338. Gaudin, François, Socioterminologie. Une approche sociolinguistique de la terminologie, Bruxelles, Duculot, 2003. Gréciano, Gertrud, Vers une modélisation phraséologique. Acquis et projets d’EUROPHRAS, Terminologies nouvelles 10 (1993), 16–22. Gréciano, Gertrud, Collocations rythmologiques, Meta. Journal des traducteurs/Meta. Translators’ journal 42 (1997), 33–44. Habert, Benoît, Des corpus représentatifs. De quoi, pour quoi, comment ?, in : Bilger, Mireille (ed.), Linguistique sur corpus, Perpignan, Presses Universitaires de Perpignan, 2000, 11–58. Hausmann, Franz Josef, Le dictionnaire des collocations, in : Hausmann, Franz Josef/Ungeheuer, Gerold/Steger, Hugo/Wiegand, Herbert Ernst/Burkhardt, Armin (edd.), Wörtherbücher. Ein internationales handbuch zur lexicographie, Berlin/New York, Walter de Gruyter, 1989, 1010–1019. Hausmann, Franz Josef/Blumenthal, Peter, Présentation. Collocations, corpus, dictionnaires, Langue française 150 (2006), 3–13. Humbley, John, La néologie terminologique, Limoges, Lambert-Lucas, 2018. Laulusa, Léon/Eglem, Jean-Yves, L'impact des valeurs confucéennes sur le processus de contrôle de gestion dans une entreprise d'état chinoise, ACCRA. Association francophone de comptabilité 17, 2011, 7–29. Lévy, Aldo/Rezgui, Hichem, Politique des banques islamiques et principe comptable de la prééminence du fond sur la forme, Revue française de comptabilité 452 (2012) [pagination non disponible]. Mel’čuk, Igor, Phraséologie dans la langue et dans le dictionnaire, Repères & applications VI (2008), 187–200. Mel’čuk, Igor, Tout ce que nous voulions savoir sur les phrasèmes, mais…, Cahiers de lexicologie 102:1 (2013), 129–149. Mel’čuk, Igor/Polguère, Alain, Les fonctions lexicales dernier cri, in : Marengo, Sébastien (ed.), La théorie Sens-Texte. Concepts-clés et applications, Paris, L’Harmattan, 2021, 75–155. Pasqualini, Raphaël/Noël, Christine, La diversité de genre dans les conseils d'administration en France. Les femmes sont-elles l'avenir du gouvernement d'entreprise ?, Revue française de comptabilité 463 (2013), 38–41. Pavel, Silvia, Vers une méthode de recherche phraséologique en langue de spécialité, L’actualité terminologique 26 (1993), 9–13. Pecman, Mojca, Étude lexicographique et discursive des collocations en vue de leur intégration dans une base de données terminologiques, The journal of specialised translation (JoSTrans) 18 (2012), 113–138. Polguère, Alain/Mel’čuk, Igor, Dérivations sémantiques et collocations dans le DiCo/LAF, Langue française 150 (2006), 66–83.
Le phraséoterme à la confluence de la langue naturelle
187
Portelance, Christine, Le statut exceptionnel de l’adjectif dans le syntagme dénominatif, in : Mejri, Salah/ Clas, André/Baccouche, Taâeb/Gross, Gaston (edd.), La traduction. Diversité linguistique et pratiques courantes. Actes du colloque international traduction humaine, traduction automatique, interprétation, Tunis, Orbis, 2000, 149–158. Silva, Raquel/Costa, Rute/Ferreira, Fátima, Entre langue générale et langue de spécialité une question de collocations, Études de linguistique appliquée 135 (2004), 347–359. Schemeil, Yves, L’OMC, une organisation hybride et résiliente, Revue française de comptabilité 477 (2014), 31–36. Simons, Pascal, Fusions et opérations assimilées. Les réponses de la commission des études comptables de la CNCC, Revue française de comptabilité 484 (2015) [pagination non disponible]. Sinclair, John, Corpus, concordance and collocation, Oxford, Oxford University Press, 1991. Temmerman, Rita, Towards new ways of terminology description.The sociocognitive approach, Amsterdam/Philadelphia, John Benjamins, 2000.
Sitographie FranceTerme : http://www.culture.fr/franceterme [dernière consultation : 28.09.2021]. French Web 2017 (frTenTen17) plateforme SketchEngine : https://app.sketchengine.eu/#dashboard?cor pname=preloaded%2Ffrtenten17_fl2 [dernière consultation : 28.10.2021]. Le grand dictionnaire terminologique (GDT) : http://gdt.oqlf.gouv.qc.ca/ [dernière consultation : 28.09.2021]. Interactive terminology for Europe (IATE) : https://iate.europa.eu/home [dernière consultation : 28.10.2021]. Lingua-PC : https://www.linguapc.apps.be.ch/ [dernière consultation : 20.10.2021]. ProQuest : https://www.proquest.com/ [dernière consultation : 28.07.2021]. TERMDAT : https://www.termdat.bk.admin.ch/ [dernière consultation : 02.09.2021]. TERMIUM Plus : https://www.btb.termiumplus.gc.ca/tpv2alpha/alpha-fra.html [dernière consultation : 19.11.2021].
Ping-Hsueh Chen, Rui Yan
Les constructions Verbe causatif + Nom dans les textes institutionnels Approche contrastive (français/chinois) Résumé : La présente étude compare les constructions Verbe causatif + Nom du français avec des structures sémantiquement similaires en chinois dans le corpus institutionnel de l’Organisation des Nations Unies (ONU). En effet, les verbes sont plus riches en termes de quantité que les autres moyens d’expression de la cause. Après une brève définition du terme lexique verbal causatif et une présentation du corpus et de la méthode d’analyse, nous procédons à une analyse approfondie des constructions Verbe causatif + Nom les plus fréquentes au sein du corpus de l’ONU, sur les plans syntaxique, sémantique et pragmatique. Cette opération permet d’éclaircir leurs propriétés sémantiques dans un discours institutionnel. Par ailleurs, en nous appuyant sur l’approche contrastive, nous relevons les équivalents chinois de ces constructions causatives. Afin de mieux classer ces équivalents chinois, nous adoptons le classement des mécanismes causatifs de Dixon (2000). L’approche contrastive offre une description détaillée des fonctionnements des moyens d’expressions de la causalité en français et en chinois. Mots-clés : combinaisons (semi-)figées, constructions causatives, approche contrastive et fonctionnelle, textes institutionnels Abstract: The present study compares the Causative verb + Noun constructions in French with semantically similar structures in Chinese in institutional texts from the United Nations (UN). Indeed, in French, verbs are more numerous than the other means of expression of cause. After a brief definition of the causative verbal lexicon and a presentation of the corpus and the analysis method, we present a thorough analysis of the most frequent Causative verb + Noun constructions within the UN corpus, on the syntactical, semantic and pragmatic levels. This operation allows us to clarify their semantic properties in an institutional context. Moreover, relying on the contrastive approach, we identify the Chinese equivalents of these French causative constructions. In order to better classify these Chinese equivalents, we adopted Dixon’s (2000) classification of causative mechanisms. The contrastive approach offers a detailed description of the means of expression of causality functioning in French and Chinese.
https://doi.org/10.1515/9783110749854-010
190
Ping-Hsueh Chen, Rui Yan
Keywords: (semi-)fixed combinations, causative constructions, contrastive and functional approach, institutional texts
1 Introduction Dans cette étude, nous proposons de comparer les combinaisons Verbe causatif + Nom1 du français avec des structures ayant le même sens en chinois dans un corpus institutionnel. Le choix du verbe causatif se justifie par son nombre et sa fréquence relativement importants comparés à d’autres moyens d’expression de la cause, comme par exemple, les connecteurs logiques, les noms, les adjectifs et les adverbes (voir Nazarenko 2000, 137). L’intérêt de notre étude se justifie d’abord parce qu’il est intéressant de comparer le français avec une langue distante comme le chinois pour voir les différents moyens utilisés dans l’expression de la causalité, vu que cette comparaison est encore relativement peu étudiée ; et ensuite parce que ces collocations lexicales définies comme des associations (semi-)figées et sémantiquement compositionnelles (Tutin 2013) sont fréquentes en langue de spécialité et constituent souvent des déficits persistants des apprenants du FLE (Bak Sienkiewicz 2016). La causalité est définie ici comme la relation de cause à effet (A cause B) et elle renvoie aux moyens linguistiques dont disposent les langues. En nous basant sur le classement des mécanismes causatifs de Dixon (2000), qui catégorise les moyens d’expression de la cause en fonction de leur compacité morpho-syntaxique, nous cherchons à mettre en évidence les relations syntaxico-sémantiques entre les verbes causatifs et les noms et à relever les équivalents chinois dans un corpus parallèle bilingue (français→chinois) composé de textes institutionnels de l’Organisation des Nations Unies (désormais, ONU). En adoptant une approche contrastive, nous formulons les questions suivantes : Quelles sont les combinaisons Verbe causatif + Nom les plus récurrentes dans le corpus de l’ONU ? Quelles sont leurs propriétés sémantiques dans le discours institutionnel ? Quels sont les équivalents chinois les plus fréquemment employés dans le discours institutionnel ? Dans les sections qui suivent, nous présenterons d’abord les travaux existants portant sur le lexique verbal causatif. Nous aborderons dans un deuxième temps notre corpus et notre modèle d’analyse – le classement des mécanismes causatifs de Dixon (2000). Nous montrons ensuite les analyses contrastives avant de récapituler les équivalents fonctionnels chinois des constructions causatives V causatif + N.
Les combinaisons Verbe causatif + Nom sont considérées comme des collocations dans notre étude.
Les constructions Verbe causatif + Nom dans les textes institutionnels
191
2 Le lexique verbal causatif Le terme lexique verbal causatif est utilisé ici dans son sens large. Il désigne tous les moyens verbaux d’expression de la cause. Par exemple, les quatre mécanismes causatifs proposés par Dixon (2000), à savoir les mécanismes lexical (L : causer, provoquer) et morphologique (M : moderniser, simplifier), le prédicat complexe (PC : faire + Vinf) ainsi que la construction périphrastique moins grammaticalisée (P : V1 causatif + V2, forcer qqn à + Vinf). Dans cette recherche, nous nous intéressons au mécanisme causatif lexical, soit les verbes causatifs. Leur sémantisme inclut « le sens causer exprimé phraséologiquement auprès du nom qui le[s] sélectionne lexicalement » (Alonso Ramos 1998, 217). En outre, ces verbes constituent le moyen le plus riche pour exprimer la causalité en français. Plusieurs chercheurs (Nazarenko 2000 ; Gross et al. 2009 ; Diwersy/François 2011) ont proposé un classement sémantique et syntaxique des verbes causatifs et ils s’accordent à dire qu’il s’agit d’un groupe lexicalement et syntaxiquement complexe. Notre analyse linguistique est donc basée sur la liste des verbes causatifs préalablement établie par ces chercheurs. Par ailleurs, il est important de souligner que les verbes causatifs ont souvent tendance à sélectionner des noms restreints (Gross et al. 2009 ; Diwersy/François 2011). Par exemple, Bak Sienkiewicz (2016) a montré que les verbes causatifs sélectionnent préférentiellement certaines classes de noms d’émotion comme créer une surprise, provoquer la colère dans un corpus journalistique. Tout comme Bak, nous souhaitons relever les noms les plus saillants associés aux verbes causatifs dans le discours spécialisé. En ce qui concerne le chinois, Basciano (2010 ; 2013) a souligné que trois moyens principaux sont employés pour exprimer la causalité : la construction périphrastique (« V1 causatif 使 shǐ ‘faire en sorte que’/让 ràng ‘laisser’ + V2 »), les verbes complexes avec des verbes supports de causation (« V1 support + V2/adj. : 加 jiā ‘augmenter, ajouter’ + 強 qiáng ‘fort’ (traduisible par ‘renforcer’) ») ainsi que la construction résultative « V 压 yā ‘appuyer’ + complément résultatif (CR) 断 duàn ‘casser’ ». Nous illustrons ces moyens dans la partie de l’analyse contrastive. En revanche, il existe peu d’études qui comparent les constructions causatives françaises et chinoises d’où l’intérêt de notre étude. Nous pouvons mentionner l’étude de Hu (2017) qui a comparé les constructions formées par la combinaison d’un verbe causatif (comme les verbes faire ou laisser en français, et les verbes chinois 使 shǐ ‘faire en sorte que’, 让 ràng ‘laisser’ et 教 jiào ‘faire en sorte que’) et d’un complément propositionnel ou verbal qui exprime l’évènement causativisé. L’auteur a montré que les statuts syntaxique et sémantique du causé sont différents dans les constructions causatives de ces deux langues. Nous allons maintenant présenter notre corpus et la méthode d’analyse.
192
Ping-Hsueh Chen, Rui Yan
3 Corpus d’analyse et méthode d’analyse Notre corpus est constitué de textes institutionnels de l’ONU, accessible sur la plateforme Sketch Engine.2 Ce choix se justifie par le manque de corpus parallèles de grande taille, déjà alignés, lemmatisés et étiquetés. À notre connaissance, c’est le seul document spécialisé parallèle français-chinois de grande taille. En outre, il permet d’étudier les spécificités linguistiques des combinaisons V causatif + Nom dans les discours institutionnels et politiques. Sa composition est : Tableau 1 : Nombres de tokens et de mots (caractères) des sous-corpus français et chinois. Sous-corpus
Corpus en français (tokens/mots)
Corpus en chinois (tokens/caractères)
MultiUN UN Total
../.. ./.. ../..
../.. ../.. ../..
Nous avons pris au départ une liste de verbes causatifs établie à partir des travaux antérieurs portant sur la causalité (voir Jackiewicz 1998 ; Nazarenko 2000 ; Gross et al. 2009 ; Diwersy/François 2011). Vu la taille importante du corpus, le seuil de fréquence a été fixé à 1000 occurrences, ce qui nous a permis d’obtenir une liste de 33 verbes causatifs français. En nous appuyant notamment sur les travaux de Gross et al. (2009), de Diwersy/François (2011) et de Bak Sienkiewicz (2016), nous classons ces 33 candidats en fonction de leur dimension sémantique3 comme l’illustre le tableau suivant. Ce classement sémantique nous permet d’analyser de manière plus approfondie les verbes causatifs que nous allons détailler plus loin. Par la suite, nous avons procédé à la collecte des équivalents fonctionnels chinois de ces 33 verbes causatifs dans les textes institutionnels. Plus précisément, nous avons privilégié la grammaire spécifiquement élaborée pour notre recherche, par exemple, [lemma_lc=“causer”&tag=“V.✶”]. Ce langage de requête a pour objectif de chercher dans le corpus des formes grammaticalement et/ou lexicalement complexes. Ainsi, cette grammaire permet de relever les occurrences de toutes les formes verbales du lemme causer.
https://www.sketchengine.eu/. Le terme de la dimension sémantique renvoie ici aux classes sémantiques des verbes causatifs proposées par Diwersy/François (2011).
Les constructions Verbe causatif + Nom dans les textes institutionnels
193
Tableau 2 : La dimension sémantique des 33 verbes causatifs. Dimension sémantique
Verbes causatifs
Neutre ()
causer, créer, entraîner, générer, occasionner, provoquer, semer, susciter
Causation négative ()
endiguer, éradiquer
Aspectuel inchoatif ()
déclencher, engendrer, instaurer
Aspectuel duratif ()
perpétuer, prolonger
Aspectuel terminatif ()
combler, dissiper, écarter, éliminer, interrompre, réprimer
Intensité forte (croissance graduelle) ()
accentuer, accroître, aggraver, alimenter, amplifier, conforter, exacerber, renforcer, stimuler
Intensité faible (décroissance graduelle) ()
apaiser, atténuer, réduire
classes
verbes causatifs
Afin de mieux classer les équivalents chinois des combinaisons V causatif + Nom selon des critères morpho-syntaxiques, nous nous sommes basés sur le classement des mécanismes causatifs de Dixon (2000) qui catégorise les moyens d’expression de la cause en fonction de leur compacité morpho-syntaxique. Plus précisément, la forme verbale la plus compacte renvoie à des verbes lexicaux, tels que causer, provoquer, susciter. Ils constituent en effet le 1er palier lexical du classement. Concernant le 2ème palier, il s’agit des verbes causatifs morphologiques suffixés en -iser ou en -ifier, à partir d’un adjectif ou d’un nom, par exemple, moderniser, simplifier. Le 3ème palier correspond au factitif faire + Vinf et qui fonctionne comme un prédicat complexe. Enfin, la construction périphrastique moins grammaticalisée constitue le 4ème palier du classement, qui est composée de deux prédicats distincts (V1 causatif + V2).
La classe aspectuelle inchoative opère « sur des prédicats duratifs en mettant l’accent sur le début du procès […]. Elle traduit simplement le fait que l’événement est pris à son début, sans préjuger de son évolution ultérieure » (Gross et al. 2009, 123).
194
Ping-Hsueh Chen, Rui Yan
4 Analyses fonctionnelles et contrastives La figure ci-dessous présente la répartition des équivalents chinois des 33 verbes causatifs français susmentionnés :
Métataxe, 31.49% Verbes lexicaux, 36.46%
Construction périphrastique « V1 causatif + V2 », 2.91%
Verbes morphologiques suffixés en huà, 0.10% Verbe support de causation + V2/adj., 29.04%
Figure 1 : Fréquence des équivalents chinois des 33 verbes causatifs français.
Comme nous pouvons le constater, dans environ 31% des cas, les traducteurs ont procédé à une restructuration de la phrase française en chinois (phénomène de métataxe5) et dans à peu près 29% des cas, ils ont choisi la construction « V support de causation + V2/adj. » comme équivalent traductionnel des verbes causatifs français. Dans à peu près 36% des cas, les verbes causatifs français sont rendus par des verbes lexicaux chinois. Par ailleurs, les deux autres mécanismes (la construction périphrastique et les verbes morphologiques) sont statistiquement peu significatifs sur le plan des équivalences.
Il s’agit de la transformation phrastique. Ce procédé a été ajouté par Novakova (2015) comme 5ème palier à l’échelle de Dixon (2000). En effet, il est encore moins compact que la construction périphrastique moins grammaticalisée.
Les constructions Verbe causatif + Nom dans les textes institutionnels
195
4.1 Les verbes causatifs français traduits en chinois par des verbes Dans notre corpus institutionnel, sur les 33 verbes causatifs français relevés, 15 ont pour équivalents des verbes lexicaux chinois :6 30.00% 26.38%
25.00% 20.00% 15.00% 10.00%
13.88% 13.72% 8.62% 7.59% 6.61% 5%
5.00%
2.84%
2.78% 1.41%1.35% 1.3% 1.29%1.27% 1.11%
0.00%
Figure 2 : Fréquence des 15 verbes causatifs français ayant comme équivalents chinois des verbes.
Nous pouvons observer dans cette figure que les verbes causatifs neutres (causer, entraîner, créer, provoquer, susciter) sont les verbes les plus souvent traduits en chinois par des verbes. La figure suivante illustre les 11 verbes chinois relevés7 pour rendre le sens des 15 verbes causatifs français répertoriés dans la figure 2 :
Nous avons exclu les 14 verbes ayant moins de 1% d’occurrences. Nous avons écarté 4 verbes chinois comme équivalent ayant moins de 1% d’occurrences.
196
Ping-Hsueh Chen, Rui Yan
30.00% 27.95% 27.81% 25.00% 20.00% 15.00% 10.00% 5.00%
10.92% 7.97% 7.1% 6.33%
4.16% 1.61% 1.51% 1.36% 1.23%
0.00%
Figure 3 : Fréquence des 11 verbes chinois utilisés comme équivalents des 15 verbes causatifs français.
D’après cette figure, les 15 verbes causatifs français susmentionnés sont rendus en chinois dans environ 39% des cas par les deux verbes causatifs prototypiques 造成 zàochéng ‘causer, provoquer’ et 导致 dǎozhì ‘conduire à’. En sus, ces 15 verbes français ont, dans presque 28% des cas, les verbes 造成 zàochéng ‘causer, provoquer’ et 消除 xiāochú ‘éliminer’ comme équivalents chinois. Par ailleurs, comme le montre la figure 2 supra, le verbe aspectuel terminatif éliminer est particulièrement récurrent par rapport à d’autres verbes causatifs. Nous avons constaté que ses collocatifs ont souvent une connotation négative. Ainsi, les combinaisons éliminer + nom encode une connotation positive, par exemple, éliminer + pauvreté, terrorisme, discrimination. Cette constatation pourrait s’expliquer par le genre textuel du corpus institutionnel. En effet, l’ONU a, entre autres, pour objectif de maintenir la paix et la sécurité internationale et de protéger les droits de l’homme. Nous détaillerons davantage ce constat avec des exemples plus loin. Comme il a été signalé précédemment, les verbes causatifs sont classés en différentes dimensions sémantiques. Nos analyses sont ici organisées selon ce classement : – verbes neutres (causer, provoquer), – verbes aspectuels (déclencher, perpétuer), – verbes d’intensité forte/faible (aggraver, exciter). Cette opération nous permet non seulement d’examiner de manière plus raffinée les aspects syntaxique et sémantique des verbes étudiés, mais aussi de mieux classer leurs équivalents chinois.
Les constructions Verbe causatif + Nom dans les textes institutionnels
197
Un autre paramètre que nous intégrons systématiquement à l’analyse de ces verbes, c’est la polarité (positive et négative) de leurs arguments, plus précisément, la connotation positive/négative des noms. Cette analyse portant sur la combinatoire lexico-syntaxique8 des verbes causatifs permet de mieux rendre compte de leur fonctionnement et de leur signification en contexte, comme l’ont explicité Gross et al. (2009, 24) : « un prédicat est identifié par la nature sémantique de ses arguments. La prise en compte de ces derniers permet de déterminer sa signification ». Commençons par l’analyse des verbes causatifs neutres français et de leurs équivalents chinois.
4.1.1 Les verbes causatifs neutres Ici, nous allons analyser non seulement les verbes causatifs neutres français avec leurs équivalents chinois (造成 zàochéng ‘causer, provoquer’, 导致 dǎozhì ‘conduire à’, 产生 chǎnshēng ‘produire, donner naissance à’), mais aussi la polarité de leurs actants (sujet et complément). Examinons maintenant les exemples suivants : (1)
Lorsque survient un événement lié à une activité dangereuse qui cause […] un dommage transfrontière (Sketch Engine, UN). 发生 涉及 危险 活动 的 事件 fāshēng shèjí wéixiǎn huódòng de shìjiàn Survenir concerner dangereux activité subN événement 时, 如果 活动 造成 […]跨 shí, rúguǒ huódòng zàochéng […] kuà moment, si activité causer, provoquer […] franchir 界 损害。 jiè sǔnhài. frontière dommage
Dans cet exemple, le verbe causer est rendu en chinois par le verbe 造成 zàochéng (causer, provoquer), qui est l’équivalent le plus sollicité pour rendre les verbes causatifs français. Par ailleurs, le lien de cause à effet dans cet exemple est explicite. Nous pouvons considérer le syntagme nominal un événement lié à une activité dangereuse comme cause du procès et le syntagme nominal un dommage
La combinatoire lexico-syntaxique renvoie à la structure actancielle des mots (voir Novakova/ Tutin 2019, 5–17).
198
Ping-Hsueh Chen, Rui Yan
transfrontière comme la conséquence. S’agissant de la polarité de l’actant sujetcause, les substantifs événement et activité sont à l’origine de polarité neutre. Néanmoins, la polarité de l’adjectif épithète du nom activité : dangereuse fait basculer les deux noms neutres dans la polarité négative. Quant à la polarité de l’actant qui renvoie à la conséquence, le nom dommage est d’emblée négatif. Il y a donc ici une polarité concordante ou convergente entre les actants (sujet et complément) du verbe causatif neutre causer. Nous pourrions souligner encore une fois ici le rôle que joue la combinatoire lexicale et syntaxique pour l’analyse de la prosodie sémantique9 véhiculée par les verbes causatifs neutres. D’autre part, dans d’autres exemples relevés dans notre corpus, le référent du sujet (la cause) et du complément (la conséquence) sont de polarité opposée. Il s’agit des cas de « polarité divergente » : 10 (2)
Elle peut provoquer une augmentation des disparités entre les pays et à l’intérieur des pays (elle = la révolution des technologies de l’informatisation et de la communication) (Sketch Engine, MultiUN). 它 也 会 导致 国家 间 和 国家 tā yě huì dǎozhì guójiā jiān hé guójiā Cela aussi pouvoir conduire à pays entre et pays 内 的 悬殊 进一步 扩大。 nèi de xuánshū jìnyībù kuòdà. intérieur subN disparité davantage élargir
Dans cet exemple, nous pouvons constater que la relation de cause à effet est explicite. En effet, le pronom personnel elle, renvoyant au syntagme nominal la révolution des technologies de l’informatisation et de la communication, est considéré comme cause de la phrase. Le syntagme nominal une augmentation des disparités en est la conséquence. Le verbe provoquer est traduit par le verbe causatif 导致 dǎozhì (conduire à) qui arrive, en termes de fréquence, en 3ème position (voir figure 3 supra). Concernant la polarité des actants, le sujet-cause est considéré comme un fait positif. En revanche, hors contexte, le complément-effet (une augmentation) peut être considéré comme neutre. Cependant, il est suivi d’un complément du nom (des disparités). De ce fait, la polarité neutre du complément du verbe (la conséquence) bascule vers la polarité négative. Néanmoins, nous avons également relevé des cas où le verbe provoquer introduit un fait positif : Pour plus de détails sur cette notion, voir, entre autres, Sinclair (1991) et Louw (1993). Voir aussi à ce sujet Grutschus et al. (2013, 91) et Novakova/Sorba (2014, 77) qui parlent d’une « divergence de polarité » entre le pivot verbal et son complément pour les collocations d’émotions (du type perdre l’estime).
Les constructions Verbe causatif + Nom dans les textes institutionnels
(3)
199
Le règlement pacifique de ce conflit […] sera capable de provoquer une chaîne de réactions pacifiques dans toutes les régions de conflit du monde (Sketch Engine, MultiUN). 和平 解决 这 一 冲突[…] 能够 在 所有 hépíng jiějué zhè yī chōngtú […] nénggòu zài suǒyǒu Paix résoudre ce un conflit […] pouvoir dans chaque 世界 冲突 地区 产生 和平 shìjiè chōngtú dìqū chǎnshēng hépíng monde conflit région produire, donner naissance à paix 的 连锁 反应。 de liánsuǒ fǎnyìng. subN chaîne réaction
Dans cet exemple, le verbe neutre provoquer est rendu en chinois par le verbe 产生 chǎnshēng qui a le sens de produire, donner naissance à. Les deux actants du procès renvoient à des faits positifs. En outre, l’adjectif épithète du nom réactions : pacifiques fait basculer la polarité neutre de la conséquence vers la polarité positive. L’étude de la combinatoire lexicale11 des actants montre que leur polarité peut être conditionnée par leurs collocatifs.
4.1.2 Les verbes causatifs aspectuels Dans cette partie, nous allons analyser les verbes causatifs aspectuels français et leurs équivalents chinois, par exemple, 消除 xiāochú ‘éliminer’, 带来 dàilái ‘amener à’ et 导致 dǎozhì ‘conduire à’. Examinons les exemples suivants : (4)
Cela aidera à instaurer la stabilité au Kosovo (cela = la priorité des minorités) (Sketch Engine, MultiUN). 这 将 有助于 给 科索沃 带来 稳定。 zhè jiāng yǒuzhùyú gěi Kēsuǒwò dàilái wěndìng. Cela MF12 favorable à Kosovo amener à stabilité
Ici, la combinatoire lexicale désigne « les associations lexicales qui entretiennent une relation syntaxique et sémantique avec le terme clé, […] comme dans les relations de type nom-adjectif (une panique générale), verbe-nom (semer la terreur) ou verbe-adverbe (aimer-passionnément), […] » (Novakova/Tutin 2019, 5–17). Cette abréviation signifie marqueur de futur.
200
Ping-Hsueh Chen, Rui Yan
Dans cet exemple, le verbe instaurer, verbe causatif d’aspect inchoatif, signifie, d’après CNRTL,13 « fonder, établir avec l’idée d’une création première ». Néanmoins, Gross et al. (2009, 132) soulignent que par rapport à d’autres verbes aspectuels inchoatifs qui mettent en avant le déclenchement d’un événement : « le verbe instaurer implique que l’état de choses mis en place est destiné à durer ». Notre exemple instaurer la stabilité confirme effectivement ce constat. Concernant l’équivalent chinois du verbe français, il est rendu par le verbe 带来 dàilái ‘amener à’ qui traduit non seulement le sens causatif, mais aussi l’aspect inchoatif du verbe instaurer. Il est intéressant de voir que l’inchoativité des verbes causatifs français peut être effacée dans la traduction chinoise, comme le montre l’exemple (5). (5)
Cela a déclenché un cercle vicieux. (cela = les mesures destinées à réduire la dépendance envers les prêts extérieurs) (Sketch Engine, MultiUN). 这 种 做法 导致 一种 恶性 循环。 zhè zhǒng zuòfǎ dǎozhì yī zhǒng èxìng xúnhuán. Ce CL façon de faire conduire à un CL vicieuxcycle
Ici, le causatif inchoatif déclencher correspond en chinois au verbe 导致 dǎozhì ‘conduire à’. Celui-ci dispose du sens causatif mais n’exprime pas l’aspect inchoatif. D’ailleurs, l’inchoativité du verbe français n’est pas rendue dans le contexte non plus. Elle est donc effacée dans la traduction en chinois. Dans l’exemple (4), la cause et la conséquence de l’énoncé sont de polarité positive, tandis que dans l’exemple (5), il y a une divergence de polarité. Le pronom cela, cause du procès, désigne dans le contexte les mesures destinées à réduire la dépendance envers les prêts extérieurs. Ces mesures, supposées positives, ont un effet négatif : un cercle vicieux. Rappelons que le verbe causatif terminatif éliminer est très fréquent dans le corpus institutionnel de l’ONU. Nous constatons que ce verbe français introduit souvent des référents objets directs de valeur négative tels que la pauvreté, le terrorisme et la discrimination, comme le montre l’exemple (6) : (6)
Les États doivent appliquer des stratégies qui éliminent la pauvreté et le dénuement (Sketch Engine, MultiUN). 各 国 必须 执行 各 种 战略 以 gè guó bìxū zhíxíng gè zhǒng zhànlüè yǐ Chaque pays devoir appliquer tout sorte stratégie pour
CNRTL est l’acronyme de Centre National de Ressources Textuelles et Lexicales.
Les constructions Verbe causatif + Nom dans les textes institutionnels
201
消除 贫穷 和 匮乏。 xiāochú pínqióng hé kuìfá. éliminer pauvreté et dénuement Dans l’exemple, selon CNRTL, le verbe terminatif éliminer, encodant le sens de faire disparaître, supprimer, est rendu en chinois par le verbe 消除 xiāochú (traduisible par ‘éliminer’).14 Ce verbe chinois véhicule à la fois le sens causal et la valeur d’aspect terminatif (voir le Dictionnaire du chinois contemporain 52005, 1492). Par ailleurs, le verbe éliminer s’associe avec deux noms de nature négative, respectivement la pauvreté et le dénuement, dont l’association est positive.
4.1.3 Les verbes causatifs d’intensité Les verbes intensifs expriment l’idée de croissance/décroissance d’un fait et se focalisent davantage sur l’effet produit (voir Nazarenko 2000,138). (7)
Elles stimulent le progrès scientifique (elles = les nouvelles technologies) (Sketch Engine, MultiUN). 这 些 技术 促进 科学 进步。 zhè xiē jìshù cùjìn kēxué jìnbù. Ce PL technologie promouvoir science progrès
Dans cet exemple, le verbe stimuler signifiant, selon CNRTL, « rendre plus actif, intensifier » est rendu en chinois par le verbe 促进 cùjìn ‘promouvoir’15 qui véhicule le sens causatif mais non pas la valeur sémantique d’intensité forte. En ce qui concerne les actants, l’actant sujet, comme cause, est le pronom elles qui renvoie dans le contexte au syntagme nominal les nouvelles technologies et l’actant objet, qui réfère à la conséquence, est le syntagme nominal le progrès scientifique. En effet, la polarité de ces deux actants est positive, donc concordante. Examinons maintenant un exemple de verbe d’intensité faible et son équivalent chinois :
La traduction en français du verbe 消除 xiāochú est empruntée au Dictionnaire Ricci ChinoisFrançais (利氏漢法辭典 Lì shì hàn fǎ cídiǎn 2014, 1478). La traduction en français du verbe 促进 cùjìn est empruntée au Dictionnaire Ricci ChinoisFrançais (利氏漢法辭典 Lì shì hàn fǎ cídiǎn 2014, 243).
202
(8)
Ping-Hsueh Chen, Rui Yan
La sécheresse […] a réduit la sécurité alimentaire. (Sketch Engine, MultiUN) 干旱[…] 降低 粮食 保障。 gānhàn […] jiàngdī liángshí bǎozhàng. Sécheresse […] diminuer aliment garantie
Le verbe d’intensité décroissante réduire correspond en chinois au verbe 降低 jiàngdī (traduisible par ‘diminuer’) qui exprime, de manière concomitante, le sens causatif et la valeur d’intensité faible (décroissance graduelle). D’autre part, le verbe réduire s’associe avec le syntagme nominal la sécurité alimentaire, qui est neutre. Néanmoins, l’association du verbe et du complément rend la polarité de ce dernier négative (réduire la sécurité alimentaire), ce qui est aussi le cas de la cause (la sécheresse). Il est important de souligner que de même que Bak Sienkiewicz (2016) qui a relevé que les verbes causatifs sont associés à des noms d’émotion positifs : « susciter l’admiration (Bak Sienkiewicz 2016, 37), susciter DET enthousiasme (Bak Sienkiewicz 2016, 103) », nous avons montré que dans notre corpus, les verbes causatifs introduisent également des actants positifs (voir exemple 3 : provoquer une chaîne de réactions pacifiques ; exemple 4 : instaurer la stabilité ; exemple 5 : engendrer une nouvelle économie du savoir). Passons maintenant aux analyses des verbes causatifs français traduits en chinois par la construction causative à verbe support.
4.2 Les verbes causatifs français traduits en chinois par la construction « V support de causation + V2/adj. » Les verbes 加 jiā ‘augmenter, ajouter’, 增 zēng ‘accroître, croître’ et 减 jiǎn ‘diminuer, décroître’ sont des verbes supports de causation qui forment un prédicat unique avec un V2 ou un adjectif prédicatif non causatif. Ces verbes supports de causation servent à transitiver et causativiser le V2 ou l’adjectif qui les suivent. Il s’agit du phénomène de la « causative-inchoative alternation » (Hsieh/Hsieh 2011). Par conséquent, la valence verbale du procès augmente. En effet, seules les constructions causatives permettent d’augmenter la valence verbale (voir Nazarenko 2000,142). Ainsi, cette construction est analysée comme causative dans cette étude. Par ailleurs, les verbes supports de causation ont seulement un sens général et abstrait qui n’explicitent ni une action, ni une origine, ni une manière particulière (voir Basciano 2010, 197). Examinons maintenant les 7 verbes causatifs français ayant pour équivalent la construction chinoise « V support de causation + V2/adj. » : 16
Nous avons mis de côté les 7 verbes ayant moins de 0,5% d’occurrences.
Les constructions Verbe causatif + Nom dans les textes institutionnels
203
70.00% 62.55% 60.00% 50.00% 40.00% 30.00% 20.24% 20.00% 10.00% 10.00%
3.51%
1.29%
0.76%
0.59%
0.00% renforcer
réduire
accroître
atténuer
aggraver exacerber accentuer
Figure 4 : Fréquence des 7 verbes causatifs français ayant comme équivalent chinois la construction « V support de causation + V2/adj. ».
Selon cette figure, dans presque 63% des cas, le verbe d’intensité forte (croissance graduelle) renforcer est rendu en chinois par la construction causative à verbe support. La figure 5 illustre les 3 types de construction causative à verbe support relevés pour rendre les 7 verbes causatifs français répertoriés dans la figure 4 : 70.00%
65.00%
60.00% 50.00% 40.00% 30.00%
24.00%
20.00% 11.00% 10.00% 0.00%
Figure 5 : Fréquence des 3 types de construction causative « V support de causation + V2/adj. » utilisés comme équivalent chinois des 7 verbes causatifs français.
204
Ping-Hsueh Chen, Rui Yan
Comme le montre cette figure, la construction causative formée avec le verbe support 加 jiā ‘augmenter, ajouter’ est employé dans 65% des cas pour rendre les verbes causatifs français. Nous remarquons que les verbes supports 加 jiā ‘augmenter, ajouter’ et 增 zēng ‘accroître, croître’ servent uniquement à traduire les 5 verbes causatifs français d’intensité forte (croissance graduelle : renforcer, accroître, aggraver, exacerber et accentuer), tandis que le verbe support 减 jiǎn ‘diminuer, décroître’ est utilisé pour rendre les deux verbes causatifs français d’intensité faible (décroissance graduelle : réduire et atténuer). Cette constatation peut être expliquée par le fait que les verbes supports chinois 加 jiā et 增 zēng, ayant à l’origine le sens d’‘augmenter, accroître’, servent à intensifier en quelque sorte le sémantisme du verbe ou de l’adjectif qu’ils introduisent.17 En revanche, le verbe support 减 jiǎn, signifiant initialement ‘diminuer, décroître’, diminue le sens du V2 ou de l’adjectif qui le suit. Analysons maintenant les exemples suivants : (9)
Une culture de paix renforce la solidarité entre les peuples et les nations et le dialogue entre les cultures (Sketch Engine, MultiUN). 和平 文化 加强 各 个 民族 hépíng wénhuà jiāqiáng gè ge mínzú Paix culture V support + fort (adj.)18 chaque CL peuple 和 各 个 国家 间 的 团结 和 各 hé gè ge guójiā jiān de tuánjié hé gè et chaque CL pays entre subN solidarité et chaque 文化 间 的 对话。 wénhuà jiān de duìhuà. culture entre subN dialogue
Dans cet exemple, le verbe causatif renforcer est rendu en chinois par la construction « V support 加 jiā ‘augmenter, ajouter’ + 强 qiáng ‘fort’ » qui a le sens de rendre plus fort. Par ailleurs, la cause et la conséquence sont de polarité positive. Dans l’exemple suivant, le verbe causatif intensif français est rendu en chinois par la construction « V support 减 jiǎn ‘diminuer, décroître’ + V2/adj. » :
Basciano (2010, 138) souligne que le verbe support 加 jiā (augmenter, ajouter) intensifie le sémantisme de l’adjectif qui le suit. Ce verbe est lexicalisé et répertorié dans le Dictionnaire du chinois contemporain (现代汉语词典 Xiàndài hànyǔ cídiǎn 52005, 651). Néanmoins, pour certains linguistes (notamment Steffen Chung 2006 ; Basciano 2013), il s’agit d’une construction causative à verbe support.
Les constructions Verbe causatif + Nom dans les textes institutionnels
205
(10) Un traitement égal réduit les déséquilibres pouvant résulter de difficultés politiques, sociales et économiques (Sketch Engine, MultiUN). 公平 处理 减少 可 gōngpíng chǔlǐ jiǎnshǎo kě Égal traitement V support + peu nombreux (adj.)19 pouvoir 造成 政治、 社会 及 经济 困难 的 不 zàochéng zhèngzhì, shèhuì jí jīngjì kùnnán de bù causer politique, société et économie difficulté subN NÉG 平衡。 pínghéng. équilibre Dans cet exemple, le verbe intensif faible réduire, signifie, selon le dictionnaire Le Petit Robert en ligne, « limiter, restreindre, diminuer ».20 Ce verbe français correspond en chinois à la construction « V support 减 jiǎn ‘diminuer, décroître’ + 少 shǎo ‘peu nombreux’ (adj.) » qui encode le sens de rendre moins nombreux, moins important. Ainsi, cette structure à verbe support traduit non seulement le sens causatif du verbe français, mais aussi sa valeur d’intensité faible. D’autre part, il y a une convergence de polarité positive entre les deux actants. En effet, l’actant objet les déséquilibres est négatif mais l’association réduire les déséquilibres devient positive. Examinons maintenant les verbes causatifs français traduits en chinois par une construction périphrastique moins grammaticalisée, classée au 4ème palier de l’Échelle de compacité (Dixon 2000).
4.3 Les verbes causatifs français traduits en chinois par la construction périphrastique moins grammaticalisée « V1 causatif + V2 » Dans certains cas, les verbes causatifs français sont traduits par la construction périphrastique chinoise composée d’un verbe causatif tel que 使 shǐ ‘faire en sorte que’, 让 ràng ‘laisser’, 令 lìng ‘faire… que’, et d’un V2. La forme canonique est la suivante : « N1 + V1 causatif + N2 + V2 (+ N3) ». À la différence de la construction « V support de causation + V2/adj. », la périphrase causative est moins compacte car la construction
Ce verbe est entré dans le Dictionnaire du chinois contemporain (现代汉语词典 Xiàndài hànyǔ cídiǎn 52005, 666). Cette définition est empruntée à l’adresse : https://dictionnaire.lerobert.com/definition/re duire [dernière consultation : 23.11.2021].
206
Ping-Hsueh Chen, Rui Yan
causative à verbe support fonctionne comme un seul prédicat. Or, dans la périphrase causative, le N2 est toujours inséré entre le V1 causatif et le V2. Dans notre corpus, sur les 33 verbes causatifs français, 14 ont pour équivalent cette construction chinoise : 21 20.00% 18.68% 18.00% 16.00% 14.00%
14.72% 13.02% 12.67%
12.00% 10.00% 8.00% 6.00% 4.00% 2.00%
9.59% 6.84% 5.32% 3.53% 3.31% 2.14% 1.95% 1.78%1.77%
1.13%
0.00%
Figure 6 : Fréquence des 14 verbes causatifs français ayant comme équivalent chinois la construction périphrastique causative « V1 causatif + V2 ».
Selon cette figure, 3 types de verbes causatifs français se dégagent, à savoir les verbes neutres (causer, provoquer), les verbes aspectuels (inchoatifs : instaurer, engendrer ; duratifs : perpétuer, prolonger) ainsi que les verbes d’intensité croissante (accroître, aggraver). En ce qui concerne les périphrases chinoises, 6 V1 causatifs sont utilisés. Comme le montre la figure 7, la périphrase causative formée avec le V1 causatif 使 shǐ ‘faire en sorte que’ est la plus souvent utilisée pour traduire les verbes causatifs français dans notre corpus. Selon Steffen Chung (2006, 174), elle est davantage utilisée dans un registre plutôt formel, c’est en effet le cas des textes institutionnels de l’ONU. Par ailleurs, le faible pourcentage de la périphrase causative « 令 lìng ‘faire… que’ + V2 » peut s’expliquer par le fait qu’elle est moins employée en chinois moderne (voir Chang 2005). En fonction de la dimension sémantique des verbes causatifs français, les analyses s’organiseront en trois parties : les verbes neutres, les verbes aspectuels et les verbes d’intensité.
Nous avons écarté les 10 verbes causatifs ayant moins de 1% d’occurrences.
Les constructions Verbe causatif + Nom dans les textes institutionnels
207
Figure 7 : Fréquence des 6 périphrases causatives chinoises utilisées comme équivalents des 14 verbes causatifs français.
4.3.1 Les verbes causatifs neutres En chinois, le verbe neutre entraîner est rendu par la périphrase causative « 使 shǐ ‘faire en sorte que’ (V1 causatif) + 获得 huòdé ‘obtenir’ (V2) ». (11) L’accord a entraîné une amélioration sensible de la gestion du port (Sketch Engine, MultiUN). 该 协议 使 港口 的 管理 获得 gāi xiéyì shǐ gǎngkǒu de guǎnlǐ huòdé Ce accord faire en sorte que port subN gestion obtenir 大大 改进。 dàdà gǎijìn. grand22 amélioration (11a) Cet accord fait en sorte que la gestion du port obtienne une grande amélioration. Comme l’illustre la paraphrase (11a), sur le plan morpho-syntaxique, la périphrase causative chinoise, classée au 4ème palier de l’échelle de compacité, est moins compacte que les verbes lexicaux, classé au 1er palier. Ici, nous pouvons aussi cons-
Il s’agit ici d’un cas de duplication de l’adjectif.
208
Ping-Hsueh Chen, Rui Yan
tater que les deux actants, renvoyant à la cause et à l’effet du procès causal, correspondent à des faits positifs.
4.3.2 Les verbes causatifs aspectuels Il s’agit ici des verbes causatifs aspectuels inchoatifs et duratifs qui impliquent, respectivement, le début et la durée du procès. Examinons les exemples suivants : (12) Ces projets qui, on l’espère, engendreront une croissance économique sensible, […] (Sketch Engine, MultiUN). 希望 这 些 项目 能 使 经济 xīwàng zhè xiē xiàngmù néng shǐ jīngjì Espérer ce PL projet pouvoir faire en sorte que économie 明显 增长, […]。 míngxiǎn zēngzhǎng, […]. visible croître, […] Dans cet exemple, le verbe engendrer est rendu en chinois par la périphrase causative « 使 shǐ ‘faire en sorte que’ (V1 causatif) + N1 + V2 », dont le N1 est 经济 jīngjì ‘économie’ et le V2 désigne 增长 zēngzhǎng (traduisible par ‘croître’) qui n’encode pas de sens causal. Notons par ailleurs que l’aspect inchoatif du verbe engendrer est effacé dans la traduction en chinois. En revanche, dans l’exemple (13) ci-dessous, l’aspect duratif du verbe causatif perpétuer est présent dans la traduction en chinois : (13) Le fait d’éluder cette question ne fera que perpétuer les problèmes dans ce domaine. (Sketch Engine, MultiUN) 忽视 这 种 情况 只 会 hūshì zhè zhǒng qíngkuàng zhǐ huì Ignorer ce CL situation seulement devoir 使 问题 持续 存在。 shǐ wèntí chíxù cúnzài. faire en sorte que problème continuer exister Dans l’exemple (13), le verbe perpétuer correspond en chinois à la périphrase causative « 使 shǐ ‘faire en sorte que’ (V1 causatif) + V2 ». Remarquons ici que le sens causatif du verbe français est rendu par le V1 使 shǐ ‘faire en sorte que’ et son
Les constructions Verbe causatif + Nom dans les textes institutionnels
209
aspect duratif est traduit par le V2 持续 chíxù ‘continuer’, suivi d’un autre verbe 存在 cúnzài ‘exister’. D’autre part, en comparant ces deux exemples, nous constatons que la cause positive/négative entraîne respectivement un effet positif/négatif. C’est-à-dire, entre ces deux actants, il existe une polarité convergente.
4.3.3 Les verbes causatifs d’intensité Comme évoqué, l’aspect inchoatif et duratif des verbes causatifs est souvent rendu par le V2 ou bien effacé dans la traduction en chinois. Ici, le sémantisme de l’intensité forte/faible des verbes causatifs peut être traduit par d’autres éléments ou omis de la phrase chinoise. Analysons maintenant les exemples : (14) Il s’agit du droit à un processus qui accroît les capacités ou la liberté des individus d’améliorer leur bien-être (Sketch Engine, MultiUN). 这 种 进程 使 个人 有 zhè zhǒng jìnchéng shǐ gèrén yǒu Ce CL processus faire en sorte que individu avoir 更 大 的 能力 和 自由 改善 gèng dà de nénglì hé zìyóu gǎishàn davantage grand subN capacité et liberté améliorer 自己 的 福利。 zìjǐ de fúlì. soi-même subN bien-être Dans l’exemple (14), le verbe intensif fort accroître correspond en chinois à la périphrase causative « 使 shǐ ‘faire en sorte que’ (V1 causatif) + N1 + V2 +N2 » dont le N1 renvoie à 个人 gèrén ‘individu’, le V2 correspond à 有 yǒu ‘avoir’ et le N2 désigne le syntagme nominal 更大的能力和自由 gèng dà de nénglì hé zìyóu ‘plus de capacité et de liberté’. Notons en outre que les V1 causatif et V2 n’encodent pas le sémantisme de l’intensité forte du verbe français. Le chinois a par conséquent recours à un syntagme adjectival 更大 gèng dà ‘davantage grand’. La valeur intensive forte des verbes causatifs français peut aussi être rendue dans le V2 ou effacée comme dans l’exemple (15) : (15) La productivité accrue en première instance accroît à terme la charge de la chambre d’appel (Sketch Engine, MultiUN). 首先 提高 生产力 最后 会 使 shǒuxiān tígāo shēngchǎnlì zuìhòu huì shǐ
210
Ping-Hsueh Chen, Rui Yan
D’abord élever 上诉分庭 shàngsù fēntíng chambre d’appel
productivité finalement 的 工作 量 de gōngzuò liàng subN travail quantité
devoir faire en sorte que 增加。 zēngjiā. augmenter
Ici, le verbe causatif d’intensité forte accroître est rendu en chinois par la construction périphrastique « 使 shǐ ‘faire en sorte que’ + V2 ». Le V2 correspond au verbe 增加 zēngjiā (traduisible par ‘augmenter’) qui dispose du sens d’intensité forte. Analysons maintenant les verbes causatifs français ayant comme équivalents chinois une structure phrastique transformée. Elle correspond à une transformation syntaxique de la phrase de la langue source vers la langue cible.
4.4 Les verbes causatifs français traduits en chinois par des transformations structurelles complexes (« Métataxe », Tesnière 1959) Lors de la traduction, les traducteurs ont parfois recours à des restructurations de la phrase. Il s’agit de transformations syntaxiques complexes (« métataxe », Tesnière 1959). Rappelons ici que les verbes causatifs français ayant comme équivalent chinois une structure phrastique transformée totalisent environ 31% d’occurrences dans notre corpus. Examinons maintenant les exemples suivants : (16) L’absence d’une capacité durable au sein du Secrétariat pourrait diluer et dissiper l’efficacité des actions visant à mobiliser des ressources (Sketch Engine, MultiUN). 如果 秘书处 没 有 可 持续 的 能力, rúguǒ Mìshūchù méi yǒu kě chíxù de nénglì, Si Secrétariat NÉG avoir pouvoir durer subN capacité, 那么 调集 资源 的 有效 行动 nàme diàojí zīyuán de yǒuxiào xíngdòng alors mobiliser r essource subN efficaceaction 将会 变 得 分散 无 力。 jiānghuì biàn dé fēnsàn wú lì. devoir devenir subPT disperser sans force Dans l’exemple (16), le verbe dissiper est en emploi causatif ; en effet, il a le sens de « faire disparaître en dispersant, en écartant ; faire s’évanouir » (CNRTL). Ce
Les constructions Verbe causatif + Nom dans les textes institutionnels
211
verbe véhicule également l’aspect phasique terminatif. L’actant objet de ce verbe est le substantif efficacité qui est de polarité positive. L’association du verbe causatif dissiper avec un actant positif a comme résultat une composition sémantique négative. D’un autre côté, le syntagme verbal dissiper l’efficacité des actions est traduit en chinois par une structure syntaxique différente : 变得分散无力 biàn dé fēnsàn wú lì ‘devenir dispersé et sans force’. Par ailleurs, dans la phrase chinoise, le sens causatif est à peine perceptible. Néanmoins, si nous considérons la première partie de la phrase 如果秘书处没有可 持续的能力 rúguǒ mìshūchù méi yǒu kě chíxù de nénglì ‘si le Secrétariat ne disposait pas de capacité durable’ comme cause et la seconde 那么调集资源的有效行动 将会变得分散无力 nàme diàojí zīyuán de yǒuxiào xíngdòng jiānghuì biàn dé fēnsàn wú lì ‘alors l’efficacité de la mobilisation des ressources deviendrait dispersée et sans force’ comme conséquence, la relation de cause à conséquence est mise en avant. Pour mieux mettre en évidence le lien de cause à effet, nous avons paraphrasé l’exemple (16) en (16a) avec la locution prépositive de cause faute de : (16a) Faute de capacité durable du Secrétariat, l’efficacité de la mobilisation des ressources deviendrait dispersée et sans force. Dans cette paraphrase de la traduction chinoise, la cause est introduite par un complément circonstanciel de cause et l’effet est introduit par la proposition principale. Dans l’exemple (17), le syntagme verbal aggraver la situation est traduit en chinois par la structure 越…越… yuè… yuè… ‘plus… plus…’. Cette structure véhicule une corrélation logique23 exprimée comme cause. Nazarenko (2000, 43) précise que « […] la coïncidence temporelle donne lieu à interprétation causale, de même, le fait que deux faits soient corrélés par hasard semble difficilement acceptable et suscite une interprétation causale ». (17) Le fait de nier ce qui est au cœur même du problème et de chercher à déguiser l’origine de ce dernier au moyen d’allégations fallacieuses ne fait qu’aggraver la situation (Sketch Engine, MultiUN). 拒绝 接受 问题 的 症结 和 试行 jùjué jiēshòu wèntí de zhēngjié hé shìxíng Refuser accepter problème subN nœud et essayer
« La corrélation logique présente deux situations ou événements comme apparaissant ou variant l’un en fonction de l’autre » (Nazarenko 2000, 44).
212
Ping-Hsueh Chen, Rui Yan
用 虚假 的 指称 来 掩盖 其 存在 yòng xūjiǎ de zhǐchēn lái yǎngài qí cúnzài utiliser faux subN prétexte CD cacher son existence 的 理由 只 会 雪上加霜, de lǐyóu zhǐ huì xuěshàngjiāshuāng, subN raison seulement Vaux empirer, 越 弄 越 糟。 yuè nòng yuè zāo. plus effectuer plus mauvais Pour mieux illustrer le lien de cause à effet entre deux événements, dans la paraphrase (17a) de la traduction en chinois, la première partie de la phrase (plus on nie le problème) peut être considérée comme cause et la seconde (plus la situation s’aggrave) comme effet du procès : (17a) Plus on nie le problème, plus la situation s’aggrave. Comme nous pouvons le constater, ces deux propositions entretiennent une relation de proportionnalité qui « suscite toujours une interprétation causale » (Nazarenko, 2000 : 44).
5 Conclusion En guise de conclusion, cette étude a permis d’analyser à l’aide de l’approche fonctionnelle et contrastive les verbes causatifs, leurs actants ainsi que leurs équivalents chinois. Dans les textes institutionnels, nous avons examiné la connotation positive/négative des noms associés aux verbes causatifs. De manière générale, les combinaisons Verbe causatif + Nom comportent une coloration plutôt positive (provoquer une chaîne de réactions pacifiques ; instaurer la stabilité ; éliminer la pauvreté et le dénuement ; stimuler le progrès scientifique ; renforcer la solidarité ; réduire les déséquilibres). Ce résultat pourrait s’expliquer par le fait que l’ONU, en tant qu’institution mondiale, a pour objectif de promouvoir et maintenir la paix et la sécurité internationales. Du point de vue contrastif, parmi les 4 types d’équivalents chinois des verbes causatifs français, les verbes causatifs chinois (引起 yǐnqǐ ‘entraîner’, 造成 zàochéng ‘causer, provoquer’, 导致 dǎozhì ‘conduire à’) et la métataxe sont les deux moyens les plus employés. Ainsi, nos résultats sont divergents de ceux obtenus par Basciano (2010). Elle montre que la construction périphrastique est le moyen
Les constructions Verbe causatif + Nom dans les textes institutionnels
213
le plus utilisé pour exprimer la causalité en chinois. Or, nous observons que les verbes causatifs sont les plus employés dans les textes institutionnels. Par ailleurs, il est important de souligner que le moyen morphologique (2ème palier : les verbes suffixés en 化 huà) est (quasi) absent dans notre corpus. En outre, la construction « V support de causation + V2/adj. » formée de deux prédicats fonctionne comme un verbe unique. Par conséquent, elle est plus compacte que les périphrases causatives au niveau morpho-syntaxique.
Références Alonso Ramos, Margarita, Étude sémantico-syntaxique des constructions à verbe support, Thèse de doctorat, Université de Montréal, 1998. Bak Sienkiewicz, Monika, Les constructions « verbe causatif + nom d'émotion ». Aspects linguistiques et pistes didactiques, Thèse de doctorat, Université Grenoble Alpes, 2016. Basciano, Bianca, Verbal compounding and causativity in Mandarin Chinese, Thèse de doctorat, Università di Verona, 2010. Basciano, Bianca, Causative light verbs in Mandarin Chinese (and beyond), in: Hathout, Nabil/ Montermini, Fabio/Tseng, Jesse (edd.), Morphology in Toulouse. Selected proceedings of décembrettes 7, München, LINCOM Europa, 2013, 57–89. Chang, Li-Li, 張麗麗. 從使役到致使 cóng shǐyì dào zhìshǐ (The causativisation oh Chinese Shi-yi constructions), 臺大文史哲學報 Táidà wénshǐzhé xuébào (Humanitas Taiwanica) 62 (2005), 119–152. Diwersy, Sascha/François, Jacques, La combinatoire des noms d'affect et des verbes supports de causation en français. Étude de leur attirance au niveau des unités et de leurs classes syntacticosémantiques, Revue TRANEL. Travaux neuchâtelois de linguistique 55 (2011), 139–161. Dixon, Robert Malcolm Ward, A typology of causatives. Form, syntax and meaning, in: Dixon, Robert Malcolm Ward/ Aikhenvald, Alexandra (edd.), Changing valency. Case studies in transitivity, Cambridge, Cambridge University Press, 2000, 30–83. Gross, Gaston/Pauna, Ramona/Valetopoulos, Freiderikos, Sémantique de la cause, Leuven/Paris, Peeters, 2009. Grutschus, Anke/Kern, Beate/Tutin, Agnès, La polarité du lexique de l’affect. Perspective combinatoire et contrastive, in : Baider, Fabienne/Cislaru, Georgeta (edd.), Cartographie des émotions. Propositions linguistiques et sociolinguistiques, Paris, Presses Sorbonne Nouvelle, 2013, 85–96. Jackiewicz, Agata, L’expression de la causalité dans les textes. Contribution au filtrage sémantique par une méthode informatique d’exploration contextuelle, Thèse de doctorat, Université de ParisSorbonne (Paris IV), 1998. Hsieh, Chen-Yu Chester 謝承諭/Hsieh, Shu-Kai 謝舒凱, The causal relation and causative-inchoative alternation verbs in Chinese wordnet, in: Proceedings of the 12th Chinese semantics workshop, Taipei, Taiwan, 2011, 17–24. Hu, Xiaoshi, Les constructions causatives du français et du chinois, Thèse de doctorat, Université ParisDiderot (Paris VII), 2017. Lì shì hàn fǎ cídiǎn 利氏漢法辭典 Dictionnaire Ricci chinois-français, 北京 Běijīng, 商務印書館 Shāngwù yìnshūguǎn (The Commercial Press), 2014.
214
Ping-Hsueh Chen, Rui Yan
Louw, Bill, Irony in the text or insincerity in the writer? The diagnostic potential of semantic prosodies, in : Baker, Mona/Francis, Gill/Tognini-Bonelli, Elena (edd.), Text and technology. In honour of John Sinclair, Amsterdam, John Benjamins, 1993, 157–176. Nazarenko, Adeline, La cause et son expression en français, Paris, Ophrys, 2000. Novakova, Iva, Syntaxe et sémantique des prédicats. Approche contrastive et fonctionnelle, London, Éditions universitaires européennes, 2015. Novakova, Iva/Sorba, Julie, L’évaluation à travers les émotions. Le cas d’estime et de déception, Langue française 184:4 (2014), 75–91. Novakova, Iva/Tutin, Agnès, Introduction, in : Novakova, Iva/Tutin, Agnès (edd.), Le Lexique des émotions, Grenoble, UGA Éditions, 2019, 5–17. Sinclair, John, Corpus, concordance, collocation, Oxford, Oxford University Press, 1991. Steffen Chung, Karen, Mandarin compound verbs (漢語複合動詞 Hànyǔ fùhé dòngcí), 台北市 Táiběishì (Taïpei), 文鶴出版有限公司 Wénhè chūbǎn yǒuxiàn gōngsī (Crane Publishing Co., Ltd.), 2006, 174–184. Tesnière, Lucien, Éléments de syntaxe structurale, Paris, Klincksieck, 1959. Tutin, Agnès, Les collocations lexicales. Une relation essentiellement binaire définie par la relation prédicat-argument, Langages 189:1 (2013), 47–63. Xiàndài, hànyǔ cídiǎn 现代汉语词典 (Dictionnaire du chinois contemporain), 北京 Běijīng, 商務印書館 Shāngwù yìnshūguǎn (The Commercial Press), 52005.
Éric André Poirier
Dispositif empirique semi-automatique de découverte des expressions multilexémiques et des patrons phraséologiques à partir d’un corpus parallèle de traduction spécialisée Résumé : Nous décrivons les résultats de l’application d’un dispositif empirique de découverte des expressions multilexémiques (EM) et des patrons phraséologiques dans le cadre d’un projet d’analyse et d’évaluation des données prélevées dans la constitution du corpus parallèle de la quasi-totalité (515 sur 516) des textes de loi du Québec traduits du français à l’anglais en vigueur le 4 juillet 2018. Le dispositif empirique vise à découvrir des techniques et des critères opératoires de traitement des EM pour la traduction humaine et plus spécialement pour la traduction automatique. Notre dispositif empirique est semi-automatique. D’une part, il met à contribution les fonctionnalités indispensables, quoiqu’imparfaites, du traitement des langues naturelles, qui seules permettent le traitement de données massives par la linguistique de corpus. D’autre part, il comporte une analyse supervisée qui s’avère essentielle dans la découverte des caractéristiques d’EM et de patrons phraséologiques dans les données criblées de notre corpus. Le dispositif empirique exploite l’alignement segmental des textes de loi établi dans la constitution du corpus parallèle et la non-littéralité fréquente de la traduction des EM. Mots-clés : expressions multilexémiques, phraséologie, patrons phraséologiques, traduction, lois du Québec Abstract: We describe the results of applying an empirical device for discovering multilexemic expressions (ME) and phraseological patterns as part of a project to analyze and evaluate data collected in the constitution of the parallel corpus of almost all (515 out of 516) Quebec law texts translated from French to English in force on July 4, 2018. The empirical device aims at discovering techniques and operational criteria for processing ME for human translation and more specifically for machine translation. Our empirical device is semi-automatic. On the one hand, it makes use of the indispensable, albeit imperfect, functionalities of natuRemerciements: L’auteur remercie le professeur Jean-Hugues Roy, de l’École des médias de l’UQAM, pour son travail de moissonnage de données ayant permis de constituer le corpus à la base de cet article. https://doi.org/10.1515/9783110749854-011
216
Éric André Poirier
ral language processing, which alone allow the processing of massive data by corpus linguistics. On the other hand, it includes a supervised analysis that proves to be essential in the discovery of ME features and phraseological patterns in the screened data of our corpus. The empirical device exploits the segmental alignment of the legal texts established in the constitution of the parallel corpus and the frequent non-literality of the translation of ME. Keywords: multilexemic expressions, phraseology, phraseological patterns, translation, Quebec laws
1 Introduction Le présent article décrit un dispositif empirique semi-automatique de découverte des expressions multilexémiques (dorénavant EM) et des patrons phraséologiques qui leur sont inhérents à partir d’un vaste corpus parallèle de traduction qui réunit l’ensemble des lois du Québec traduites en anglais. Nous définissons les EM et les patrons phraséologiques comme des « énoncés multilexémiques » au sens de Mel’čuk (2013) qui définit ces unités linguistiques comme des « configurations de deux lexèmes ou plus syntaxiquement liés ». Le dispositif empirique que nous décrivons ne recourt à aucune autre distinction supplémentaire (et possiblement utile), comme celles que l’on pourrait trouver avantageux de faire entre ce que différents auteurs appellent les locutions, les collocations, les composés, en langue, ou encore entre les patrons phraséologiques, les routines sémantico-rhétoriques et les autres types de formules, en discours, qui font l’objet de la pragmatique. Le criblage automatisé des segments analysés manuellement dans le dispositif empirique repose sur la distance euclidienne (DE), une mesure de la distance entre deux segments calculée par la variation intersegmentale de trois caractéristiques telles que le nombre de caractères, le nombre de mots-formes et le nombre de mots lexicaux (voir les sections 4 et 5). Compte tenu de la nature des EM, à la frontière entre la syntaxe et le lexique des langues, comme l’a bien montré Legallois (2005), leur découverte doit porter non seulement sur les occurrences d’EM en particulier mais aussi sur les constructions syntaxiques, des patrons phraséologiques, qui en actualisent d’autres types dans le discours. Le dispositif empirique que nous présentons comporte deux volets, automatique et supervisé, qui sont conçus pour tirer parti des avantages de chaque approche pour faire avancer les connaissances sur les EM : 1) le volet automatique pour sa rapidité d’exécution et l’application systématique de critères connus et éprouvés dans le traitement automatique et outillé des données textuelles massives que représentent les corpus parallèles ; 2) le volet supervisé
Dispositif empirique semi-automatique de découverte des EM
217
qui permet la découverte de nouvelles EM et de propriétés inédites à celles-ci et qui contribue directement à l’avancement des connaissances sur les EM et les patrons phraséologiques. Les deux volets automatique et supervisé du dispositif pourront de même contribuer plus tard à l’étude dans les corpus parallèles des traductions des EM en langue source et à l’utilisation d’EM en langue cible non alignées à une EM de la langue source. Compte tenu de la position stratégique des EM et des patrons phraséologiques, entre la syntaxe et le lexique, entre la forme et le sens, il semble impossible dans l’état actuel des connaissances, et malgré les progrès réalisés en intelligence artificielle et dans l’apprentissage-machine, d’établir un traitement automatisé des EM qui ne s’appuierait pas, au moins en partie, sur une analyse supervisée des données qui se rapportent aux EM dans des textes qui représentent des usages réels. Avec ses deux volets automatique et supervisé, le dispositif s’appuie sur le contraste des usages dans deux langues différentes liés par la traduction en vue de mettre au jour des faits nouveaux concernant les EM, soit la caractérisation et l’identification des usages d’EM connues ou en partie connues, la découverte de leurs variantes, l’identification de leur patron phraséologique (le cas échéant), et la découverte de nouvelles EM ou de nouveaux patrons lexicographiques.1
2 Méthodologie et cadre de travail Le dispositif empirique a été élaboré à partir de la mise en parallèle ou de l’alignement des textes de lois du Québec traduites en anglais et il comporte trois étapes en vue de l’extraction et de la découverte d’EM. À la première étape, un corpus parallèle a été créé pour chacune des lois codifiées publiées en français et en anglais dans le Recueil des lois et des règlements du Québec sur le site web LégisQuébec du gouvernement du Québec. Le corpus LégisQuébec est constitué des textes des 5152 lois du Québec dans leurs versions française et anglaise (ce qui donne un total de 1.030 fichiers HTML). Le site web LégisQuébec (http://legisquebec.gouv.qc.ca) en est la source officielle. Les lois récupérées sont celles qui étaient en vigueur le 4 juillet 2018. Cette date a été sélectionnée Nous déclinons volontairement différents emplois des termes « identification » et « découverte » au sens de Constant et al. (2017) de manière à montrer que ces deux objectifs ou traitements des EM, quoique clairement distincts du point de vue de la langue et du lexique, deviennent plutôt diffus sur le plan du discours, lequel intéresse davantage la traduction. L’une des lois, la Loi sur les shérifs (Publications du Québec), a été exclue parce qu’elle ne compte que sept articles vides du fait qu’ils sont inopérants ou sans effet. Le corpus de lois est ainsi passé de 516 lois à 515.
218
Éric André Poirier
au hasard, sans raison particulière. La mise en parallèle des textes HTML a été effectuée à l’aide de scripts en langage Python (Python Software Foundation 2017) grâce notamment au module BeautifulSoup (Richardson 2015) permettant de faire du moissonnage de données dans le web. L’alignement initial des corpus parallèles respecte les divisions officielles utilisées dans les textes législatifs et qui sont reproduites dans les balises du langage HTML. À cette étape du dispositif, ces alignements sont présumés être exacts. Ce n’est qu’à l’étape suivante, après que les segments des corpus parallèles ont pu, lorsque cela était possible, être réduits à une ou plusieurs phrases grâce à un module de segmentation, qu’il a été possible de repérer les alignements hors norme donc potentiellement incorrects en vue de les corriger manuellement, le cas échéant. La deuxième étape du dispositif a consisté à analyser quantitativement les paires de segments des corpus à l’aide d’autres scripts en langage Python. Cette analyse quantitative exploite la non-littéralité de la traduction dans les paires de segments. Toutes les paires de segments du corpus ont fait l’objet d’une tokénisation et d’un étiquetage à l’aide du module spaCy (Honnibal/Montani 2017, version 2.1.3), ce qui a permis de mesurer la distance euclidienne normalisée3 à trois dimensions (trois caractéristiques segmentales qui sont fortement corrélées dans les traductions) qui sépare le segment cible du segment source : 1. Le nombre de caractères ; 2. Le nombre de mots totaux ; 3. Le nombre de mots lexicaux. Les trois caractéristiques choisies peuvent s’appliquer à la totalité des langues qui font la distinction entre les sens et les mots lexicaux (une classe ouverte), et les sens et les mots grammaticaux (une classe fermée), lesquels ne contribuent pas de la même façon au sens des énoncés, et sont par conséquent traduits d’une manière différente (Polguère 2003, 107–108 ; Poirier 2003). Cette étape automatisée et l’analyse quantitative du dispositif est décrite notamment dans Poirier (2019 ; 2021) et elle comporte le criblage des paires de segments des corpus grâce à la reconnaissance automatique des deux conséquences les plus manifestes de la non-littéralité des traductions, à savoir l’ajout ou l’omission de contenus informationnels dans le segment cible qui découlent des décalages de traduction (translation shifts) par rapport au contenu informationnel du segment source. L’hypothèse que nous formulons est que la phraséologie et les EM, en tant que servitudes linguistiques dans la
En fonction des valeurs moyennes du nombre de caractères, du volume d’information et du nombre total de mots pour tous les segments du texte de loi auquel les paires de segments appartiennent.
Dispositif empirique semi-automatique de découverte des EM
219
langue source, et en tant que témoignage des usages discursifs de la langue cible, sont présentes dans un grand nombre de décalages lexémiques. Grâce à la mesure de la distance euclidienne de toutes les paires de segments, il est ensuite possible de sélectionner et d’extraire celles qui sont le plus hétéromorphes négativement (le contenu informationnel du segment cible est inférieur à celui du segment source) ou positivement (le contenu informationnel du segment cible est supérieur à celui du segment source). L’hypothèse sous-jacente à l’extraction des paires de segments les plus hétéromorphes est que ce sont ces paires de segments qui comptent les décalages lexémiques intrasegmentaux les plus prononcés, lesquels sont le plus susceptibles de fournir des exemples authentiques (en discours) d’utilisation et de traduction d’EM. D’autres objectifs que celui que nous décrivons ici peuvent motiver l’analyse supervisée des décalages lexémiques intrasegmentaux : le repérage des erreurs ou anomalies d’alignement (en vue de leur correction), la mise au jour des techniques de traduction qui s’appliquent aux EM ou à l’ensemble des paires de segments hétéromorphes (et qui donnent un aperçu des techniques de traduction non littérale définies par exemple dans Molina/Hurtado Albir 2002), ou encore le repérage des anomalies et erreurs de traduction (ajouts et omissions, par exemple). La troisième et dernière étape du dispositif a consisté en une analyse qualitative menée au cours de l’été 2020 par trois étudiantes.4 Des règles de codification précises ont été communiquées aux étudiantes concernant l’annotation des décalages au moyen de balises (« < » ou « > », ou les caractères gras) pour indiquer le début et la fin de chaque décalage, et l’utilisation du symbole de l’élément vide (« Ø ») pour indiquer l’absence d’élément lexical correspondant dans le segment source ou cible, et la classification des décalages lexémiques en décalages de traduction positifs (ajout d’un élément lexical) ou négatifs (omission d’un mot lexical). L’analyse qualitative des paires de segments a été menée de manière exploratoire dans le but de comprendre quels sont les facteurs empiriques qui sont susceptibles d’expliquer les décalages présents en grand nombre dans les données. La présence d’EM constituait une partie de la réflexion plus large qui a été menée dans ce travail sur les techniques discursives qui sont constatées en pratique dans les décalages lexémiques. Avant de fournir de l’information sur les EM et les patrons phraséologiques, l’analyse qualitative comportait deux étapes préalables, à savoir l’identification et la délimitation des décalages lexémiques à l’intérieur des segments puis leur caractérisation en vue d’y repérer des phénomènes liés aux EM et aux patrons phraséologiques.
Isabelle Cloutier, Solaine Lagacé et Mélanie Desgent, que je tiens à remercier ici.
220
Éric André Poirier
Malgré son intensité analytique, la première étape d’identification et de délimitation des décalages lexémiques s’est avérée résolument objective, d’après le croisement des résultats obtenus par deux étudiantes sur les mêmes paires de segments analysés, notamment pour ce qui est de la nature positive ou négative du décalage lexémique. Concrètement, il s’agissait pour les étudiantes d’isoler dans les paires de segments criblés les décalages lexémiques pouvant expliquer la distance euclidienne importante entre les deux segments puis, pour chacun de ces décalages, à identifier les unités lexicales touchées par le décalage et les limites du décalage (dans les deux langues). Sur l’ensemble des décalages lexémiques repérés par les trois étudiants seul un très petit nombre d’EM ont pu être mises en cause, dont certaines étaient peu connues, comme c’est le cas du composé verbal juridique emporter déchéance dans la paire de segments no 17 (voir l’annexe 1). Dans un deuxième temps, le travail d’annotation et d’analyse des étudiantes consistait à caractériser les décalages lexémiques pour déterminer la motivation de ces décalages sur les plans linguistiques, textuels ou discursifs. Différentes données ont été codifiées par les étudiantes, à savoir la nature positive (ajout) ou négative (omission) du décalage lexémique, l’unité principale de départ qui est en jeu dans le décalage (avec possibilité d’identifier un élément vide), l’unité d’arrivée dans le décalage, la technique de transfert (définies par Molina/Hurtado Albir 2002), la nature figée, obligatoire, ou libre, facultative, du décalage (Wecksteen-Quinio et al. 2015), la présence d’un terme spécialisé du domaine juridique (lequel pouvait inclure aussi des expressions idiomatiques) dans l’un ou l’autre des segments alignés, la présence d’une explicitation en langue cible, la présence d’une transposition (comme la pronominalisation de contenus informationnels lexicalisés, simples ou complexes, ou la dépronominalisation de ces pronoms) et la présence ou non d’un déplacement du contenu informationnel dans une autre partie du texte qui serait attribuable à la technique de compensation en traduction. Cette activité d’annotation de notre dispositif empirique a permis de mettre au jour un grand nombre de patrons phraséologiques pouvant être mis en cause dans les décalages lexémiques, ce qui contraste avec le faible nombre d’EM relevées à l’étape précédente.
3 Caractéristiques du corpus LégisQuébec Le corpus LégisQuébec est un corpus parallèle spécialisé de textes législatifs dont la traduction est orientée du français à l’anglais. Les textes de loi en français et en anglais ont été consignés dans 515 fichiers bilingues de valeurs séparées par des
Dispositif empirique semi-automatique de découverte des EM
221
virgules (.csv). Dans ces fichiers, chaque ligne contenait un paragraphe de la loi. Pour chaque paragraphe, nous avons recueilli le texte en français, le texte en anglais et certaines métadonnées pour chacun (numéro d’article, nombre de mots dans chaque langue, etc.). Comme un grand nombre de textes de loi comportent à leur début une section de définitions, d’importants travaux de réalignement des contenus définitionnels ont dû être menés puisque l’ordre alphabétique des termes et expressions définis donne lieu à des résultats très différents dans les deux langues. Notre corpus final de 515 fichiers de format csv contenant des paragraphes et des paires de segments correctement alignés est constitué des éléments suivants : – – –
– –
515 lois traduites ou bitextes (source en français et traduction en anglais) 176.633 paragraphes (qui peuvent contenir une ou plusieurs phrases en français ou en anglais) 196.544 unités d’analyse ou paires de segments alignés (par défaut, un paragraphe ou sinon, à l’intérieur d’un même paragraphe, une ou plusieurs phrases françaises associées à une ou plusieurs phrases anglaises) Près de 13,5 millions de mots (6.974.679 en français (51,72 %) et 6.510.232 en anglais (48,28 %)) Plus de 78,6 millions de caractères dans les deux langues
Ces données caractérisent les corpus sur lesquels a été menée la première étape de notre dispositif empirique. Cette première étape peut s’appliquer à n’importe quel corpus de traduction parallèle. Les premières données recueillies automatiquement couvrent une vaste quantité de données textuelles et la deuxième étape de notre dispositif empirique consiste à sélectionner ou à cribler une partie de ces données qui est la plus susceptible de recéler des EM en vue d’automatiser la découverte d’EM dans les corpus parallèles de traduction et de mener des analyses plus fines pour caractériser empiriquement les catégories d’EM ainsi découvertes dans le corpus. La prochaine section décrit les travaux qui ont été menés à la deuxième étape du dispositif empirique.
4 Caractéristiques des 590 paires de segments criblées La mesure de la distance euclidienne de chaque segment des textes de loi du corpus LégisQuébec est la mesure de distanciation des segments cible avec leur segment source correspondant. La distance a été calculée selon trois dimensions : le nombre de
222
Éric André Poirier
caractères, le nombre de mots lexicaux et le nombre de mots totaux dans les segments source et cible. Cette mesure a servi à cribler, parmi les 196.544 paires de segments, celles dont le segment cible est le plus « éloigné » du segment source. Les distances euclidiennes des segments cibles ont été regroupées en cinq intervalles qui correspondent à un multiple de la distance euclidienne moyenne des paires de segments du texte de loi dans lequel elles ont été prélevées. Le tableau qui suit décrit, sur l’ensemble des 196.544 paires de segments, le nombre de paires de segments qui se trouvent dans un de ces intervalles ainsi que la précision informationnelle de leur traduction. Tableau 1 : Répartition des paires de segments criblées par multiples de la distance euclidienne moyenne et par précision informationnelle de la traduction. Entre et Entre et Entre et Entre et fois la DE Total fois la DE fois la DE fois la DE fois la DE moy. ou moy. moy. moy. moy. plus Précision négative
.
.
.
Précision positive
.
.
Paires criblées totales
.
.
.
Les paires de segments dont la distance euclidienne se situe à un écart-type ou moins de la distance euclidienne moyenne de leur texte de loi ne sont pas représentées dans le tableau, mais elles peuvent être déduites des données qui y figurent par la soustraction du nombre de paires de segments que nous avons criblées du nombre total de paires de segments du corpus (196.544), ce qui donne 186.772 paires de segments. On ne peut se prononcer sur le statut isomorphique ou hétéromorphique de ces segments car leur distance euclidienne se situe autour de la moyenne et jusqu’à près de deux fois la moyenne calculée pour le texte de loi auquel elles appartiennent. À notre connaissance, il n’y a pas de seuil établi pour déterminer la norme de corrélation entre la distance euclidienne et la précision informationnelle de la traduction. Dans notre analyse, nous avons simplement supposé que les distances euclidiennes très élevées (six fois ou plus la distance euclidienne moyenne du texte) sont le plus susceptibles de contenir des paires de segments dont l’hétéromorphisme est très prononcé, et de contenir des décalages lexémiques susceptibles de nous renseigner sur l’utilisation et la traduction des EM. Les paires de segments criblées ont été réparties entre celles dont la précision de la traduction est positive (plus de contenu informationnel dans le segment cible) et celles dont la précision est négative (moins de contenu informationnel dans le segment source).
Dispositif empirique semi-automatique de découverte des EM
223
5 Résultats de l’extraction automatique des paires de segments criblées Nous présentons à l’annexe 1 un échantillon des paires de segments dont la distance euclidienne est la plus faible et à l’annexe 2 un échantillon des paires de segments dont la distance euclidienne est la plus forte. Les colonnes de l’annexe fournissent des renseignements particuliers. La colonne 1 désigne le numéro séquentiel de la paire de segments en fonction de la distance euclidienne croissante. La colonne 2 est la désignation alphanumérique (I-3 par exemple pour la Loi sur les impôts, la loi la plus volumineuse du corpus, ou CCQ-1991 et CCQ-1992 pour les deux versions du Code civil du Québec) de la loi publiée dans le Recueil des lois et des règlements du Québec et de laquelle est extraite la paire de segments. La colonne 3 est le numéro de phrase séquentiel des segments traités et segmentés par notre module (il a servi principalement à effectuer des tests sur des paires de segments précises). La colonne 4 fournit la précision informationnelle de la traduction. La précision est négative (la traduction contient vraisemblablement au moins une omission) quand la précision est inférieure à la moyenne, généralement 1,0 à une décimale près, moins un écart-type, tandis que la précision est positive (la traduction contient vraisemblablement au moins un ajout) quand la précision est supérieure à la moyenne, généralement 1,0 à une décimale près plus un écart-type. La colonne 5 fournit la distance euclidienne calculée en fonction des paires de segments moyens de chaque texte de loi. Contrairement à la précision qui peut être positive ou négative, la distance euclidienne est toujours positive. La colonne 6 indique automatiquement si la précision informationnelle de la paire de segments est négative (OM pour omission de mots lexicaux) ou positive (AJ pour ajout de mots lexicaux). Les colonnes 7 et 8 contiennent les segments source et cible alignés. Pour la totalité des 590 paires de segments criblés, les distances euclidiennes varient de 22,4 à 266,08. La forte corrélation constatée entre les segments source et cible relativement aux facteurs utilisés dans le calcul de la distance euclidienne est utile pour le repérage des paires de segments mal alignés. On trouve ainsi quelques exemples d’alignement de définitions (qui se trouvent un peu partout dans les textes de loi) qui sont présentées dans un ordre différent dans les deux langues parce que le même ordre alphabétique s’applique sur des mots-formes et des lexèmes différents. Nous n’avons pas mesuré la proportion de détection des paires de segments mal alignés en raison de l’ampleur de la tâche d’analyse que cela comporte, mais, en revanche, nous n’avons pas trouvé de contre-exemple dans nos corpus de paires de segments non criblés. La distance euclidienne peut servir à mesurer automatiquement la qualité des alignements et à repérer les paires de segments problématiques qui nécessitent un remaniement des textes
224
Éric André Poirier
(comme pour l’ordre des définitions dans un texte de loi) ou une correction manuelle des alignements (en cas d’alignement partiel). Exemples d’alignements partiels découverts par le dispositif empirique (la chaîne de caractères mal alignée est soulignée) 230 C-44 39 2.3587 112.83 ['AJ'] tous les actes des administrateurs sont valides et lient la compagnie. but the stockholders may hold the election on any other subsequent day in the manner provided for by such by-laws, and all acts of directors shall be valid and binding upon the company. 109 CCQ-1991 3128 2.8506 75.51 ['AJ'] mais il conserve son droit de réclamer l’autre partie de l’obligation. In that case, if the debtor offers to pay the undisputed part, the creditor may not refuse to accept payment of it, but he retains his right to claim the other part of the obligation.
5.1 Résultats de l’analyse supervisée des 590 paires de segments criblées L’analyse supervisée des décalages lexémiques sur les 590 paires de segments bruts a été répartie entre les trois étudiantes : l’étudiante A a analysé l’ensemble des 590 paires de segments, l’étudiante B a analysé les segments 2 à 270 et l’étudiante C a analysé les segments 341 à 590 parce que les segments 270 à 340 sont identiques textuellement et représentent des segments répétitifs de la loi de l’impôt (I-3), à l’instar de la paire de segments no 270 : 270 I-3 28536 0.3133 147.45 ['OM'] Dans la présente partie, l’expression : In this Part, Pour ne pas alourdir leur tâche, les étudiantes n’avaient pas à analyser les paires de segments très longs ni à refaire la même analyse pour des segments textuellement identiques. Cette consigne fait en sorte que les étudiantes A et B avaient un peu moins de la moitié des paires de segments à analyser, mais comme les consignes étaient les mêmes pour les trois étudiantes, celle-ci ne devrait pas avoir entraîné de décalage important dans les données présentées ci-après (le même nombre de paires de segments textuellement identiques n’a pas été pris en compte de la même façon par les trois étudiantes). Les étudiantes devaient annoter les paires de segments en indiquant les limites de chacun des décalages identifiés et reproduire les paires de segments pour chaque décalage identifié dans la paire de segments, laquelle pouvait contenir plus d’un décalage. L’étudiante A a
Dispositif empirique semi-automatique de découverte des EM
225
pu identifier 1044 décalages sur les 590 paires de segments, à raison de 1,77 décalage par paire de segments. L’étudiante B a identifié 483 décalages sur les 268 analysés, soit 1,80 décalage par paire de segments. L’étudiante C a identifié 272 décalages sur les 199 paires de segments, ce qui donne un ratio de 1,37 décalage par paire de segments.
5.2 La découverte d’EM L’analyse qualitative exploratoire des décalages lexémiques a permis d’identifier ou de découvrir des EM qui appartiennent à cinq des sept catégories ou patrons phraséologiques de Constant, et al. (2017), à savoir les locutions, les composés, les mots grammaticaux complexes, les entités nommées multilexicales et les termes multilexicaux ou complexes. Une des deux catégories d’EM qui ne figurent pas dans les décalages lexémiques relevés dans le corpus et analysés par les étudiantes est celle des constructions avec verbe à particule (« verb-particle construction » ou « phrasal verb »). Comme la direction de la traduction de notre corpus est du français à l’anglais, on peut rattacher cette absence à l’hypothèse des items uniques de Tirkkonen-Condit (2004) qui prévoit que les « unités lexicales » uniques ou propres à la langue cible seront sous-représentées dans les textes traduits dans cette langue. L’autre catégorie que notre dispositif empirique n’a pas permis de mettre au jour et de découvrir clairement est celle des constructions à verbe support, même si on a pu identifier quelques occurrences manuellement. Cette sous-représentation dans le corpus criblé s’explique du fait que la traduction de ces EM ne donne généralement pas lieu à un décalage lexémique, en tous cas pour la traduction du français à l’anglais. De plus, certaines constructions à verbe support sont assez proches formellement des locutions (la différence reposant assez souvent sur l’appréciation du caractère plus ou moins figé ou contraignant des liens syntaxiques entre les lexèmes de l’EM), sans compter que dans des énoncés du discours, il est parfois difficile de délimiter les différentes catégories d’EM qui peuvent y cohabiter, comme dans l’énoncé qui suit qui contient possiblement trois EM différentes syntaxiquement liées, lesquelles sont indiquées en italiques : 70 C-25.01 583 0.5621 67.14 ['OM'] Une partie peut opposer l’irrecevabilité de la demande ou de la défense et conclure à son rejet dans l’une ou l’autre des circonstances suivantes : A party may ask that an application or a defence be dismissed if On peut trouver dans cet énoncé la construction à verbe support opposer l’irrecevabilité de qqch qui intègre syntaxiquement un deuxième type d’EM soit les colloca-
226
Éric André Poirier
tions ou locutions nominales irrecevabilité d’une demande, irrecevabilité d’une défense ainsi que, possiblement, une troisième EM qui intègre les deux locutions nominales : conclure au rejet de l’irreçevabilité de qqch. Cet exemple montre bien l’importance des critères empiriques de catégorisation des EM dans l’analyse des énoncés complexes qui sont susceptibles de contenir plusieurs EM enchâssées, syntaxiquement liées ou qui se partagent le même lexème exprimé une seule fois mais utilisé dans deux EM différentes. Il y a fort à parier qu’un traitement automatique de ces données à forte intensité analytique ne pourra jamais être satisfaisant sur le plan linguistique. Ces exemples montrent les limites de l’analyse des données empiriques fournies par les corpus parallèles de traduction concernant les EM mis en évidence dans l’une ou l’autre des langues.
5.3 La découverte de patrons phraséologiques Un grand nombre de patrons phraséologiques ont été mis au jour dans l’examen supervisé des données. L’identification de patrons phraséologiques offrent des défis importants au traitement automatisé des données puisqu’elle nécessite la reconnaissance de formes concrètes (occurrences de lemmes) et de structures ou de constructions plus abstraites dans la même suite de chaînes de caractères, voire dans une suite ultérieure de chaînes de caractères, comme c’est le cas des routines discursives que nous avons mises au jour (voir plus loin). Le point de départ des analyses supervisées étant le décalage lexémique constaté dans l’un ou l’autre segment, nous avons constaté que les patrons phraséologiques mis au jour sont associés aux phénomènes de redondance et d’ellipse qui se manifestent très différemment entre les langues et qui sont étroitement associés à leur génie stylistique.
5.3.1 Les entités nommées comme source de redondance La traduction des entités nommées entraine une redondance lexicale qui permet d’extraire et de découvrir de manière distinctive ces EM grâce à un patron phraséologique ou à une technique de traduction particulière en langue cible. Le recours à un corpus parallèle permet ainsi de mettre en œuvre des techniques complémentaires à celles de Caseli et al. (2010). De façon générale, les indices de découverte des entités nommées à l’aide des corpus parallèles de traduction sont présents dans le segment cible et servent à découvrir des entités nommées dans le segment source. Différentes techniques de
Dispositif empirique semi-automatique de découverte des EM
227
découverte des entités nommées dans les corpus parallèles de traduction peuvent être combinées à la mesure de la distance euclidienne. Les techniques décrites ciaprès visent la découverte d’entités nommées multilexémique, même si elles peuvent aussi s’appliquer aux entités simples. On trouve tout d’abord la dépronominalisation en langue cible qui est attribuable à la technique d’explicitation en traduction et qui fournit des indices de découverte des entités nommées dans la langue cible, comme l’illustrent les exemples suivants : 11 N-2 370 1.6478 47.07 ['AJ'] Il est composé de 6 membres : The executive committee shall consist of 6 members : 75 C-67.3 742 1.5321 68.55 ['AJ'] Il doit notamment : The board of supervision shall, in particular, 78 C-81 28 1.7247 69.06 ['AJ'] Il est notamment chargé : The Public Curator is responsible, in particular, for Ces exemples montrent que la découverte d’EM peut passer par des unités lexicales simples en langue source, en l’occurrence des pronoms. Une autre technique de découverte des entités nommées qui a été mise en évidence dans notre corpus est celle de la reconnaissance des variantes de traduction ou des expressions synonymiques. Le critère qui pourrait être utilisé ici est la coordination d’un nombre plus élevé d’éléments multilexémiques dans la langue cible que dans la langue source avec une mesure de leur similitude (qui révèle une relation synonymique). Dans l’exemple qui suit, on trouve quatre variantes d’un même terme. 185 C-25.01 2598 2.3128 94.9 ['AJ'] procès-verbal d’abornement remplace procèsverbal de bornage ; minutes of the determination of the boundaries, minutes of determination of boundaries, minutes of boundary determination, minutes of a boundary determination are replaced by minutes of the boundary-marking operations L'autre technique complémentaire de découverte de nouvelles entités nommées recourt à des périphrases caractéristiques dans le segment cible de la présence d’une entité nommée dans la langue source. Les indices utilisés ici sont la périphrase en anglais « under the name » (pour laquelle nous avons relevé une seule occurrence, au numéro 44) ou l’utilisation du mot-forme « French » (qui n’est employée qu’une seule fois dans notre corpus au numéro 29) :
228
Éric André Poirier
44 C-11.1 312 2.3915 64.8 ['AJ'] Est constituée la Commission conjointe d’aménagement de l’Outaouais. A joint land use planning commission for the Outaouais is hereby established under the name Commission conjointe d’aménagement de l’Outaouais 29 CCQ-1992 276 1.5625 59.66 ['AJ'] division d’enregistrement correspond à circonscription foncière ; in French texts, division d’enregistrement [registration division] corresponds to circonscription foncière [registration division] Une dernière technique de découverte consiste à recourir à des attributs typographiques présents dans la désignation des entités nommées comme les parenthèses (111) ou les guillemets (1). 111 R-25.01 259 2.408 75.69 ['AJ'] Train de l’Est. the Train de l’Est (eastern train) project. Dans le cas des attributs typographiques, ceux-ci doivent être présents dans le segment cible tout en étant absents du segment source. La présence de ces attributs dans les deux segments alignés ne constitue pas un indice révélateur de la présence d’une entité nommée.
5.3.2 Les routines discursives comme source d’ellipse Puisque notre corpus est constitué uniquement de textes législatifs, les routines découvertes appartiennent au domaine spécialisé du droit et de la rédaction juridique. On doit le concept de routines sémantico-rhétoriques à Tutin/Kraif (2016) qui se sont intéressés à ces patrons phraséologiques attestés dans les écrits scientifiques. Contrairement à ces travaux qui visent des EM de trois à cinq mots lexicaux, la mesure de la distance euclidienne a permis de récupérer un nombre important d’EM auxquelles aucun contenu informationnel n’est associé en langue cible (sans pour autant qu’elles représentent une anomalie d’alignement). Dans ces cas, le décalage lexémique, quoique très important, n’est pas pour autant total. Le type de routines discursives que nous avons découvert est caractérisé par le déplacement ou la permutation d’un contenu propositionnel (généralement une modalité de l’énumération ou une condition générale liée à celle-ci) qui est placé au début de l’énumération en français mais plutôt à la fin de celle-ci en anglais, comme en témoigne l’exemple suivant dans lequel la condition est énumérée au début en français (le passage permuté en anglais est surligné en français).
Dispositif empirique semi-automatique de découverte des EM
229
237 A-2.02 51 0.2022 117.42 ['OM'] Commet une infraction et est passible d’une amende d’au moins 500 $ et d’au plus 5000 $, quiconque, dans le cadre de la présente loi ou de ses règlements : Any person who, under this Act or the regulations, Les données relatives à cette paire de segments, à savoir la distance euclidienne ainsi que la précision informationnelle de la traduction (0,2022), et la prise en compte de son contenu montrent bien l’omission complète en anglais de la phrase coordonnée en français (et est passible d’une amende d’au moins 500 $ et d’au plus 5000 $). Pour retrouver la traduction de cette partie du segment, il est nécessaire dans leur découverte, de se reporter à l’article 24 de la loi traduit en anglais où on voit que cette phrase correspond en réalité à la dernière phrase de l’article (is guilty of an offence and liable to a fine of not less than $500 and not more than $5,000.). Comme notre dispositif ne s’attache pas à des mots-formes mais à la mesure des contenus informationnels il a permis de découvrir cette classe particulière d’EM qui n’est pas associée à des unités lexicales mais à une syntaxe propre à chaque langue. Le recours à des critères comme ceux de notre dispositif empirique favorise la découverte d’EM de ce type. La fréquence de ce type d’EM est difficile à mesurer mais nos données préliminaires semblent indiquer que si les conditions sont réunies (énumération, restriction relative à celle-ci), elles se produisent systématiquement et de la même manière en français et en anglais puisque nous n’avons pas relevé de contre-exemple, ce qui est grandement étonnant compte tenu du fait que les textes de loi ont vraisemblablement été rédigés et traduits par différentes personnes qui n’ont pu se concerter (ou sinon qui ont toutes respecté un protocole propre à chaque langue). Un autre exemple de routine sémantico-rhétorique propre à la rédaction juridique française est marqué par les inversions de l’ordre sujet-prédicat dans des énumérations qui sont mises en évidence par le syntagme « the following » en anglais. Ce type d’EM de nature discursive se situe à la frontière des EM proprement dites et des « préférences » stylistiques (et grammaticales) d’une langue, par rapport au mode expressif de la même information dans une autre langue. 25 J-2 14 1.6655 55.69 ['AJ'] Est inhabile à être juré : The following persons are disqualified from serving as jurors : 48 E-2.2 2119 2.4944 65.37 ['AJ'] Commet une infraction : The following persons are guilty of an offence : 68 E-2.2 199 1.9955 66.48 ['AJ'] Sont inéligible : The following persons are ineligible :
230
Éric André Poirier
On trouve aussi d’autres inversions sujet-prédicat en français qui se trouvent au début d’une énumération dans laquelle chacun des éléments peut constituer le sujet du prédicat qui présente l’énumération, comme dans les exemples suivants. 120 R-9 33 1.9503 77.98 ['AJ'] Est exclu : Excepted employment is : 145 P-9.1 141 0.3287 84.95 ['OM'] En outre, est aussi permise : In addition, 148 C-37.02 54 1.9794 85.12 ['AJ'] En font partie : The members of the executive committee are Dans ces cas, le décalage lexémique constaté provient de la traduction qui ne respecte pas l’inversion et qui contient explicitement les sujets sous une forme générique. Comme pour les autres EM qui s’expriment par une inversion sujet-prédicat, il est possible de découvrir ces EM au moyen d’une analyse en arbres de dépendances dans lesquels le sujet est absent. À notre connaissance, ce type d’EM n’a jamais été décrit et les verbes qui en font l’objet non plus. Comme ces EM se rapprochent d’une préférence stylistique, il serait envisageable de trouver une liste des verbes déclencheurs de ces inversions dans une description exhaustive des faits grammaticaux, comme on en retrouve dans le Bon usage de Goosse/Grevisse (2016).
5.3.3 Les routines discursives comme source de redondance D’autres types de routines propositionnelles ou syntagmatiques ont également été relevées. Dans ce cas-ci, le contenu des routines en français n’est tout simplement pas traduit et il semble bien que celui-ci puisse être considéré comme redondant. Ici aussi, ces routines semblent relever davantage de la rhétorique que de la sémantique. En voici quelques exemples (routines isolées manuellement et surlignées en italiques). 4 P-41.1 1 0.4157 28.19 ['OM'] Dans la présente loi, à moins que le contexte n’indique un sens différent, on entend par : In this Act, unless the context requires otherwise, 33 R-9.3 43 0.4877 61.06 ['OM'] Pour l’application de la présente loi, on entend par : For the purposes of this Act, 199 P-5.1 2213 0.4182 97.64 ['OM'] Pour qu’un navire constitue un navire prototype, les conditions suivantes doivent être remplies à son égard : A vessel is a prototype vessel if
Dispositif empirique semi-automatique de découverte des EM
231
221 C-24.2 1589 0.3961 107.91 ['OM'] Il est interdit au conducteur de conduire dans les cas suivants : No driver shall drive Ces formulations, jugées redondantes en langue cible, mettent en évidence un type d’EM discursif qui se traduit dans une autre langue par l’absence de ces contenus et donc par le volume d’information négatif du décalage lexémique. La meilleure technique de découverte de ces EM consiste à mesurer, comme nous avons fait, le décalage lexémique dans les paires de segments. Une approche encore plus avantageuse consisterait à isoler les décalages lexémiques dans les paires de segments par l’alignement prioritaire des données du segment cible, ce qui aurait pour résultat d’isoler l’EM non traduite en langue source et de l’associer à un élément vide en langue cible. Ce type d’analyse permet de mettre en évidence les routines discursives de la langue source considérées comme redondantes dans la langue cible.
6 Conclusion Le dispositif empirique que nous avons présenté décrit comment il est possible d’exploiter la non-littéralité de la traduction des EM pour la découverte d’EM et l’identification de patrons phraséologiques5 grâce à l’analyse supervisée ciblée de paires de segments extraites automatiquement d’un corpus parallèle de traduction. La mesure de la distance euclidienne mise en œuvre dans notre dispositif empirique constitue un outil d’extraction utile des paires de segments qui sont susceptibles de contenir des EM, lorsqu’elle est couplée avec la mesure de la précision informationnelle de la traduction. L’analyse supervisée de ces EM a permis d’isoler les EM dans les segments et de mettre au jour des propriétés de certains patrons phraséologiques en vue de la découverte automatique de ces types d’EM comme les entités nommées. Seule l’analyse supervisée des données a permis de mettre au jour un nouveau patron phraséologique de la langue juridique qui prend la forme de routines discursives. Plus largement, la présentation de notre dispositif empirique montre tout d’abord qu’il est possible et nécessaire de fonder le traitement automatique des données linguistiques, comme les EM, sur une analyse compétente des données. Notre dispositif empirique montre aussi comment il est possible et nécessaire d’alimenter l’analyse compétente et qualitative des données sur un prétraitement automatique qui seul
L’identification de patrons phraséologiques plutôt que la reconnaissance de catégories d’EM offre certainement une avenue prometteuse dans le traitement automatisé des EM.
232
Éric André Poirier
permet le criblage d’une sélection des données les plus riches parmi un ensemble de données si massives qu’il est devenu presque impossible de les traiter manuellement dans un temps raisonnable. Au regard de la traduction automatique et humaine qui se manifeste empiriquement dans des corpus parallèles, notre dispositif empirique, qui contribue à une meilleure identification des EM dans les textes parallèles, pourrait aussi contribuer à une meilleure compréhension des techniques récurrentes et inédites de traduction des occurrences d’EM identifiées dans les segments criblés, ainsi que des contextes d’utilisation récurrents ou inédits des EM dans la langue cible, lorsque celles-ci ne sont pas alignées à des EM en langue source.
Annexe I Vingt premières paires de segments du corpus de 590 paires extraites du corpus (six fois la distance euclidienne moyenne ou plus). Légende des colonnes : 1. Distance euclidienne ; 2. Précision positive ou négative de la traduction ; 3. Segment source ; 4. Segment cible 22.4 ['OM'] toute municipalité locale dont le nom, le 9 novembre 1978, comprenait à la fois un des toponymes énumérés ci-après et le mot « ville », lorsque le sigle « VC » ou « VT » apparaît à la suite du toponyme ; both one of the place-names hereinafter listed and the word « city », where the siglum « VC » or « VT » appears after the placename ; 23.12 ['AJ'] , la demande doit être à une demande d’exclusion. If the commission is not so satisfied, the application shall be considered to be an application for exclusion. 23.46 ['AJ'] elle contient au moins une unité animale ; the agricultural operation contains at least one livestock unit, and 28.19 ['OM'] Dans la présente loi, à moins que le contexte n’indique un sens différent, on entend par : In this Act, unless the context requires otherwise, 28.96 ['AJ'] les cités de Lauzon, Loretteville, Saint-Romuald-d’Etchemin et Sillery ; the cities of Beauport, Charlesbourg, Lauzon, Lévis, Loretteville, Québec, SainteFoy, Saint-Romuald-d’Etchemin and Sillery ; 34.27 ['AJ'] Il exerce ses fonctions à temps plein. The chief executive officer shall hold office on a full-time basis.
Dispositif empirique semi-automatique de découverte des EM
233
35.78 ['AJ'] Il exerce ses fonctions à temps plein. The chief executive officer shall hold office on a full-time basis. 37.56 ['AJ'] Il exerce ses fonctions à temps plein. The chief executive officer shall hold office on a full-time basis. 40.13 ['AJ'] Il exerce ses fonctions à temps plein. The chief executive officer shall hold office on a full-time basis. 46.19 ['AJ'] a élu domicile conformément à l’article 17 ; has elected domicile in the electoral district in accordance with section 17 ; 47.07 ['AJ'] Il est composé de 6 membres : The executive committee shall consist of 6 members : 50.82 ['AJ'] Il exerce ses fonctions à temps plein. The office of president and chief executive officer is a full-time position. 50.86 ['OM'] Contrat d’entreprise (contrat à forfait) Contract work 52.13 ['AJ'] Il exerce ses fonctions à temps plein. The office of president and chief executive officer is a full-time position. 52.15 ['AJ'] Il exerce ses fonctions à temps plein. The office of president and chief executive officer is a full-time position. 52.4 ['AJ'] Il exerce ses fonctions à temps plein. The office of president and chief executive officer is a full-time position. 52.63 ['AJ'] Ce délai est de rigueur et emporte déchéance. Such time limit is imperative and its expiry entails forfeiture of the right of appeal. 52.72 ['OM'] Tout est une personne morale. Every is a legal person. 53.02 ['OM'] Le décret de constitution doit contenir les mentions suivantes : The constituting order must contain 53.78 ['AJ'] Il exerce ses fonctions à plein temps. The president and general manager shall perform his duties on a full-time basis.
234
Éric André Poirier
Annexe II Vingt dernières paires de segments du corpus de 590 paires extraites du corpus (six fois la distance euclidienne moyenne ou plus). Légende des colonnes : 1. Distance euclidienne ; 2. Précision positive ou négative de la traduction ; 3. Segment source ; 4. Segment cible 250.16 ['OM'] la lettre B représente l’un des montants suivants : B is 251.99 ['OM'] Commet une infraction et est passible d’une amende de 5000 $ à 30000 $ dans le cas d’une personne physique et de 15000 $ à 100000 $ dans les autres cas toute personne qui, selon le cas : Any person that 253.02 ['OM'] la lettre A représente l’un des pourcentages suivants : A is 253.02 ['OM'] la lettre A représente l’un des pourcentages suivants : A is 253.02 ['OM'] la lettre B représente l’un des pourcentages suivants : B is 253.02 ['OM'] la lettre A représente l’un des pourcentages suivants : A is 253.02 ['OM'] la lettre A représente l’un des pourcentages suivants : A is 253.02 ['OM'] la lettre E représente l’un des pourcentages suivants : E is 253.02 ['OM'] la lettre B représente l’un des pourcentages suivants : B is 253.67 ['OM'] la lettre E représente l’une des proportions suivantes : E is 253.83 ['OM'] « rétribution brute » d’une personne donnée, à un moment quelconque, à l’égard d’un faux énoncé qui pourrait être utilisé par une autre personne ou pour le compte de celle-ci, signifie l’ensemble des montants que la personne donnée, ou une autre personne qui a un lien de dépendance avec la personne donnée, a le droit, conditionnel ou non, de recevoir ou d’obtenir à l’égard de l’énoncé, avant ou après ce moment ; « person » includes a partnership ; 253.87 ['OM'] la lettre A représente l’un des pourcentages suivants : A is 253.87 ['OM'] la lettre A représente l’un des pourcentages suivants : A is 253.87 ['OM'] la lettre A représente l’un des pourcentages suivants : A is 253.87 ['OM'] la lettre A représente l’un des pourcentages suivants : A is 253.87 ['OM'] la lettre A représente l’un des pourcentages suivants : A is 259.14 ['OM'] est l’une des actions suivantes : is
Dispositif empirique semi-automatique de découverte des EM
235
259.14 ['OM'] est l’une des actions suivantes : is 260.83 ['OM'] « cotisation admissible » d’un contribuable ou d’une société de personnes, pour une année d’imposition ou un exercice financier, selon le cas, relativement à un consortium de recherche admissible, désigne le montant obtenu en multipliant par le rapport qui existe entre, d’une part, la cotisation ou le droit que le contribuable ou la société de personnes, selon le cas, verse au consortium de recherche admissible, au cours de l’exercice financier de celui-ci qui se termine dans l’année d’imposition du contribuable ou l’exercice financier de la société de personnes, pour en être membre, et, d’autre part, l’ensemble des cotisations ou droits que versent, au cours de cet exercice financier du consortium de recherche admissible, tous les contribuables et toutes les sociétés de personnes qui en sont membres, le montant des dépenses faites par le consortium de recherche admissible pour des recherches scientifiques et du développement expérimental concernant une entreprise du contribuable ou de la société de personnes effectués par le consortium de recherche admissible au Québec, après le 14 mai 1992, au cours de son exercice financier qui se termine dans l’année d’imposition du contribuable ou l’exercice financier de la société de personnes, que l’on peut raisonnablement considérer comme attribuables aux cotisations ou droits versés, au cours de cet exercice financier du consortium de recherche admissible, par tous les contribuables et toutes les sociétés de personnes qui en sont membres ; « eligible research consortium » has the meaning assigned by paragraph a.1.1 of section 1029.8.1 ; 266.08 ['OM'] « solde de cotisation admissible » d’un contribuable ou d’une société de personnes, pour une année d’imposition ou un exercice financier, selon le cas, relativement à un consortium de recherche admissible, désigne l’ensemble des montants dont chacun représente le montant obtenu en multipliant par le rapport qui existe entre, d’une part, la cotisation ou le droit que le contribuable ou la société de personnes, selon le cas, a versé au consortium de recherche admissible au cours d’un exercice financier donné de celui-ci qui se termine dans une année d’imposition antérieure du contribuable ou un exercice financier antérieur de la société de personnes, pour en être membre, et, d’autre part, l’ensemble des cotisations ou droits qu’ont versés au cours de l’exercice financier donné du consortium de recherche admissible, tous les contribuables et toutes les sociétés de personnes qui en étaient membres, le montant des dépenses faites par le consortium de recherche admissible pour des recherches scientifiques et du développement expérimental concernant une entreprise du contribuable ou de la société de personnes effectués par le consortium de recherche admissible au Québec au cours de son exercice financier qui se termine dans l’année d’imposition du contribuable ou l’exercice financier de la société de personnes, que l’on peut raisonnablement considérer comme attribuables aux cotisations ou droits ainsi versés au cours
236
Éric André Poirier
de l’exercice financier donné du consortium de recherche admissible, par tous les contribuables et toutes les sociétés de personnes qui en étaient membres. « taxexempt taxpayer » has the meaning assigned by paragraph b.1 of section 1029.8.1.
Références Caseli, Helena de Medeiros/Ramisch, Carlos/Volpe Nune, Maria das Graças/Villavicencio, Aline, Alignement-based extraction of multiword expressions, Language resources and evaluation 44:1–2 (2010), 59–77. Constant, Matthieu/Eryiğit, Gülsen/Monti, Johanna/van Der Plas, Lonneke/Ramisch, Carlos/Rosner, Michael/Todirascu, Amalia, Multiword expression processing. A survey, Computational linguistics 43:4 (2017), 837–892. Goosse, André/Grevisse, Maurice, Le bon usage, Paris, De Boeck Superieur, 2016. Honnibal, Matthew/Montani, Ines, spaCy 2. Natural language understanding with Bloom embeddings, convolutional neural networks and incremental parsing, 2017, https://spacy.io/ [dernière consultation : 21.11.2021]. Lecolle, Michelle/Veniard, Marie/Guérin, Olivia, Pour une sémantique discursive. Propositions et illustrations, Langages 2:210 (2018), 35–54. Legallois, Dominique, Du bon usage des expressions idiomatiques dans l’argumentation de deux modèles anglo-saxon. La grammaire de construction et la grammaire des patterns, Les cahiers de l’institut de linguistique de Louvain 31:2:4 (2005), 109–127. Mel’čuk, Igor, Tout ce que nous voulions savoir sur les phrasèmes, mais…, Cahiers de lexicologie 102 (2013), 129–150. Molina, Lucía/Hurtado Albir, Amparo, Translation techniques revisited. A dynamic and functionalist approach, Meta. Journal des traducteurs/Meta. Translators’ journal 47:4 (2002), 498–512. Poirier, Éric, Conséquences didactiques et théoriques du caractère conventionnel et arbitraire de la traduction des unités phraséologiques, Meta. Journal des traducteurs/Meta. Translators’ journal 48:3 (2003), 402–410. Poirier, Éric André, Repérage des décalages informationnels de traduction au moyen du criblage automatique des segments hétéromorphes d’un corpus parallèle, TTR. Traduction, terminologie, rédaction 32:1 (2019), 279–308. Poirier, Éric André, What can euclidean distance do for translation evaluations ?, in : Bisiada, Mario (ed.), Empirical studies in translation and discourse, Berlin, Language Science Press, 2021, 27–61. Polguère, Alain, Lexicologie et sémantique lexicale. Notions fondamentales, Montréal, Les Presses de l’Université de Montréal, 2003. Publications du Québéc, Recueil des lois et des règlements du Québec (RLRQ)LégisQuébec, (sans date), http://www.legisquebec.gouv.qc.ca/fr/BrowseChapter?corpus=statutes [dernière consultation : 21.11.2021]. Python Software Foundation, Python (version 3.6.2), 2017, https://docs.python.org/fr/3.6/index.html [dernière consultation : 21.11.2021]. Richardson, Leonard, Beautiful soup 4.4. 0 documentation, 2015, https://beautiful-soup-4.readthe docs.io/en/latest/ [dernière consultation : 21.11.2021].
Dispositif empirique semi-automatique de découverte des EM
237
Tirkkonen-Condit, Sonja, Unique items-over-or under-represented in translated language?, Benjamins translation library 48 (2004), 177–186. Tutin, Agnès/Kraif, Olivier, Routines sémantico-rhétoriques dans l’écrit scientifique de sciences humaines. L’apport des arbres lexico-syntaxiques récurrents, Lidil 53 (2016), https://doi.org/10.4000/lidil.3966. Wecksteen-Quinio, Corinne/ Mariaule, Mickaël/Lefebvre-Scodeller Cindy, La traduction anglaisfrançais. Manuel de traductologie pratique, Louvain-la-Neuve, De Boeck, 2015.
Silvia Calvi, Patrick Drouin, Paolo Frassi
Acquisition (semi)-automatique des collocations terminologiques Exploration dans le domaine du droit du commerce international Résumé : Dans cette étude, nous nous occupons de la question de l’extraction automatique et/ou semi-automatique des collocations terminologiques, types d’unités phraséologiques dont les propriétés sémantico-syntaxiques posent certains problèmes lors de leur acquisition automatique. Après avoir présenté la définition de collocation que nous avons adoptée et après avoir décrit le corpus concernant le droit du commerce international sur lequel nous travaillons, nous établissons une comparaison des résultats obtenus de l’extraction automatique par trois outils : AntConc, TermoStat et Sketch Engine. Ce parcous nous permet de lister presque une centaine de collocations, un échantillon important du domaine, tant du point de vue quantitatif que du point de vue qualitatif. Mots-clés : extraction semi-automatique, Traitement Automatique des Langues, collocations terminologiques, DIACOM-fr, droit du commerce international Abstract: In this study we investigate the issue of automatic and/or semi-automatic extraction of terminological collocations, a kind of phraseological units whose semantic-syntactic properties entail some difficulties for automatic extraction. After a definition of collocation adopted for this study, we describe the corpus of international trade law built ad hoc. We then compare the results of automatic extraction with three tools : AntConc, TermoStat and Sketch Engine. Our results lead to the identification of almost a hundred collocations of international trade law, an important sample both from a quantitative and qualitative points of view. Keywords: semi-automatic extraction, Natural Language Processing, terminological collocations, DIACOM-fr, international trade law
Note : Silvia Calvi a rédigé les §§ 1, 3, 5, 6 ; Patrick Drouin a rédigé le § 4 ; Paolo Frassi a rédigé le § 2. https://doi.org/10.1515/9783110749854-012
240
Silvia Calvi, Patrick Drouin, Paolo Frassi
1 Introduction L’extraction terminologique constitue un domaine d’investigation de grande importance au sein du Traitement Automatique des Langues (TAL) : linguistes, terminologues et informaticiens travaillent au développement de logiciels capables d’automatiser autant que possible l’acquisition des termes. Même si l’extraction des termes est de mieux en mieux prise en charge par les nouvelles techniques proposées par l’informatique, ce n’est pas le cas de toutes les entités terminologiques qui caractérisent la langue spécialisée. Dans cet article, nous nous occupons de la question de l’extraction automatique des collocations, avec une attention particulière au domaine du droit du commerce international. Notre intérêt porte sur les collocations, car leur extraction pose certains problèmes ; par exemple, le fait que ces unités phraséologiques peuvent se présenter de manière disjointe (ex. les collocations la sentence s’impose, attirer des clients peuvent se présenter en discours de la manière suivante : la sentence, exécutoire, s’impose ; attirer le plus grand nombre possible de clients) rend plus difficile leur extraction par rapport à d’autres unités phraséologiques, comme les locutions (ex. commerce de gros signifiant ‘commerce qui consiste en l’achat et en la revente de marchandises au client final, généralement sans transformation et par petites quantités’ ; Grand dictionnaire terminologique, s.v.). Nous tenons à souligner que cette étude s’inscrit dans le cadre des réflexions menées au sein du Département des Langues et Littératures étrangères de l’Université de Vérone qui a obtenu en janvier 2018 un financement de la part du ministère italien de l’Éducation, de l’Université et de la Recherche pour le projet Le Digital Humanities applicate alle lingue e letterature straniere (Les Humanités Numériques appliquées aux langues et littératures étrangères). L’équipe de recherche dont nous faisons partie, DIACOM-fr, vient de finaliser la constitution d’un corpus de textes français concernant le domaine du commerce international, dans l’objectif plus général de réaliser une base de données terminologiques s’inspirant du modèle des reseaux lexicaux (Polguère 2014). Pour ce faire, nous sommes obligés de passer par l’extraction de termes simples et complexes. Étant donné que l’extraction terminologique automatique représente une étape clé du travail, nos objectifs principaux sont de comparer les résultats de plusieurs outils et de décrire une méthode d’acquisition semi-automatique des collocations terminologiques qui, dans des études pilotes réalisées préalablement, a donné les résultats les plus performants du point de vue qualitatif aussi bien que quantitatif. Notre travail se compose de quatre parties. Nous commençons par l’identification et la définition des entités terminologiques pour nous concentrer sur les propriétés syntaxiques et sémantiques de la collocation en langue générale et en langues de spécialité. Ensuite, nous allons décrire le
Acquisition (semi)-automatique des collocations terminologiques
241
sous-corpus du corpus DIACOM-fr sur lequel nous allons travailler aux fins de cette étude : il s’agit des textes de la période 1985–2020 concernant le domaine du droit du commerce international. Après avoir fourni des exemples d’outils permettant de prendre en charge l’extraction de collocations – AntConc, TermoStat et Sketch Engine –, nous allons présenter une comparaison des résultats obtenus pour dresser une liste de presque une centaine de collocations classées selon leur patron syntaxique or syntaxi-que et leur sémantisme, représentant un échantillon important du domaine, tant du point de vue quantitatif que du point de vue qualitatif.
2 La définition de collocation Notre étude s’encadre dans le modèle théorique de la Linguistique Sens-Texte et, plus particulièrement, de sa branche lexicale, la Lexicologie Explicative et Combinatoire (dorénavant LEC) qui a fourni, de notre point de vue, la modélisation la plus rigoureuse de la collocation, aussi bien du point de vue de ses propriétés syntactico-sémantiques que du point de vue d’une typisation des collocations. Certes, le modèle de la LEC a été conçu, élaboré et testé surtout dans la langue générale ; il s’applique néanmoins à la langue de spécialité, avec quelques variations près, que les terminologues et les terminographes ont déjà pris soin de dégager et que nous allons rappeler à la fin de ce paragraphe. La définition que la LEC fournit de la collocation se situe dans le sillon tracé par Hausmann (1989), Hausmann/Blumenthal (2006) : « Une collocation est une combinaison de lexies qui est construite en fonction de contraintes bien particulières : elle est constituée d’une base, que le locuteur choisit librement en fonction de ce qu’il veut exprimer (argument, brouillard, méchant…), et d’un collocatif (massue pour argument, dense pour brouillard, comme une teigne pour méchant), choisi pour exprimer un sens donné (ici, ‘intense’) en fonction de la base » (Polguère/Mel’čuk 2006, 70).
Pour Mel’čuk (2013), la collocation est un type spécifique de phrasème (= unité multilexémique non libre) : le phrasème s’oppose au syntagme libre par un ensemble de restrictions qui le touchent sur les plans syntagmatique et paradigmatique. Par exemple, un phrasème comme manger ses mots (‘bredouiller’) n’admet pas des transformations au niveau syntaxique (ex. : ✶les mots qu’il a mangés ; ✶il mange des/les mots ; ✶il mange énormément de mots etc.) ni au niveau paradigmatique (ex. : ✶avaler ses mots, ✶manger ses lexies). En l’occurrence, notre exemple – manger ses mots – présente le plus haut niveau de figement et fait partie de la catégorie de phrasèmes appelés locutions. D’autres phrasèmes sont moins contraints sur le plan syntagmatique et/ou paradigmatique : c’est le cas des collocations. Du fait de leurs propriétés syntaxi-
242
Silvia Calvi, Patrick Drouin, Paolo Frassi
ques, les collocations sont perçues comme deux lexies distinctes ; cela permet une relative liberté sur le plan paradigmatique et/ou syntagmatique. Pour ce qui est de l’axe syntagmatique, pour encoder une collocation un locuteur doit partir d’une base et associer à cette base un collocatif en appliquant un certain nombre de règles de grammaire selon le statut grammatical et syntaxique des deux composantes (ex. : base nominale et collocatif verbal – assister à un exposé – ou adjectival – médicament efficace –, base verbale et collocatif adverbial – applaudir à tout rompre, etc.). Pour ce qui est de l’axe paradigmatique, certaines collocations se prêtent à des variantes synonymiques de leurs collocatifs : par exemple, la collocation pleuvoir des cordes peut trouver des équivalents, avec la même base, comme pleuvoir des hallebardes, à flots, à seaux, à torrents, à verse. Si la LEC a hérité la définition de la collocation de la tradition linguistique, elle a eu néanmoins deux grands mérites : 1) avoir proposé des propriétés permettant de discrétiser les types divers de phrasèmes ; 2) quant à la collocation, d’avoir formalisé les liens les plus récurrents qui justifient l’affinité entre une base et son collocatif. Pour ce qui est de ce dernier point, l’outil dont la LEC s’est servie pour répertorier ces liens est constitué par la notion de fonction lexicale, qui représente un lien paradigmatique ou syntagmatique très général et très récurrent dans la plupart des langues du monde. Dans les collocations, les liens entre la base et son collocatif sont des liens in praesentia, donc syntagmatiques : chaque type de lien est associé à une fonction lexicale syntagmatique. Pour les fonctions lexicales nous renvoyons à Mel’čuk (1996), Mel’čuk/Polguère (2021). Ces propriétés de la collocation et, plus en général, des phrasèmes, s’appliquent assez bien aux entités terminologiques que l’on retrouve dans les langues de spécialité. Nous avons essayé de démontrer (Frassi et al. 2020 ; Frassi 2020) que les unités multilexémiques apparaissant en domaine de spécialité partagent un grand nombre des propriétés des phrasèmes telles qu’elles ont été identifiées dans la langue générale. Ainsi, une partie des unités multilexémiques correspondent aux locutions (faibles, ex. commerce électronique ; sémi-compositionnelles, ex. point de vente ; fortes, ex. marge arrière) et une autre partie des unités multilexémiques correspondent aux collocations. Plus particulièrement, les locutions correspondent à ce que la terminologie traditionnelle appelle les termes complexes (unités multilexémiques apparaissant dans un domaine de spécialité, composées par plusieurs mots graphiques) par opposition aux termes simples (unités composées par un seul mot graphique). Quant aux collocations, elles ne représentent pas des types de termes complexes ; pour leurs propriétés syntactico-sémantiques, elles représentent les propriétés de combinatoire des termes simples et complexes.
Acquisition (semi)-automatique des collocations terminologiques
243
Le schéma ci-dessous résume notre classement des termes : ceux-ci se situent dans la moitié supérieure, concernant les entités terminologiques. Nous retrouvons, d’une part, les termes simples, de l’autre, les termes complexes. Ceux-ci incluent les locutions (faibles, sémi-compositionnelles et fortes). La moitié inférieure du schéma concerne les propriétés de combinatoire des termes (simples et complexes) : il s’agit de l’ensemble de collocatifs (adjectivaux ou verbaux) qui peuvent, en l’occurrence, s’associer aux différents types de termes pour former des collocations :
Figure 1 : Représentation des entités terminologiques et de leurs propriétés de combinatoire.
Pour ce qui est de la moitié inférieure du schéma, qui est celle qui nous intéresse davantage dans le cadre de la présente étude, nous tenons à souligner que, puisque les collocations en terminologie possèdent essentiellement les mêmes propriétés que les collocations dans la langue générale, les mêmes types de liens syntagmatiques se présentent en domaine de spécialité : par exemple, le sens de ‘bon’, dans les collocations rapport fiduciaire ou client fidèle, ou, pour ce qui est des collocations à collocatif verbal, les collocations conclure un contrat (verbe de réalisation avec l’accent sur la fin du procès) ou réaliser un investissement (verbe de réalisation).
244
Silvia Calvi, Patrick Drouin, Paolo Frassi
Les entités linguistiques multilexémiques qui apparaissent en langue de spécialité, qu’il s’agisse de locutions ou de collocations, présentent des variations par rapport à l’ensemble des propriétés qui caractérisent ces mêmes phrasèmes dans la langue générale. Quant aux locutions, nous avons déjà démontré (Frassi à paraitre), que la différence principale réside dans l’interprétation des locutions faibles. Celles-ci, qui sont totalement transparentes, nécessitent toujours un élément sémantique, externe à la locution, qui permette de les interpréter correctement dans la langue générale : par exemple, la locution attendre un enfant doit s’appuyer sur un pivot sémantique externe (le sémantisme ‘grossesse’) pour qu’elle puisse être interprétée correctement. En langue de spécialité, la transparence des locutions faibles atteint son degré « zéro » : dans des locutions faibles comme commerce électronique le sens ‘commerce qui se fait par voie électronique’ est évident et le recours à un élément externe est totalement superflu. Pour ce qui est des collocations, comme le rappelle Calvi (à paraitre), une collocation terminologique nécessite toujours la présence d’un terme nominal ; en outre, il est nécessaire de considérer, comme l’ont démontré plusieurs études (voir notamment Martin 1992), la notion de collocation conceptuelle : il s’agit d’un paradigme variationnel qui peut concerner les collocations en terminologie et qui comporte non seulement la possibilité pour une seule base de s’associer à plusieurs collocatifs – ce qui est aussi le cas dans la langue générale, comme nous l’avons vu plus haut – mais également et surtout – ce qui affecte particulièrement les langues de spécialité – à un même collocatif de s’associer à plusieurs bases. Ainsi, par exemple, le collocatif dynamique peut s’associer à marché, secteur, entreprise, industrie pour exprimer le sens général de ‘bon’. Et, finalement, même si une grande partie des liens syntagmatiques codés par les fonctions lexicales se répliquent en langue de spécialité, comme le rappelle L’Homme (2002) il sera nécessaire d’identifier des liens non proprement standard entre bases et collocatifs. Nous croyons, plus particulièrement, que certains liens ne sont pas généraux (c’est-à-dire qu’ils ne se présentent pas dans tous les domaines de spécialité), mais qu’ils peuvent néanmoins être récurrents dans un domaine spécifique.
Acquisition (semi)-automatique des collocations terminologiques
245
3 Étude pilote : le corpus DIACOM-fr et le souscorpus du droit du commerce international 1985–2020 Notre étude pilote s’appuie sur un sous-corpus du corpus DIACOM-fr qui est constitué à l’heure actuelle de 583 textes – soit 10 millions d’occurrences – recueillis selon plusieurs critères : – Critère chronologique. Nous avons sélectionné des textes datant de trois périodes-clés du commerce international : – 1850–1915 : deuxième révolution industrielle ; – 1945–1970 : boom économique ; – 1985–2020 : développement du commerce électronique et du marketing. – Critère thématique. Nous avons considéré des textes appartenant à des sousdomaines différents du commerce international : – La macro-économie et l’économie internationale – Politique commerciale; – Pays d’étude; – Questions sociales. – Le secteur: – Produit1; – Service2.
En ce qui concerne cette catégorie nous nous sommes appuyés sur la liste de produits reconnus par l’OMC, c’est-à-dire animaux vivants et produits du règne animal ; armes et munitions ; bois, charbon de bois, liège ; chaussures, parapluies, fleurs artificielles ; cuir et articles de voyages ; graisses et huiles animales ou végétales ; instruments d’optique, horlogerie, instrument de musique ; machines et appareils électriques ; matières plastiques et caoutchouc ; matières textiles et ouvrages en ces matières ; métaux commun ; meubles, jouets, ouvrages divers ; objets d’art ou d’antiquité ; pâtes de bois, articles en papier et en carton ; perles, métaux précieux ; pierres, ciment, céramique, verre ; produits chimiques ; produits des industries alimentaires, boissons et liquides alcooliques, tabacs ; produits du règne végétal ; produits minéraux ; véhicules, aéronefs, navires. En ce qui concerne cette catégorie nous nous sommes appuyés sur la liste de services reconnus par l’OMC, c’est-à-dire : mouvement des personnes physiques ; services concernant l’environnement : services d’éducation ; services de communication ; services de construction et services connexes ; service de distribution ; services de santé et services sociaux ; services de tourisme ; service de transport ; services financiers ; services fournis aux entreprises ; services relatifs à l’énergie.
246
Silvia Calvi, Patrick Drouin, Paolo Frassi
–
–
Les types d’entreprise/activités d’entreprise – Management; – Marketing; – Logistique; – Commerce électronique; – Droit. Critère textuel. Nous avons recueilli des textes de typologies différentes : – Textes institutionnels – Textes académiques; – Documents d’entreprise; – Articles de la presse spécialisée.
Notre étude pilote n’a concerné qu’une partie de notre corpus, et notamment les textes allant de 1985 à 2020 et relevant du sous-domaine Types d’entreprise/activités d’entreprise (plus spécifiquement les textes du droit du commerce international). Il s’agit de 37 textes (830.355 occurrences) de nature différente : des textes institutionnels (40%), des articles de la presse spécialisée (40%) et des textes académiques (20%).
4 Les outils de l’extraction automatique De par leur nature plus imprévisible que les termes, les collocations sont plus difficiles à recenser automatiquement. L’Homme (2020, 229–230) souligne plusieurs défis liés à leur repérage, dont la variété des parties du discours impliquées (adjectifs, adverbes, noms, verbes), la flexibilité des réalisations de surface et la disjonction des éléments impliqués (ex. : a pour conséquence le réchauffement de la planète, la planète subit un réchauffement, la planète se réchauffe), la variation flexionnelle (ex. : assèche le marais, assèchent les marais), la variabilité de mots grammaticaux impliqués (ex. : assèchement de la zone humide, assèchement des zones humides), leur ressemblance aux termes (voir section 2), etc. Il est donc difficile de mettre en place des algorithmes permettant leur extraction. À notre connaissance, il n’existe pas de logiciel entièrement dédié à l’extraction automatique des collocations. Nous explorons ici des logiciels ayant des fonctionnalités qui possèdent des mécanismes pouvant assister dans le repérage des collocations : un concordancier (AntConc), un extracteur de termes (TermoStat) et un gestionnaire de corpus (SketchEngine).
Acquisition (semi)-automatique des collocations terminologiques
247
Le premier outil testé, AntConc (Anthony 2019), est un concordancier élaboré par Laurence Anthony et distribué gratuitement. Bien qu’il ne soit pas dédié à l’extraction des collocations, il possède des fonctionnalités qui le rendent apte à prendre en charge une partie du repérage des collocations. Les modules Clusters/N-Grams et Collocates sont parmi les plus pertinents pour la démarche qui nous intéresse dans cet article. Le premier module, Clusters/N-Grams, est consacré à ce qu’on nomme généralement en français des segments répétés. L’algorithme est simple et il consiste à balayer l’ensemble du corpus pour repérer les séquences de mots (d’une longueur paramétrable) qui se répètent à l’identique. Il s’agit d’un processus relativement lent et qui conduit à un ensemble de résultats très bruyants puisque toutes les séquences qui se répètent sont repérées, indépendamment de leur intérêt linguistique. L’utilisation d’un seuil minimal de fréquence permet cependant de filtrer une partie des résultats. On y retrouvera des termes, des collocations et des unités qui n’ont pas de statut linguistique. Notre attention s’est donc tournée vers Collocate, qui donne accès à des paires de mots qui se retrouvent régulièrement à proximité dans le corpus selon une fenêtre dont le nombre de mots et la fréquence minimale sont paramétrables. Malgré le nom anglais du module qui suggère qu’il repère des collocations, l’outil se limite ici à des cooccurrents puisqu’il n’exploite ni les relations syntaxiques, ni les relations sémantiques. L’outil permet donc de retrouver des formes qui apparaissent régulièrement ensemble dans une fenêtre de largeur variable. La régularité de cette apparition dans des contextes est mesurée à l’aide d’indices statistiques : l’information mutuelle (mutual information), l’information mutuelle couplée à la vraisemblance (log-likelihood) et le T-Score. Ces indices statistiques permettent donc d’évaluer la propension de deux formes à apparaître dans les mêmes contextes dans un corpus. Généralement, plus la valeur est élevée, plus la paire de mots est intéressante. TermoStat est le second outil utilisé ici pour essayer d’extraire des collocations. Ce logiciel est un extracteur de termes développé au sein de l’Observatoire de linguistique Sens-Texte de l’Université de Montréal par Patrick Drouin (Drouin 2003). Afin d’extraire les termes, TermoStat met en opposition les corpus spécialisés (où sont extraits les termes) et des corpus non-spécialisés. Cette mise en opposition facilite le repérage des termes du domaine d’intérêt. Le corpus non-spécialisé exploité par le logiciel, pour le français, est un corpus d’environ 28 millions d’occurrences composé d’articles de différents sujets publiés en 2002 sur le quotidien Le Monde. Une fois l’extraction automatique des termes effectuée sur un corpus créé ad hoc, le logiciel présente une série d’onglets permettant d’explorer les résultats sous différents angles. L’onglet principal recense les candidats termes et fournit de l’information sur ces derniers : la fréquence, la spécificité, les variantes orthographiques et la matrice. La spécificité est issue de la comparaison du corpus analysé au corpus général et représente en gros dans quelle mesure le candidat terme est représentatif du corpus analysé (et indirectement du domaine) et la matrice le patron de surface
248
Silvia Calvi, Patrick Drouin, Paolo Frassi
utilisé pour recenser le candidat (ex. : Nom Préposition Nom). On retrouve dans ces patrons une intersection avec le mode de formation des collocations (ex. : Nom Adjectif), ce que nous tenterons d’exploiter pour le repérage des collocations.
Figure 2 : La liste des termes de TermoStat.
Le logiciel comporte un second onglet pouvant nous être utile. En effet, l’onglet Bigrammes isole des paires de noms et de verbes dont l’association est jugée significative dans le corpus. La force de cette association est mesurée, comme dans AntConc, à l’aide d’un indice statistique (vraisemblance ou log-likelihood). Les pai-
Figure 3 : Les Bigrammes de TermoStat.
Acquisition (semi)-automatique des collocations terminologiques
249
res sont extraites à partir des unités verbales et les noms sont identifiés en position sujet ou objet du verbe. C’est cette exploitation des parties du discours qui distingue les résultats de TermoStat de ceux de AntConc. Sketch Engine est décrit par ses auteurs (Kilgarriff et al. 2014) comme un gestionnaire de corpus. Il est cependant beaucoup plus que ça et il s’agit d’un outil complexe et complet possédant divers modules qui facilitent l’exploration des corpus textuels. Les deux modules que nous exploitons dans cet article sont Keywords et Word Sketch. Le premier est consacré à l’identification des mots les plus caractéristiques d’un corpus et fonctionne selon le même principe de mise en opposition de corpus que TermoStat. Cependant, contrairement à ce dernier où le corpus de référence est fixe, Sketch Engine permet à l’utilisateur de sélectionner le corpus auquel sera comparé le corpus analysé. En quelque sorte, quand on lui soumet un corpus spécialisé, les données extraites par Keywords sont des termes potentiels.
Figure 4 : Les termes extraits par Sketch Engine.
250
Silvia Calvi, Patrick Drouin, Paolo Frassi
Figure 5 : Les termes complexes extraits par Sketch Engine.
Le second module exploité est consacré l’identification de relations syntaxiques privilégiées à l’aide des word sketches. Par exemple, si on s’intéresse à une unité verbale, le logiciel nous fournira la liste des unités qui apparaissent en position sujet, objet, etc. Les word sketches sont intéressants puisque leur identification repose sur une analyse syntaxique de la phrase et non sur l’utilisation de patrons de surface. L’idée est ici la même que dans le module Collocates de AntConc ou Bigrammes de TermoStat, mais l’ajout d’un analyseur syntaxique permet de raffiner et filtrer les résultats.
Acquisition (semi)-automatique des collocations terminologiques
Figure 6 : Les word sketches extraits par Sketch Engine.
251
252
Silvia Calvi, Patrick Drouin, Paolo Frassi
5 Résultats de l’extraction automatique et proposition de classement Les premiers essais d’extraction automatique nous font comprendre les failles des outils présentés. Par exemple, la fonction Collocate de AntConc conduit à des combinaisons de mots qui, bien souvent, ne correspondent pas à la définition de collocation que nous avons adoptée : en effet, il s’agit des combinaisons récurrentes d’un point de vue quantitatif mais qui ne présentent pas les propriétés syntactico-sémantiques des collocations que nous avons illustrées (ex. sentence arbitrale, sentence et sa validité). Pour sa part, TermoStat donne comme termes complexes seulement des syntagmes nominaux (ex. clause compromissoire, droit international) qui, dans la plupart des cas, ne sont pas de collocations. La fonction Bigrammes du même logiciel permet d’analyser les collocations à collocatif verbal (ex. remettre en cause, apporter une solution), fonction de grand intérêt si nous considérons que l’acquisition de cette typologie de collocation crée encore aujourd’hui de nombreuses difficultés, souvent liées au fait qu’elles peuvent se présenter de manière disjointe. La fonction Word Sketch de Sketch Engine présente aussi une faille : elle ne permet pas de différencier la collocation des autres types d’unités phraséologiques, plus particulièrement des locutions, comme commerce électronique. Ces difficultés montrent qu’aucun des outils illustrés donne une liste exhaustive des collocations du domaine d’intérêt : c’est justement pour cela qu’une comparaison de tous les résultats s’avère nécessaire. Nous tenons à souligner que nous avons adopté deux méthodes d’extraction en fonction du patron syntaxique à étudier : – une méthode d’extraction automatique pour les collocations ayant les patrons Nom Adjectif (ex. publicité trompeuse) ou Nom Préposition Nom (ex. part de marché) ; – une méthode d’extraction automatique pour les collocations à collocatif verbal (ex. conclure un contrat). En ce qui concerne les collocations Nom Adjectif ou Nom Préposition Nom, nous avons exploité TermoStat et Sketch Engine : nous avons mené une extraction automatique des termes complexes. Nous n’avons pas pris en compte la fonction Keyword list de AntConc, car elle ne se focalise que sur les termes simples. Dans le but d’analyser les résultats, nous n’avons retenu que les données ayant pour TermoStat un score de spécificité > 10, 972 candidats de regroupement, et pour Sketch Engine un score du Simple Math > 10, 588 candidats de regroupement. Les résultats de l’extraction sont proches : en effet, beaucoup de combinaisons sont extraites par les deux outils (ex. siège réel, clause abusive). Dans le but de réduire le silence dans les
Acquisition (semi)-automatique des collocations terminologiques
253
résultats, nous avons décidé de considérer les collocations apparaissant dans les deux extracteurs aussi bien que les collocations repérées par l’un de deux logiciels (ex. part de marché collocation extraite exclusivement par TermoStat et publicité trompeuse collocation extraite par Sketch Engine) : cela a augmenté les collocations extraites de manière automatique. Nous avons adopté cette stratégie parce que le seuil établi est élevé et il pourrait causer une perte significative de données. À partir de cette liste, nous avons comparé les résultats et nous avons repéré manuellement les unités phraséologiques de type collocation. Nous avons analysé les collocations candidates selon trois critères : 1) leur appartenance au domaine d’intérêt ; 2) leur patron syntaxique : Nom Adjectif ou Nom Préposition Nom ; 3) leur sémantisme et leur formalisation en faisant appel aux fonctions lexicales introduites par la LEC. Bref, nous avons écarté les combinaisons d’autres domaines et/ou de la langue générale (ex. champ d’application), les combinaisons aux patrons syntaxiques différents (ex. question de compétence judicaire), les combinaisons qui, à la différence des collocations, ne pouvaient pas se décrire en faisant appel aux fonctions lexicales, comme par exemple les unités phraséologiques de type locution (ex. droit commercial). Ce filtrage manuel a donné comme résultats 68 collocations terminologiques que nous avons classées à l’aide du système des fonctions lexicales. Tableau 1 : Les collocations (Nom Adjectif ; Nom Préposition Nom) du domaine du droit du commerce international classées par fonctions lexicales. Magn 1. Faute lourde
AntiMagn 1. Droit souple 2. Effet aléatoire 3. Droit mou 4. Partie faible 5. Prix bas 6. Investissement détendu
254
Silvia Calvi, Patrick Drouin, Paolo Frassi
Tableau 1 (suite) Ver 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31.
Force probante Opération garantie Temps opportun Siège réel Contrepartie réelle Attente légitime Nationalité effective Valeur probante Consécration légale Résultat prévu Force obligatoire Force contraignante Règle impérative Informations obligatoires Délai raisonnable Contrat consensuel Mesure raisonnable Traitement équitable Fiscalité équitable Procédé fiable Traitement juste Disposition conventionnelle Loi type Pratique conventionnelle Droit conventionnel Obligation conventionnelle Clause conventionnelle Documents représentatifs Traitement spécial Règle spéciale Droit spécial
Bon 1. 2. 3. 4. 5.
Rapport fiduciaire Support durable Tribunal compétent Bonne foi Droit positif
AntiVer 1. Rupture fautive 2. Réticence dolosive 3. Gain manqué 4. Partie fautive 5. Enrichissement injustifié 6. Clause abusive 7. Partie lésée 8. Société lésée 9. Personne lésée 10. Fait illicite 11. Acte illicite 12. Prix illicite 13. Publicité trompeuse 14. Mesure préjudiciable 15. Droit alternatif
AntiBon 1. Mesure litigieuse 2. Pratique contentieuse 3. Pratique discriminatoire 4. Vente discriminatoire 5. Méthode conflictuelle
Culm 1. Échanges totaux
AntiCulm 1. Temps partiel
Sing 1. Part de marché
Mult 1. Groupe d’entreprise 2. Groupe de sociétés
Acquisition (semi)-automatique des collocations terminologiques
255
Ces exemples démontrent que dans la langue du droit du commerce international, il existe un haut pourcentage de collocations qui présentent les mêmes fonctions lexicales que dans la langue générale, comme par exemple les sens de ‘très’, ‘intense’, ‘à un degré élevé’ (Magn), de ‘tel qu’il faut’ (Ver), de ‘bon’ (Bon), de ‘point culminant de la L1’ (Culm) et de leurs contraires (AntiMagn, AntiVer, AntiBon, AntiCulm). Il n’est pas étonnant que la fonction lexicale la plus répandue soit Ver, indiquant le sens de ‘tel qu’il faut’ ; en effet ce sémantisme est très répandu dans le domaine du droit que nous sommes en train d’investiguer. Toutefois, il est intéressant d’observer qu’il existe aussi des différences. À partir de l’analyse de la langue générale, la LEC a formalisé les fonctions lexicales Sing, l’unité minimale régulière de la L1, et Mult, l’ensemble régulier de la L1, comme des fonctions paradigmatiques in absentia, c’est-à-dire des liens entre deux lexies concernant l’axe de la sélection des unités linguistiques par le locuteur (ex. Sing (flotte)= navire ; Mult (navire)= flotte). Par contre, dans les langues de spécialité ces fonctions lexicales formalisent bien souvent des rapports syntagmatiques in praesentia, c’est-à-dire des relations concernant l’axe de la combinaison des unités linguistiques, comme dans les exemples illustrés Sing (marché) = part [de ~], Mult (entreprise) = groupe [d’~]. Ces derniers exemples prouvent que dans la langue du droit du commerce international, les sémantismes d’unité minimale et/ou ensemble régulier de la L1 sont bien souvent représentés par des liens syntagmatiques composés d’un terme du domaine de référence, la base (ex. marché, entreprise), et d’une lexie de la langue générale, le collocatif, indiquant le sens d’unité ou d’ensemble (ex. part, groupe). Cela dépend du procès de lexicalisation à l’origine de la création de nouveaux termes qui, comme Frassi (2020) le rappelle, sont dans la plupart de cas forgés ad hoc : la nécessité d’introduire des dénominations spécifiques comporte l’introduction d’expressions multilexémiques transparentes permettant une compréhension immédiate et univoque, comme pour part de marché et groupe d’entreprises. L’extraction automatique des collocations à collocatif verbal est plus complexe. Nous avons décidé de comparer les bigrammes aux Collocates de AntConc et aux Word sketches de SketchEngine. Nous rappelons que ces deux dernières fonctions sont guidées par le chercheur qui doit décider les termes pour lesquels observer les collocatifs : c’est pour cette raison que notre point de départ a été TermoStat. Nous avons extrait les termes simples ayant un score de spécificité > 10,3 550 candidats termes que nous avons filtrés de manière manuelle selon un critère thématique. Suite à ce filtrage manuel nous avons obtenu 126 termes simples pour lesquels nous avons analysé les collocatifs verbaux à l’aide de AntConc et de Sketch Engine ; ensuite nous avons comparé ces résultats aux Bigrammes de TermoStat. Nous
Nous avons établi le même score que pour les termes complexes, c’est-à-dire un score de spécificité > 10.
256
Silvia Calvi, Patrick Drouin, Paolo Frassi
avons retenu 24 collocations qui appartiennent au domaine de référence et qui peuvent se classer en faisant appel aux fonctions lexicales formalisées par la LEC. Tableau 2 : Les collocations à collocatif verbal du domaine du droit du commerce international classées par fonctions lexicales. Operi 1. Porter une réclamation
Involv 1. Le traité comporte 2. Le traité prévoit
Reali 1. Réaliser un investissement 2. Effectuer un achat 3. Saisir le tribunal 4. Adresser une réclamation 5. Accomplir une obligation
IncepReali 1. Adopter une mesure 2. Passer une commande 3. Valider une commande 4. Approuver une commande
FinReali 1. Conclure un contrat 2. Conclure un accord 3. Conclure un investissement 4. Conclure un traité 5. Exécuter une obligation 6. Régler un litige 7. Livrer les marchandises 8. Résoudre un litige 9. Trancher un litige
ExcessFacti 1. Les importations augmentent
Prepar 1. Faciliter le commerce
Perm 1. Autoriser la ratification
Les collocations à collocatif verbal présentent les mêmes fonctions lexicales que celles de la langue générale : les collocatifs verbaux sont des verbes supports (ex. Operi), des verbes ayant le sens de ‘impliquer, affecter’ (ex. Involv) et de ‘réaliser’ (ex. Reali). La prédominance des fonctions lexicales indiquant une phase du cycle économique (ex. Incep, Fin) est un trait intéressant du domaine du droit du commerce international et de façon plus générale du domaine du commerce, comme Cohen l’explique à propos du domaine économique et boursier : « Les cooccurrents sont classés selon les phases du cycle économique, à savoir le début, la croissance, le déclin et la fin, auxquelles nous avons ajouté une catégorie pour les mouvements indéterminés ou neutres et une autre catégorie « Autres » dans laquelle sont consignés des cooccurrents qui n’entrent pas dans les mouvements cycliques » (Cohen 2011, X).
De plus, les collocations extraites montrent d’autres caractéristiques typiques du domaine d’étude : l’importance de verbes qui formalisent le sens de ‘augmenter’
Acquisition (semi)-automatique des collocations terminologiques
257
(ex. ExcessFacti) et de ‘permettre’ ou ‘préparer’ une action ou un événement (ex. Perm, Prepar). Ces derniers représentent des sémantismes que nous supposons revêtir un rôle d’indéniable importance au sein du domaine du droit du commerce international : en effet, l’augmentation du commerce, des gains est ce que les commerçants souhaitent, alors que le fait d’autoriser, de rendre possible une action économique est l’une des tâches majeures du droit du commerce international.
6 Conclusions Le parcours présenté nous a permis, d’une part, de donner une définition de collocation dans les langues de spécialité et, d’autre part, de décrire une méthode d’extraction automatique des collocations à l’aide de plusieurs logiciels. Les collocations, des propriétés de combinatoire des termes simples et complexes, sont plus difficiles à extraire que les termes à cause de leur caractère imprévisible. Dans cette étude nous nous sommes proposés d’introduire une méthode d’extraction automatique efficace : une méthode qui s’appuie sur la comparaison des résultats fournis par trois logiciels différents – un concordancier, un extracteur des termes et un gestionnaire de corpus. Les résultats de l’extraction automatique présentent un pourcentage élevé de bruit qui impose au terminologue d’épurer ces listes de manière manuelle : c’est justement pour cela que nos essais d’extraction terminologique ne peuvent que se définir semi-automatiques. Le filtrage manuel représente une étape-clé du travail sans laquelle nous ne parviendrons pas à avoir un échantillon si précis du point de vue qualitatif des collocations du domaine d’intérêt. Les critères du filtrage manuel – des critères thématiques, syntaxiques et sémantiques – ont été établis dans le but de retenir les seules collocations qui, appartenant au domaine d’intérêt et présentant les propriétés sémantico-syntaxiques énoncées par la LEC, respectent la définition de collocation que nous avons adoptée.
Bibliographie Anthony, Laurence, AntConc (Version 3.5.8) [Computer Software], Tokyo, 2019, https://www.lauren ceanthony.net/software [dernière consultation : 13.12.2021]. Calvi, Silvia, Collocations terminologiques et extraction automatique. Une étude pilote dans le domaine du commerce électronique, Academic journal of modern philology 13 (2021), 75–82. Calvi, Silvia, Collocations et terminologie : extraction semi-automatique et classement des collocations dans le domaine du commerce international, Thése de doctorat, Université de Vérone, 2022. Cohen, Betty, Lexique de cooccurrents. Bourse et conjoncture économique, Montréal, Les Presses de l’Université de Montréal, 2011.
258
Silvia Calvi, Patrick Drouin, Paolo Frassi
Drouin, Patrick, Term extraction using non-technical corpora as a point of leverage, Terminology 9:1 (2003), 99–115. Frassi, Paolo, La force des locutions faibles en domaine de spécialité, in : Célio Conceição, Manuel/ Zanola, Maria Teresa (edd.), Terminologia e mediação lingüística. Métodos, práticas e atividades, Faro, Universidade do Algarve Editora, 2020, 41–58. Frassi, Paolo, Les unités multilexémiques non libres entre langue générale et langue de spécialité, in : Henrot Sostero, Geneviète (ed.), Alle radici della fraseologia europea, Bern, Peter Lang, 2023, à paraître. Frassi, Paolo/ Calvi, Silvia/ Humbley, John, Fouille de textes et repérage d’unités phraséologiques, in : Brun, Cristophe/Roche, Cristophe, (ed.) TOTh 2019. Terminologie & ontologie, Chambéry, Presses Universitaires Savoie Mont Blanc, 2020, 321–338. Hausmann, Franz Josef, Le dictionnaire des collocations, in : Hausmann, Franz Josef/ Ungeheuer, Gerold/ Steger, Hugo/ Wiegand, Herbert Ernst/ Burkhardt, Armin (edd.), Wörtherbücher. Ein internationales handbuch zur lexicographie, Berlin/New York, Walter de Gruyter, 1989, 1010–1019. Hausmann, Franz Josef/Blumenthal, Peter, Présentation. Collocations, corpus, dictionnaires, Langue française 150 (2006), 3–13. Kilgarriff, Adam/ Baisa,Vít/ Bušta, Jan/ Jakubíček, Miloš/ Kovář, Vojtěch/ Michelfeit, Jan/ Rychlý, Pavel/ Suchomel, Vít, The Sketch Engine. Ten years on, Lexicography 1 (2014), 7–36. L’Homme, Marie-Claude, Fonction lexicales pour représenter les relations sémantiques entre termes, TAL 43:1 (2002), 19–41. L’Homme, Marie Claude, La terminologie. Principes et techniques, Montréal, Les Presses de l’Université de Montréal, 22020. Martin, Willy, Remarks on collocations in sublanguages, Terminologie et traduction 2:3 (1992), 157–164. Mel’čuk, Igor, La phraséologie et son rôle dans l'enseignement-apprentissage d'une langue étrangère, Études de linguistique appliquée 92 (1993), 82. Mel’čuk, Igor, Lexical functions. A tool for the description of lexical relations in a lexion, in : Wanner, Leo (ed.), Lexical functions in lexicography and natural language processing, Amsterdam, Benjamins Academic Publishers, 1996, 37–102. Mel’čuk, Igor, Tout ce que nous voulions savoir sur les phrasèmes, mais…, Cahiers de lexicologie 102:1 (2013), 129–149. Mel’čuk, Igor/ Polguère, Alain, Les fonctions lexicales dernier cri, in : Marengo, Sébastien, La théorie Sens-Texte. Concepts-clés et applications, Paris, L’Harmattan, 2021, 75–155. Polguère, Alain, From writing dictionaries to weaving lexical networks, International journal of lexicography 27:4 (2014), 396–418. Polguère, Alain/Mel’čuk, Igor, Dérivations sémantiques et collocations dans le DiCo/LAF, Langue française 150 (2006), 66–83. Wanner, Leo (ed.), Lexical functions in lexicography and natural language processing, Amsterdam, Benjamins Academic Publishers, 1996.
Sitographie DIACOM-fr : https://dh.dlls.univr.it/it/progetti/patrimonio-linguistico-culturale/#diacom [dernière consultation : 28.12.2021] Le grand dictionnaire terminologique : https://gdt.oqlf.gouv.qc.ca/Resultat.aspx [dernière consultation : 28.12.2021]
Federica Vezzani
Vers une méthodologie pour l’extraction et la classification automatiques des collocations terminologiques verbales en langue médicale Résumé : Cette étude porte sur la description d’une méthodologie efficace pour le développement d’un nouveau système d’apprentissage automatique supervisé pour l’extraction et la classification de « collocations terminologiques verbales » – telles que définies dans Costa/Silva (2004) – de type semi-compositionnel et compositionnel qui se manifestent en langue de spécialité médicale. En particulier, nous décrivons les phases de prétraitement du corpus spécialisé, d’extraction automatique de base (nom) + collocatif (verbe), et de formulation de la vérité terrain pour la classification des collocations terminologiques afin d’entraîner et de valider un système automatique performant pour la langue française et optimisé sur la base du postulat théorique adopté. Mots-clés : collocation terminologique verbale, terminologie médicale, Traitement Automatique des Langues, apprentissage automatique Abstract: This study deals with the description of an efficient methodology for the development of a new supervised machine learning system for the extraction and classification of semi-compositional and compositional « verbal terminological collocations » – as defined in Costa/Silva (2004) – which appear in medical language. In particular, we describe the phases of preprocessing of the specialized corpus, automatic extraction of base (noun) + collocate (verb) and formulation of the ground truth for the classification of terminological collocations in order to train and validate an effective automatic system for the French language, which is optimized on the basis of the adopted theoretical premise. Keywords: verbal terminological collocation, medical terminology, natural language processing, machine learning
https://doi.org/10.1515/9783110749854-013
260
Federica Vezzani
1 Introduction L’étude des unités phraséologiques qui se manifestent dans les langues de spécialité joue un rôle central en terminologie (voir, entre autres, Galinski 1990 ; Rousseau 1993 ; Candel 1995 ; Rosenbaum 2016 ; Tutin/Grossmann 2014 ; Jacques/Tutin 2018). Leur analyse est particulièrement pertinente du point de vue du terminologue, car elle permet d’acquérir les constructions linguistiques typiques d’un secteur de connaissances spécialisées donné et, ensuite, de les décrire au sein de ressources terminographiques mono ou multilingues conçues pour soutenir de multiples activités langagières comme, par exemple, la traduction spécialisée ou la rédaction technique. Dans ce contexte, les approches et les outils de Traitement Automatique des Langues (TAL) contribuent de manière significative à la tâche d’extraction automatique des unités phraséologiques contenues dans les grandes collections de textes spécialisés. À ce propos, le tout récent axe de recherche de la « Phraséologie Computationnelle » rassemble les intérêts de nombreux chercheurs appartenant à des domaines hétérogènes – lexicologie, terminologie, informatique, statistique, etc. – en ce qui concerne l’identification, la sélection et la classification automatiques (ou semi-automatiques) d’unités phraséologiques dans leur sens le plus vaste (Heid 2008 ; Constant et al. 2017 ; Pastor/Mitkov 2019 ; Pastor/Colson 2020). Dans ce panorama, « [o]ne of the key issues of computational phraseology is to find which algorithms are best suited for the automatic or semi-automatic extraction of phrasemes, with possible differences according to the phraseme category » (Pastor/Colson 2020, 4).
À notre avis, ce problème computationnel est un « effet secondaire » strictement dépendant de l’absence d’accord unanime sur les définitions des différentes typologies d’unités phraséologiques. En particulier, en circonscrivant le champ d'investigation au phénomène de la collocation qui fera l'objet d'étude de cet article, Seretan (2011, 131–132) propose une enquête détaillée et classe jusqu’à 21 définitions associées à ce phénomène phraséologique. Nous n’entendons pas nous interroger sur l’interprétation actuellement la plus appropriée, il faut néanmoins considérer que les systèmes automatiques sont entraînés et optimisés selon la prémisse théorique adoptée. Il s’ensuit que les performances des différents systèmes sont largement variables selon la définition retenue et difficilement comparables entre eux en termes de meilleure efficacité. Un autre aspect important à considérer est que la quasi-totalité des études de TAL qui proposent des approches ou des outils pour l’extraction automatique de collocations (tant à partir de corpus général que spécialisé) sont basées sur les propriétés – qui varient selon le théoricien de référence – de cette unité phraséologique telle qu’elle se manifeste dans la langue générale. Dans la lignée des études de Silva et al. (2004), Costa/
Vers une méthodologie pour l’extraction et la classification
261
Silva (2004) et Ramos et al. (2019), nous soutenons plutôt l’idée que pour une identification automatique efficace des collocations qui peuplent les langues de spécialité, il faut distinguer entre la notion de « collocation de langue générale » et de « collocation terminologique » (voir section 2) ayant chacune ses propres spécificités qui doivent être à la base de l’optimisation du processus d’extraction. Cette étude vise donc à proposer une méthodologie pour la conception et l’implémentation d’un nouveau système d’apprentissage automatique supervisé pour l’extraction et la classification de collocations terminologiques à partir d’un corpus spécialisé constitué de textes en français appartenant au domaine médical. En particulier, notre intérêt porte sur les « collocations terminologiques verbales » – le verbe étant de plus en plus central dans les études terminologiques récentes (voir, entre autres, De Vecchi 2021) – telles que définies dans Costa/Silva 2004, Silva et al. (2004) et Ramos et al. (2019). La méthodologie globale proposée comprend quatre étapes : 1) le prétraitement du corpus, 2) la formulation de la « vérité terrain », 3) l’entraînement et 4) la validation du système. Dans cet article, nous nous concentrons sur l’accomplissement de deux premières phases qui constitueront le point de départ pour le développement d’un nouveau système d’extraction et de classification performant sur la base du postulat théorique proposé par les auteures susmentionnées. Par ailleurs, cette étude vise à apporter une contribution en termes de reproductibilité de l’expérimentation menée et de réutilisabilité des données produites qui seront diffusées au format open source. L’organisation de l’article est la suivante. La section 2 introduit la définition de collocation terminologique et ses propriétés syntaxico-sémantiques selon le modèle théorique adopté. La section 3 illustre un aperçu des études qui proposent différentes approches et outils pour l’extraction automatique de collocations à partir de corpus textuels. La section 4 est consacrée à la présentation de la contribution de cet article et comprend : 1) la définition de l’objet d’investigation, à savoir les collocations terminologiques verbales, 2) la description du prétraitement du corpus de textes médicaux spécialisés et 3) la formulation de la « vérité terrain » pour la classification de la compositionnalité sémantique. La section 5 définit, d’un point de vue théorique, la méthodologie que nous adopterons pour l’entraînement, la validation et l’évaluation du système. Dans la section conclusive, nous exposons nos considérations finales et nos perspectives de recherche à moyen et long terme.
262
Federica Vezzani
2 Collocations terminologiques La notion de collocation terminologique découle de la nécessité d'identifier les propriétés du phénomène de la collocation qui se manifeste dans les langues de spécialité afin de marquer une différence avec ce même phénomène apparaissant en langue générale (Silva et al. 2004 ; Costa/Silva 2004, Ramos et al. 2019). En général, la collocation peut être définie comme « [. . .] une association entre morphèmes lexicaux présentant, entre eux, un phénomène d’attraction motivé par un ensemble d’affinités combinatoires » (Silva et al. 2004, 347).
Les deux éléments qui composent la collocation sont nommés par Hausmann (1979) comme base et collocatif et sont liés par une attraction selon laquelle, le collocatif est sélectionné pour exprimer un sens spécifique en fonction de la base donnée (ou mot-clé selon la dénomination de Mel’čuk et al. 1995). En effet, comme l’affirme L’Homme (1998, 516), « le sens d’un des éléments, la base ou le mot clé, demeure inchangé ; en revanche, le collocatif acquiert un nouveau sens au sein du groupement ». Quelques exemples de ce phénomène en langue générale sont rassemblés dans L’Homme (1998) et sont : déception (base) amère (collocatif), éperdument (base) amoureux (collocatif), soulever (collocatif) l'enthousiasme (base). Analysées dans un contexte terminologique, les collocations prennent des spécificités sémantiques et morphosyntaxiques précises. D’un point de vue métaterminologique, la dénomination de « collocation terminologique » a été introduite dans Silva et al. (2004, 352) en tant que néonyme moins porteur d’ambigüité que la dénomination de « combinaison lexicale spécialisée » précédemment introduite par L’Homme (1998). En particulier, la « collocation terminologique » a été définie dans Silva et al. (2004, 352) en tant que regroupement : a) de deux lexèmes (base et collocatif), l’un possédant le statut de terme simple ou complexe et l’autre celui de non-terme (par exemple « optimiser la dose ») ; ou b) de deux lexèmes (base et collocatif), dont les deux peuvent avoir le statut des termes simples ou complexes (par exemple « diagnostiquer des masses pancréatiques »). Les auteures exposent ensuite les spécificités au niveau 1) sémantique, 2) morphosyntaxique, 3) lexicographique/terminographique du phénomène de la collocation qui se manifeste dans la langue générale et dans la langue de spécialité (Silva et al. 2004, 353–354). En particulier, au niveau sémantique, la collocation de langue générale a un sens semi-compositionnel puisque la base A conserve son sens tandis que le collocatif B prend un sens C dans le groupe A+B (voir l’exemple susmentionné de « déception amère »). La collocation terminologique peut avoir et
Vers une méthodologie pour l’extraction et la classification
263
un sens semi-compositionnel (A+B[C])1 et un sens totalement compositionnel (A +B[B])2 à partir de la somme des sens de ses composants. Des exemples de ces deux cas de figure sont fournis par les auteures elles-mêmes et sont, respectivement, « image en anneau » et « image cardiaque ». En outre, la définition de la notion de collocation terminologique permet d'introduire la question relative à la distinction entre l’entité-collocation et l’entitéterme complexe et d'en tracer, au moins théoriquement, les frontières. En effet, alors que le terme complexe se présente comme une unité multilexémique ayant pour fonction de dénommer un et un seul concept (par exemple « néoplasie mammaire »), la totalité de la construction morphosyntaxique qui constitue la collocation terminologique ne renvoie pas à un seul concept et assume donc le statut de non-terme (par exemple « administrer un médicament ») (Silva et al. 2004). À ce propos, Pitar (2020, 94–95) remarque les deux critères suivants faisant la distinction entre ces deux éléments : – le terme complexe est un signifiant qui recouvre un seul signifié, c’est-à-dire une seule notion, tandis que la collocation constitue une combinaison préférentielle d’un terme avec des déterminants ; – le terme appartient au vocabulaire, tandis que la collocation, construite autour d’un terme noyau, appartient surtout au discours. Cependant, comme l’indiquent Silva et al. (2004, 352–353), dans la pratique ces contours sont labiles car le statut de collocation terminologique – quel que soit le type de termes et/ou non-termes qui la composent (verbes, noms, adjectifs ou adverbes) – peut évoluer dans le temps et, si la relation de dépendance entre les deux éléments devient solide, la construction peut prendre le statut de terme complexe (un exemple de ce phénomène fourni par les mêmes auteures est « prendre la fièvre »). Enfin, comme le remarquent Meyer/Mackintosh (1994), L’Homme/Jia (2015) et L’Homme (2017) ce problème est particulièrement évident pour les groupes composés d’un terme modifié par un adjectif ou un syntagme prépositionnel (par exemple « logiciel de modélisation »), ouvrant ainsi une série de défis considérables pour l'accomplissement de la tâche d’extraction automatique.
Avec la forme graphique B[C] nous nous référons au collocatif B qui prend un sens C dans le groupe A+B. Avec la forme graphique B[B] nous nous référons au collocatif B qui maintient son sens B dans le groupe A+B.
264
Federica Vezzani
3 Extraction (semi-)automatique des collocations : approches et outils Dans la littérature, il existe de nombreuses méthodes pour extraire automatiquement des collocations à partir de corpus. En général, les systèmes automatiques reposent sur trois grandes familles d’approches : statistiques, linguistiques et hybrides (Seretan 2011). L’enquête de Kolesnikova (2016) illustre un panorama exhaustif des stratégies adoptées dans les systèmes de TAL pour mesurer la force d’attraction entre deux unités linguistiques qui constituent potentiellement les deux éléments clés caractérisant la collocation, à savoir la base et le collocatif. Les mesures dites d’association (ou de cohésion) reposent sur 1) des formules statistiques, telles que Log-likelihood (Dunning 1993), Mutual Information (Church/Hanks 1990), T-score (Church et al. 1991) etc., 2) des méthodes basées sur des règles formulées ad hoc sur les spécificités de chaque langue et 3) la combinaison des deux méthodes précédentes afin de bénéficier des avantages découlant des deux stratégies. Comme nous l’avons décrit dans l’introduction, les performances des systèmes d’extraction automatique sont fortement dépendantes du postulat théorique adopté. Par exemple, en prenant comme point de départ la théorie Sens-Texte dans le cadre de la Lexicologie Explicative et Combinatoire (Mel’čuk et al. 1995), des études récentes proposent des systèmes d’identification et de classification automatiques des collocations à partir des fonctions lexicales (Mel’čuk 1996). En ce sens, l’étude d’Anke et al. (2019) introduit le nouveau jeu de données Lex-FunC dans lequel les collocations sont catégorisées selon les fonctions lexicales et présente des expériences afin d’évaluer les meilleures représentations vectorielles pour la classification des collocations. Les résultats obtenus prouvent qu’à l’heure actuelle la classification par fonctions lexicales pose de plus grands défis que les représentations vectorielles syntaxiques et sémantiques traditionnelles utilisées en littérature. Toujours dans cette optique, l’étude de Kolesnikova et al. (2020) illustre des expériences afin d’identifier automatiquement les fonctions lexicales verbales en appliquant des techniques d’apprentissage automatique supervisé sur un ensemble de données de collocations verbe-nom en espagnol. Les auteurs ont testé 68 algorithmes d’apprentissage supervisé et évalué leurs performances sur la détection automatique de fonctions lexicales en obtenant de meilleurs résultats que l’état de l’art en termes de précision et de rappel. Les études illustrées jusqu’à présent se concentrent sur le processus d’extraction de collocations à partir de corpus de langue générale. Si l’on regarde les études menées sur des corpus spécialisés représentatifs d’une langue de spécialité donnée, nous pouvons constater qu’un des principaux problèmes qui se pose est la difficulté de distinguer automatiquement entre collocations et termes complexes. Comme
Vers une méthodologie pour l’extraction et la classification
265
nous l’avons mentionné auparavant, ce problème largement connu dans la littérature constitue un défi de longue date pour les terminologues car l’identification manuelle des frontières entre l’entité-terme et l’entité-collocation est une tâche difficile qui varie considérablement selon l’interprétation donnée. L’automatisation de ce processus rend le défi encore plus insidieux. Parmi les principales contributions en ce sens figurent les travaux de Maniez qui visent à proposer des modèles d’acquisition (semi-) automatique pour la classification des « candidats termes » et des « candidates collocations » (à collocatif adjectival et verbal) à partir de corpus spécialisés pour le domaine médical (Maniez 2001 ; 2002a ; 2002b). Un autre aspect important à considérer en ce sens est introduit dans l’étude de Roche/Prince (2008) et concerne la notion de « pertinence » des collocations. Les auteurs évaluent que, bien que du point de vue syntaxique l’extraction – dans leur cas – des syntagmes nominaux soit a priori compatible avec la définition de Mel’čuk de base et collocatif, du point de vue sémantique et pragmatique ces candidates collocations doivent être validées par une forme de pertinence. Or, cette dernière est totalement dépendante de la tâche à réaliser, de la situation en vigueur, du genre textuel et du domaine considéré. La variabilité de la pertinence constitue donc une valeur à prendre en considération dans l’évaluation des systèmes d’extraction automatique. La contribution récente de L’Homme/Azoulay (2020) s’inscrit dans cette perspective en présentant une analyse comparative du comportement collocationnel de 15 items lexicaux analysés dans un corpus général et un corpus spécialisé sur le thème de l’environnement. En particulier, les items lexicaux sélectionnés sont des noms alors que les collocatifs sont de type verbal, adjectival et nominal. Dans ce contexte, l’étude montre que les corpus ont un impact significatif sur la tâche d’identification automatique des collocations et pourraient influencer ce que les lexicographes et les terminologues considèrent comme des collocations pertinentes. Nous concluons cet aperçu par la présentation de quelques outils spécifiquement conçus et mis à la disposition pour l’extraction de collocations à partir de corpus spécialisés. En particulier, l’étude de Seretan et al. (2004) décrit un outil d’extraction de collocations à collocatif nominal, adjectival et verbal conçu en tant qu’aide à la traduction spécialisée et qui peut être intégré dans un environnement de traduction réel. L’outil Colex présenté par Orliac (2006) est plutôt un système hybride d’extraction des collocations conçu afin d’extraire les collocations de type verbe + nom à partir de corpus spécialisés et basé sur trois relations grammaticales modélisées par les « fonctions lexicales verbales » (Orliac 2006, 269) : sujet + verbe, verbe + premier complément et verbe + deuxième complément. Un autre outil est TermeX (Delač et al. 2009), basé sur l’utilisation de mesures d’association lexicale pour extraire automatiquement les collocations de tout type. Il offre à l’utilisateur une variété de mesures d’association parmi lesquelles choisir, ainsi que la possibilité de sélectionner manuellement les collocations les plus pertinentes parmi celles
266
Federica Vezzani
extraites automatiquement. Enfin, bien qu’ils n’aient pas été spécifiquement conçus pour l’extraction de collocations, des outils tels que TermoStat (Drouin 2003), BiTermEx (Planas 2012), TermEvaluator (Inkpen 2016) et Sketch Engine (Kilgarriff et al. 2014) offrent de nombreuses fonctionnalités qui permettent d’obtenir des listes de combinaisons lexicales récurrentes qui se prêtent à une validation manuelle par le terminologue quant à leur statut de termes et/ou de collocations pertinents pour l’objet d’étude.
4 Conception et implémentation du système d’apprentissage automatique supervisé La méthodologie proposée dans cette contribution constitue le point de départ pour la conception et l’implémentation d’un nouveau système d’apprentissage automatique supervisé pour l’extraction et la classification efficace de « collocations terminologiques » telles que définies dans la section 2 de cet article. En particulier, notre intérêt est tourné vers les collocations terminologiques à collocatif verbal telles que déterminées dans Costa/Silva (2004) et Ramos et al. (2019) qui se manifestent dans des textes médicaux (voir sous-section 4.1) et qui sont constituées : 1. d’une base A de type nominal ayant le statut de terme (simple ou complexe) spécialisé dans le domaine médical dont le sens demeure inchangé ; et 2. d’un collocatif B de type verbal ayant le statut de terme (simple ou complexe) spécialisé ou de non-terme de langue générale pouvant acquérir un sens B[C] ou conserver son sens B[B] originel. L’enquête que nous présentons porte donc sur les collocations terminologiques verbales semi-compositionnelles A+B[C] et compositionnelles A+B[B]. D’un point de vue syntaxique, les deux éléments peuvent être liés par les relations grammaticales suivantes : 1) sujet A + verbe B[C] ou B[B], 2) verbe B[C] ou B[B] + complément d’objet direct (COD) A, et 3) verbe B[C] ou B[B] + complément d’objet indirect (COI) A. Afin de décrire le développement du futur système, les deux sections suivantes seront consacrées à la description des phases de prétraitement du corpus et de formulation de la « vérité terrain » servant à jeter les bases des processus d’entraînement et de validation du système.
Vers une méthodologie pour l’extraction et la classification
267
4.1 Prétraitement du corpus spécialisé Une fois l’objet d’investigation défini, nous décrivons dans ces paragraphes la méthodologie de mise en forme du corpus à partir duquel le système d’apprentissage automatique supervisé sera entraîné et validé. La première phase de notre pipeline porte sur le prétraitement de la collection de textes et implique la démarche méthodologique suivante : [1] Collection des textes [2] Tokenisation [3] Lemmatisation [4] Étiquetage morphosyntaxique [5] Analyse des dépendances [6] Isolement de la base nominale [7] Extraction de candidats collocatifs verbaux Les textes qui composent notre corpus ont été extraits à partir du Manuel MSD disponible en ligne.3 Cette ressource rassemble des articles de nature médicale sur des sujets hétérogènes et constitue une source de référence à la fois pour la consultation de connaissances spécialisées par des médecins experts et pour la vulgarisation de ces connaissances à un public non expert (Bullers 2016). Dans une perspective de variation diastratique de la langue, le manuel permet la consultation de deux versions d’un même sujet médical rédigées, d’un côté, pour les professionnels de santé et, de l’autre, pour le grand public afin d’en faciliter la compréhension. De plus, la quasi-totalité des articles est disponible en 11 langues différentes. À partir de cette ressource, nous avons extrait toutes les pages HTML des articles en français – les sujets médicaux étant classés par ordre alphabétique de A à Z – destinés aux professionnels de santé. L’extraction des pages a été menée de manière semi-automatique grâce à l’utilisation du paquet rvest4 du langage de programmation R. La collection téléchargée comprend un ensemble de 9.102 documents pour un total de 9.636.383 occurrences. Par la suite, sur la base de l’approche R Tidyverse,5 nous avons procédé aux phases d’importation [1], de tokenisation [2], de lemmatisation [3], d’étiquetage morphosyntaxique [4], et d’analyse des dépendances [5], en utilisant le paquet udpipe6 pour l’annotation du texte. Ce paquet fait
https://www.msdmanuals.com/fr/accueil. https://cran.r-project.org/web/packages/udpipe/index.html. https://www.tidyverse.org. https://cran.r-project.org/web/packages/udpipe/index.html.
268
Federica Vezzani
partie du projet Universal Dependencies (UD)7 et permet de choisir, pour chaque langue, différents systèmes d’annotation entraînés sur des corpus spécifiquement sélectionnés. Dans cette expérimentation, nous avons choisi le modèle français Sequoia8 entraîné également sur des collections de documents de l’Agence européenne des médicaments (Popa-Fabre et al. 2020). Le Tableau 1 résume un extrait de texte annoté via le pipeline adopté et illustre la sortie de UDpipe en format tabulaire où chaque ligne correspond à l’annotation d’un jeton spécifique. Tableau 1 : Exemple de sortie de l’annotateur UDpipe.
Token
Lemma
Upos
Un abcès est une poche de pus provoquée ...
un abcès être un poche de pus provoquer ...
DET NOUN AUX DET NOUN ADP NOUN VERB ...
Head_token_id ...
Dep_rel det nsubj cop det root case nmod acl ...
Après avoir collecté et annoté le corpus spécialisé, nous avons exploré les deux dernières étapes de la démarche proposée pour la phase de prétraitement, à savoir l’isolement de la base nominale [6] et l’extraction de candidats collocatifs verbaux [7]. L’extraction des termes médicaux de type nominal constituant la base des candidates collocations terminologiques a été réalisée grâce au thésaurus Medical Subject Headings (MeSH)9 qui a joué le rôle de ressource centrale pour la cartographie des termes contenus dans le corpus préalablement constitué. MeSH est un vocabulaire contrôlé de la National Library of Medicine (NLM)10 des États-Unis et il est généralement utilisé par la NLM pour indexer et cataloguer les articles biomédicaux de la base de données PubMed11 de manière uniforme et cohérente afin de soutenir la recherche d’informations dans le domaine médical (Coletti et al. 2001). La version française du vocabulaire MeSH est fournie gratuitement par l’Institut national de la santé et de la recherche médicale (INSERM) et
https://universaldependencies.org. https://deep-sequoia.inria.fr. https://meshb.nlm.nih.gov/search. https://www.nlm.nih.gov. https://pubmed.ncbi.nlm.nih.gov.
Vers une méthodologie pour l’extraction et la classification
269
comprend au total 122.819 termes simples et complexes.12 Pour cette première étude, nous nous sommes concentrés sur l’extraction des termes MeSH simples contenus dans notre corpus et, sur la base de la fonction Term frequency – Inverse Document Frequency TF-IDF (Salton/Yang 1973), nous avons extrait un total de 11.908 termes médicaux de type nominal. Les termes sont classés sur la base de la moyenne entre les fréquences d’occurrences dans les documents et le nombre de documents de la collection dans lesquels les occurrences apparaissent. De cette liste, nous avons extrait automatiquement les verbes associés aux termes grâce à l’analyse de dépendance réalisée précédemment avec UDpipe. Pour chaque terme simple MeSH, nous avons récupéré les occurrences étiquetées nsubj, obj, et iobj – respectivement sujet, COD et COI – et extrait le verbe qui, dans l’arbre syntaxique, est associé au terme. Ce pipeline nous a permis d’extraire les bases et les candidats collocatifs qui font l’objet de l’annotation sémantique manuelle suivante.
4.2 Formulation de la « vérité terrain » Dans l’apprentissage supervisé, un système automatique apprend à effectuer sa tâche de manière optimale (extraction, classification, etc.) à travers un entraînement basé sur des données soigneusement étiquetées et jugées véridiques selon la tâche à accomplir. En ce sens, la deuxième phase de la méthodologie proposée ici comprend la formulation de la « vérité terrain » (Søgaard et al. 2014) qui constituera le modèle sur lequel le futur système d’apprentissage automatique supervisé sera entraîné pour l’extraction et la classification des collocations terminologiques à collocatif verbal. À partir des données extraites dans la phase de prétraitement du texte (noms et verbes), nous basons leur annotation sur la notion de compositionnalité du sens de la candidate collocation. Comme nous l’avons décrit précédemment, la compositionnalité d’une collocation terminologique est dictée par le collocatif qui peut varier de sens (B[C]) – collocation semi-compositionnelle – ou conserver son sens usuel (B[B]) – collocation compositionnelle – tout en restant le sens de la base A inchangé. À cet égard, nous proposons une annotation manuelle des verbes associés aux termes médicaux extraits en termes de variation de sens. Reprenant la notion de « pertinence » introduite dans la section 2 (Roche/Prince 2008), notre objectif est de marquer comme : – « pertinents » les verbes qui changent de sens B[C], – « non-pertinents » les verbes qui gardent leur sens B[B].
http://mesh.inserm.fr/FrenchMesh/.
270
Federica Vezzani
Or, afin de définir une méthodologie rigoureuse pour l’annotation de la « pertinence », il est d’abord nécessaire de s’interroger sur ce que l’on entend par variation de sens du collocatif. Reprenant l’affirmation selon laquelle « le sens d’un des éléments, la base ou le mot clé, demeure inchangé ; en revanche, le collocatif acquiert un nouveau sens au sein du groupement » (L’Homme 1998, 516), nous nous demandons par rapport à quoi le sens de la base demeure inchangé et par rapport à quoi le collocatif acquiert un nouveau sens. Les deux questions sont au cœur des deux cas de figure de collocation terminologique dans lesquels, alors que la base A reste inchangée, le collocatif peut à la fois prendre un nouveau sens et conserver son sens originel. À cet égard, pour définir un critère procédural clair pour l’annotation de la variation de sens du collocatif, nous nous appuyons sur la convention suivante : « [. . .] it is a lexicographic convention that the most frequent and therefore typical sense is given the highest rank in the list of senses and is put first in the dictionary entry » (Gelbukh/Kolesnikova 2012, 62). Tous les verbes extraits – ayant le statut de termes ou de non-termes – font donc l’objet d’une analyse manuelle minutieuse afin de vérifier si le sens exprimé par rapport à la base nominale – ayant le statut de terme simple – occupe la première place dans les ressources lexicographiques pour la langue française. En particulier, si le sens du collocatif B exprimé en fonction de la base A correspond à la première définition répertoriée dans la ressource lexicographique (B[B]), la collocation sera étiquetée comme compositionnelle ; tandis que si le sens du collocatif B exprimé en fonction de la base A correspond à une définition qui se positionne à un niveau inférieur de la liste13 (B[C]), la collocation sera étiquetée comme semi-compositionnelle. Afin de garantir une certaine cohérence sur le jugement de pertinence, notre démarche repose sur la consultation croisée de deux ressources lexicographiques disponibles en ligne, respectivement Le Robert14 et Le Larousse.15 De cette façon, nous comparons les données des deux sources en ce qui concerne la position des définitions (sens) associées au collocatif verbal. Le choix de s'appuyer sur des ressources lexicographiques – et non terminographiques – découle de la volonté d'identifier tous les sens attribués au terme analysé et pas seulement le sens spécifique que ce terme peut avoir dans la langue de spécialité étudiée. En ce sens, consulter une ressource terminographique risquerait de nous faire perdre les informations relatives à toutes les définitions qui, de manière transversale, peuvent être associées au terme quel que soit le domaine de travail. Par « niveau inférieur » nous entendons toutes les définitions qui se placent après la première de la liste. https://dictionnaire.lerobert.com. https://www.larousse.fr.
Vers une méthodologie pour l’extraction et la classification
271
Les travaux d’étiquetage sont en cours et l’ensemble des annotations sera librement mis à la disposition sur la plateforme GitHub16 pour permettre la réutilisation de ces données. Le Tableau 2 illustre un extrait du processus d’annotation des verbes les plus fréquemment associés à trois termes médicaux contenus dans le corpus : « médicament », « chirurgie » et « maladie ». Tableau 2 : Formulation de la vérité terrain. Nom (N)
Verbe (V)
Pertinence – Sens (V)
Type de collocation
médicament médicament médicament chirurgie chirurgie maladie maladie maladie maladie
administrer prescrire prendre subir réaliser contracter dépister traiter enrayer
pertinent – B[C] non-pertinent – B[B] pertinent – B[C] pertinent – B[C] non-pertinent – B[B] pertinent – B[C] pertinent – B[C] pertinent – B[C] pertinent – B[C]
semi-compositionnelle compositionnelle semi-compositionnelle semi-compositionnelle compositionnelle semi-compositionnelle semi-compositionnelle semi-compositionnelle semi-compositionnelle
Tous les termes de type nominal de ce tableau – première colonne – jouent le rôle d’obj (COD) par rapport aux verbes extraits de la deuxième colonne. La troisième colonne contient le jugement de pertinence basé sur la variation (B[C]) ou non-variation (B[B]) du sens du collocatif, telle qu’identifiée à partir des deux ressources précitées. Cette annotation permet de classer, dans la quatrième colonne, le type de collocation terminologique verbale comme semi-compositionnelle ou entièrement compositionnelle conformément au postulat théorique adopté.
5 Entraînement, validation et évaluation du système La collection des données annotées résultant du processus précédent constitue donc la vérité terrain sur laquelle s’appuieront l’entraînement et la validation du futur système d’apprentissage supervisé. Dans cette section, nous présentons la méthodologie que nous adopterons une fois la formulation de la vérité terrain terminée. En particulier, les prochaines étapes de notre démarche portent sur :
https://github.com/gmdn.
272
1. 2. 3.
Federica Vezzani
la représentation mathématique des collocations ; le choix du modèle de classification à entraîner ; la validation de ses performances.
Tout d’abord, nous évaluerons la forme mathématique la plus appropriée pour la représentation des collocations terminologiques verbales sur la base de l’état de l’art actuel. En général, cette représentation est performée au moyen de vecteurs numériques qui sont utilisés dans un espace vectoriel pour calculer les « distances » entre les unités linguistiques : l’hypothèse est que plus les vecteurs représentant ces unités dans cet espace sont proches, plus leurs sens seront proches en langue naturelle. Les valeurs de ces vecteurs peuvent changer en fonction de l’approche statistique choisie, par exemple binaire (1 ou 0) ou TF-IDF, ou en fonction de l’entraînement basé sur une approche neuronale, par exemple à travers la méthode des « plongements de mots » afin de capturer de façon optimale la cooccurrence d’unités linguistiques dans des contextes similaires (Manning/Schutze 1999). La deuxième étape concerne le choix du modèle de classification supervisé qui sera utilisé pour prédire l’étiquette d’une collocation. Dans notre cas, nous utiliserons l’étiquette « positif » pour les collocations terminologiques verbales semi-compositionnelles et l’étiquette « négatif » pour les collocations terminologiques verbales compositionnelles. Loin d’entrer dans les détails des différents types de méthodes et d’algorithmes, l’idée principale est que, étant donné un ensemble de données étiqueté, un modèle supervisé est entraîné sur un sousensemble de cet ensemble de données pour apprendre les caractéristiques d’une classe d’objets (dans notre cas les caractéristiques des deux classes de collocations terminologiques verbales semi-compositionnelles et compositionnelles) sur la base de leurs représentations vectorielles. Par exemple, dans Kolesnikova/Gelbukh (2020), les auteurs ont entraîné, sur la base de 50 % de l’ensemble de données disponibles, six classificateurs différents, tels que les « machines à vecteurs de support », le « perceptron multicouche », les « k plus proches voisins », l’« arbre de décision », les « forêts aléatoires » et « Ada Boost ». En termes de reproductibilité de cette expérience, l’un de nos objectifs futurs est d’évaluer lequel parmi ces modèles est le plus performant pour la classification de notre objet d’étude. Dans la troisième étape, la partie restante de l’ensemble de données sera ensuite utilisée pour valider les performances du système de classification. En général, étant donné un classificateur binaire, c’est-à-dire un classificateur qui prédit si une collocation est soit semi-compositionnelle soit compositionnelle, la sortie peut être 1) correcte si la prédiction correspond à la vraie étiquette (la vérité terrain) de l’objet – par exemple « vrais positifs » ou « vrais négatifs » respectivement pour les collocations qui appartiennent à la classe semi-compositionnelle ou à la classe compositionnelle – ou 2) incorrecte lorsque la prédiction ne corres-
Vers une méthodologie pour l’extraction et la classification
273
pond pas à la vraie étiquette (« faux négatifs » ou « faux positifs »). Par exemple, nous aurons un « faux négatif » lorsque nous attribuons l’étiquette « négatif » à une collocation terminologique verbale semi-compositionnelle, alors que nous aurons un « faux positif » lorsque nous attribuons l’étiquette « positif » à une collocation terminologique verbale compositionnelle. Ces quatre valeurs – « vrai positif », « vrai négatif », « faux négatif », « faux positif » – sont combinées de différentes manières pour former la base de l’évaluation et de la comparaison des différents classificateurs. Dans l’étude de Kolesnikova/Gelbukh (2020), 50% de l’ensemble des données qui restent est utilisé pour tester les performances des classificateurs à l’aide de quatre mesures d’évaluation : le rappel, la précision, le F1 et l’exactitude. Dans ce cas également, nous prendrons ces mesures d’évaluation pour tester la performance de notre système de classification supervisé. Il faut préciser que, dans la toute récente littérature (Kolesnikova/Gelbukh 2020 ; Shwartz/Dagan 2019 ; Anke et al. 2021), ces trois étapes sont généralement performées pour la tâche de classification des fonctions lexicales de type verbenom à partir de grands corpus de langue générale. En ce sens, notre travail se distingue de ces études en ce que la méthodologie proposée ici vise plutôt à apporter une contribution en termes de classification de la compositionnalité sémantique des collocations terminologiques verbales qui se manifestent en langue de spécialité médicale. De plus, la description détaillée de cette méthodologie vise à apporter une contribution en termes de reproductibilité de l’expérimentation et de réutilisabilité de la collecte de données annotées qui sera mise à la disposition au format open source.
6 Conclusions et perspectives Cette étude est consacrée à la description du cadre méthodologique pour la conception et l’implémentation d’un système d’apprentissage supervisé pour l’extraction et la classification automatiques de collocations terminologiques verbales semi-compositionnelles et compositionnelles. En particulier, après avoir défini notre objet d’investigation, nous avons décrit les phases de prétraitement du texte et de formulation de la vérité terrain pour l’étiquetage des données sur lesquelles s’appuieront l’entraînement et la validation du futur système. Bien que ce dernier processus soit toujours en cours, nous pouvons avancer quelques considérations préliminaires en termes d’efficacité de la performance du système. Tout d’abord, nous soulignons sa dépendance à l’égard 1) du postulat théorique adopté, 2) de la langue d’étude et 3) de la langue de spécialité analysée. Le système sera en effet à considérer comme – plus ou moins – performant selon la définition re-
274
Federica Vezzani
tenue de collocation terminologique verbale (Silva et al. 2004) qui se manifeste en langue de spécialité médicale française ayant un haut niveau de spécialisation. Par conséquent, l’entraînement et la validation d’un système automatique avec des prémisses théoriques différentes nécessitera un ensemble de données étiquetées différemment conformément à ces mêmes postulats théoriques. En ce qui concerne nos perspectives à moyen terme, nous entendons achever la phase de formulation de la vérité terrain non seulement en considérant les collocatifs associés aux termes simples cartographiés par le thésaurus MeSH mais aussi en intégrant les collocatifs associés aux termes complexes constituant la base de la collocation terminologique et ayant le rôle de sujet, COD et COI. De plus, au sein du jeu de données annoté, nous prévoyons également l’intégration d’informations relatives à la fonction lexicale exprimée par le collocatif verbal en fonction de sa base nominale. Enfin, après le développement du système soigneusement entraîné et validé (section 4), nous visons à mener des expérimentations à long terme afin de le tester en termes de variation diastratique de la langue médicale. En particulier, nous nous intéressons à comparer le phénomène de la collocation terminologique verbale qui se manifeste dans les textes médicaux destinés aux experts et dans les textes médicaux destinés aux non-experts en utilisant comme corpus de validation la collection d’articles offerte par le manuel MSD à l’usage du grand public.
Bibliographie Anke, Luis Espinosa/Codina-Filbá, Joan/Wanner, Leo, Evaluating language models for the retrieval and categorization of lexical collocations, in : Merlo, Paola/Tiedemann, Jorg/Tsarfaty, Reut (edd.), Proceedings of the 16th conference of the European chapter of the association for computational linguistics. Main volume, Association for Computational Linguistics, 2021, 1406–1417, DOI: 10.18653/v1/2021.eacl-main.120. Anke, Luis Espinosa/Schockaert, Steven/Wanner, Leo, Collocation classification with unsupervised relation vectors, in : Korhonen, Anna/Traum, David/Màrquez, Lluís (edd.), Proceedings of the 57th annual meeting of the association for computational linguistics, Association for Computational Linguistics, 2019, 5765–5772, DOI: 10.18653/v1/P19-1576. Bullers, Krystal, Merck manuals, Journal of the medical library association 104:4 (2016), 369–371, DOI: 10.3163/1536-5050.104.4.028. Candel, Danielle, Locutions en langues de spécialité, Cahiers du français contemporain 2 (1995), 151–173. Church, Kenneth/Hanks, Patrick, Word association norms, mutual information, and lexicography, Computational linguistics 16:1 (1990), 22–29. Church, Kenneth/Gale, William/Hanks, Patrick/Hindle, Donald, Using statistics in lexical analysis, in : Zernik, Uri (ed.), Lexical acquisition. Exploiting on-line resources to build a lexicon, Hillsdale (NJ), Lawrence Erlbaum, 1991, 115–164.
Vers une méthodologie pour l’extraction et la classification
275
Coletti, Margaret H./Bleich, Howard L., Medical subject headings used to search the biomedical literature, Journal of the American medical informatics association 8:4 (2001), 317–323. Constant, Matthieu/Eryiğit, Gülsen/Monti, Johanna/van Der Plas, Lonneke/Ramisch, Carlos/Rosner, Michael/Todirascu, Amalia, Multiword expression processing. A survey, Computational linguistics 43:4 (2017), 837–892. Costa, Rute/ Silva,Raquel, The verb in the terminological collocations. Contribution to the development of a morphological analyser. MorphoCom, in : Lino, Maria Teresa/ Xavier,Maria Francisca/ Ferreira, Fátima/ Costa,Rute/ Silva,Raquel (edd.), Proceedings of the fourth international conference on language resources and evaluation (LREC’04), European Language Resources Association (ELRA), 2004, 1531–1534, http://www.lrec-conf.org/proceedings/lrec2004/pdf/795.pdf [dernière consultation : 25.01.2022]. Delač, Davor/ Krleza,Zoran/ Snajder,Jan/Dalbelo Basic, Bojana/ Saric,Frane, TermeX. A tool for collocation extraction, in : Gelbukh, Alexander (ed.), Computational linguistics and intelligent text processing, Berlin/ Heidelberg,Springer, 2009, 149–157. De Vecchi, Dardo, D’une terminologie de quoi à une terminologie de et pour qui? Le rôle des verbes en entreprise, in : Delavigne, Valérie/De Vecchi, Dard (edd.), Termes en discours. Entreprises et organisations, Paris, Presses Sorbonne Nouvelle, 2021, 69–82. Drouin, Patrick, Term extraction using non-technical corpora as a point of leverage, Terminology 9:1 (2003), 99–115. Dunning, Ted E., Accurate methods for the statistics of surprise and coincidence, Computational linguistics 19:1 (1993), 61–74. Galinski, Christian, Terminology and phraseology, Terminology science and research 1 (1990), 70–86. Gelbukh, Alexander/Kolesnikova, Olga, Semantic analysis of verbal collocations with lexical functions, Berlin/Heidelberg, Springer, 2013. Jacques, Marie-Paule/Tutin, Agnès (edd.), Lexique transversal et formules discursives des sciences humaines, Londres, ISTE Éditions, 2018. Hausmann, Franz Josef, Un dictionnaire des collocations est-il possible?, Travaux de linguistique et de littérature Strasbourg 17:1 (1979), 187–195. Heid, Ulrich, Computational phraseology. An overview, in : Granger, Sylviane/ Meunier,Fanny (edd.), Phraseology. An interdisciplinary perspective, Amsterdam/ Philadelphia,John Benjamins Publishing, 2008, 337–360. Inkpen, Diana/Paribakht, Sima T./Faez, Farahnaz/Amjadian, Ehsan, Term evaluator. A tool for terminology annotation and evaluation, International journal of computational linguistics and applications, 7:2 (2016), 145–165. Kilgarriff, Adam/ Baisa,Vít/ Bušta,Jan/ Jakubíček,Miloš/ Kovář,Vojtěch/ Michelfeit,Jan/ Rychlý,Pavel/ Suchomel,Vít, The Sketch Engine. Ten years on, Lexicography 1 (2014), 7–36. Kolesnikova, Olga, Survey of word co-occurrence measures for collocation detection, Computación y sistemas 20:3 (2016), 327–344. Kolesnikova, Olga/Gelbukh, Alexander, A study of lexical function detection with word2vec and supervised machine learning, Journal of intelligent & fuzzy systems 39:2 (2020), 1993–2001. Kolesnikova, Olga/ Gelbukh,Alexander/Chanona Hernández, Liliana, Automatic detection of semantic classes of verb-noun collocations, Computación y sistemas 24:1 (2020), 141–150. L’Homme, Marie-Claude, Caractérisation des combinaisons lexicales spécialisées par rapport aux collocations de langue générale, in : Fontenelle, Thierry/Hiligsmann, Philippe/Michiels, Archibald/ Moulin, André/Theissen, Siegfried (edd.), EURALEX’98 Proceedings. Papers submitted to the eighth EURALEX international congress on lexicography in Liège, Belgium, Liège, University of Liège, 1998, 513–522.
276
Federica Vezzani
L'Homme, Marie-Claude/Jia, Zhichao, Classement des combinaisons lexicales spécialisées à base nominale dans un dictionnaire d’informatique, Cahiers de lexicologie 106 (2015), 229–251. L’Homme, Marie-Claude, Combinatoire spécialisée. Trois perspectives et des enseignements pour la terminologie, TTR. Traduction, terminologie, rédaction 30:1–2 (2017), 215–241. L’Homme, Marie-Claude/Azoulay, Daphnée, Collecting collocations from general and specialised corpora, in : Pastor, Gloria Corpas/Colson, Jean-Pierre (edd.), Computational phraseology, Amsterdam/Philadelphia, John Benjamins, 2020, 151–175. Maniez, François, Extraction d’une phraséologie bilingue en langue de spécialité. Corpus parallèles et corpus comparables, Meta. Journal des traducteurs/Meta. Translators’ journal 46:3 (2001), 552–563. Maniez, François, Distinguer les termes des collocations. Étude sur corpus du patron « adjectif–nom » en anglais médical, in : Pierrel, Jean-Marie (ed.), Actes de la 9ème conférence sur le Traitement Automatique des Langues Naturelles. Posters, Nancy, ATALA, 2002, 344–349 (=2002a). Maniez, François, Un modèle d’extraction des collocations en langue de spécialité, ASp. la revue du GERAS 35–36 (2002), 35–47 (=2002b). Manning, Christopher/Schutze, Hinrich, Foundations of statistical natural language processing, Cambridge (MA), MIT press, 1999. Mel’čuk, Igor A, Lexical functions. A tool for the description of lexical relations in a lexicon, in : Wanner, Leo (ed.), Lexical functions in lexicography and natural language processing, Amsterdam/ Philadelphia, John Benjamins, 1996, 37–102. Mel’čuk, Igor A./Clas, André/Polguère, Alain, Introduction à la lexicologie explicative et combinatoire, Louvain-la-Neuve, Duculot, 1995. Meyer, Ingrid/Mackintosh, Kristen, Phraseme analysis and concept analysis. Exploring a symbiotic relationship in the specialized lexicon, in : Martin, Willy/Meijs, Willem/Moerland, Margreet/ten Pas, Elsemiek/van Sterkenburg, Piet (edd.), EURALEX’94 Proceedings. Papers submitted to the 6th EURALEX international congress on lexicography in Amsterdam, The Netherlands, Amsterdam, Vrije Universiteit, 1994, 339–348. Orliac, Brigitte, Colex. un outil d’extraction de collocations spécialisées basé sur les fonctions lexicales, Terminology 12:2 (2006), 261–280. Pastor, Gloria Corpas/Mitkov, Ruslan (edd), Computational and corpus-based phraseology. Third international conference. Europhras 2019. Malaga, Spain, September 25–27, 2019, proceedings, Cham, Springer Nature, 2019. Pastor, Gloria Corpas/Colson,Jean-Pierre (edd.), Computational Phraseology, Amsterdam/ Philadelphia, John Benjamins, 2020. Pitar, Mariana, Sur la cohésion interne des termes complexes, Buletinul stiintific al universitatii politehnica din Timisoara, Seria limbi moderne 19 (2020), 92–103. Planas, Emmanuel, BiTermEx. Un prototype d’extraction de mots composés à partir de documents comparables via la méthode compositionnelle, in : Antoniadis, Georges/Blanchon, Hervé/Sérasset, Gilles (edd.), Proceedings of the joint conference JEP-TALN-RECITAL 2012, vol. 2, Grenoble, ATALA/ AFCP, 2012, 415–422. Popa-Fabre, Murielle/Ortiz Suárez, Pedro Javier/Sagot, Benoît/De la Clergerie, Éric, French contextualized word-embeddings with a sip of CaBeRnet. A new French balanced reference corpus, in : Bański, Piotr/Barbaresi, Adrien/Clematide, Simon/Kupietz, Marc/Lüngen, Harald/Pisetta, Ines (edd.), Proceedings of the 8th workshop on challenges in the management of large corpora, European Language Ressources Association, 2020, 15–23, https://aclanthology.org/2020.cmlc-1. 3 [dernière consultation : 25.01.2022].
Vers une méthodologie pour l’extraction et la classification
277
Ramos, Margarida/ Costa,Costa/ Roche,Christophe, Dealing with specialised co-text in text mining. Verbal terminological collocations, in : Brune, Catherine/ Roche,Christophe (edd.), TOTh 2019. Terminologie & ontologie. Théories et Applications, Chambéry, Presses Universitaires Savoie Mont Blanc, 2019, 339–362. Roche, Mathieu/Prince, Violaine, Evaluation et détermination de la pertinence pour des syntagmes candidats à la collocation, in : Heiden, Serge/Pincemin, Bénédicte (edd.) JADT’08. Journées internationales d'analyse statistique des données textuelles, Lyon, Presses universitaires de Lyon, 2008, 1009–1020. Rosenbaum Franková, Lucia (2016), Phrasèmes spécialisés dans les textes économiques, Cahiers de lexicologie 108 (2016), 43–57. Rousseau, Louis-Jean, Terminologie et phraséologie, deux composantes indissociables des langues de spécialités, Terminologies nouvelles 10 (1993), 9–12. Salton, Gerard/ Yang,Chung-Shu, On the specification of term values in automatic indexing, Journal of documentation 29:4 (1973), 351–372. Seretan, Violeta, Syntax-based collocation extraction, Dordrecht, Springer Science & Business Media, 2011. Seretan, Violeta/Nerima, Luka/Wehrli, Eric, A tool for multi-word collocation extraction and visualization in multilingual corpora, in : Williams, Geoffrey/Vessier, Sandra (edd.), Proceedings of the 11th EURALEX international congress, Lorient, Université de Bretagne-Sud, Faculté des lettres et des sciences humaines, 2004, 755–766. Shwartz, Vered/ Dagan,Ido, Still a pain in the neck. Evaluating text representations on lexical composition, Transactions of the Association For Computational Linguistics 7 (2019), 403–419. Silva, Raquel/Costa, Rute/Ferreira, Fátima, Entre langue générale et langue de spécialité une question de collocations, Études de linguistique appliquée 3 (2004), 347–359. Søgaard, Anders/ Planl,Barbara/ Hovy,Dirk, Selection bias, label bias, and bias in ground truth, in : Liu, Qun/ Xia,Fei (edd.), Proceedings of COLING 2014. 25th international conference on computational linguistics. Tutorial abstracts, Dublin City University/Association for Computational Linguistics, 2014, 11–13, https://aclanthology.org/C14-3005.pdf [dernière consultation : 25.01.2022]. Tutin, Agnès/Grossmann, Francis (edd.), L'écrit scientifique. Du lexique au discours. Autour de Scientext, Rennes, Presse universitaire de Rennes, 2014.
Nicoletta Armentano
Traits définitoires et configurations actantielles dans la fiche terminologique DIACOM-fr Une étude de cas dans le domaine du commerce international Résumé : Nous consacrons cette étude aux traits définitoires et aux configurations actantielles contenues dans la fiche terminologique élaborée dans le cadre du projet DIACOM-fr, mené au sein du projet d’envergure Les humanités numériques appliquées aux langues et littératures étrangères du Département des langues et littératures étrangères de l’Université de Vérone. Il s’agit d’offrir un témoignage du travail terminographique en cours sur les unités phraséologiques de type locution en langue de spécialité. Ce travail est présenté dans ses aspects plus opérationnels, concrets et applicatifs, dans l’objectif de combler une lacune dans la littérature scientifique qui accorde souvent plus d’importance aux aspects théoriques liés aux produits terminographiques. Pour ce faire, nous mettons premièrement l’accent sur l’écart existant entre théorie et pratique dans la rédaction d’une fiche ; deuxièmement, nous présentons le corpus et la fiche en question ; troisièmement, nous définissons notre approche pour la description terminographique des phrasèmes (notamment des locutions), et qui est essentiellement basée sur le modèle avancé par la LEC (Lexicologie explicative et combinatoire). Enfin, nous explicitons – précisément à partir d’une étude de cas axée sur les termes complexes relevant du domaine du commerce international –, d’une part, notre méthodologie ; de l’autre, les problématiques (et leur résolution) émergeant de la compilation des composantes conceptuelles de fiches destinées à alimenter notre ressource terminologique en libre accès. Mots-clés : fiche terminologique, termes complexes de type locution, définition, structure actantielle, corpus numérique du commerce international Abstract: This study is devoted to the defining characteristics and actantial configurations contained in the term record developed as part of the DIACOM-fr project, carried out as part of the Digital humanities applied to foreign languages and literatures project of the Department of Foreign Languages and Literatures of the University of Verona. The goal is to offer an account of ongoing terminographic work on phraseological units of the idioms type in specialized languages. This work is presented in its most operational, concrete and applied aspects, in order to fill a gap in the scholarly literature that often places more emphasis on the
https://doi.org/10.1515/9783110749854-014
280
Nicoletta Armentano
theoretical aspects related to terminographic products. To do so, we first point out the gap between theory and practice in the writing of a record ; second, we present the corpus and the record in question ; third, we define our approach to the terminographic description of idioms, which is essentially based on the model proposed by ECL (Explanatory and Combinatorial Lexicology). Finally, we explain – precisely on the basis of a case study focusing on complex terms in the field of international trade – on the one hand, our methodology ; on the other, the problems (and their resolution) that emerge from the compilation of the conceptual components of the records intended to be part of our open access terminological network. Keywords: term record, complex idioms, definition, actantial structure, digital corpus of international trade
Introduction Outil de travail incontestable et but (ainsi que les glossaires et/ou les dictionnaires techniques) de l’activité terminographique (et de la lexicographie spécialisée), la fiche terminologique est tout d’abord l’unité de base – puisque fonciers sont les renseignements sur les termes recensés – de toute démarche de formalisation du lexique, et notamment des lexiques spécialisés. L’objectif étant, en général, la compréhension sur le plan technique, la désignation exacte des nouveaux termes et l’appréhension des liens entre référents, notions et ces désignations. Si Rondeau parle de la fiche terminologique comme du « dossier d’une notion » (Rondeau 1983, 82) en raison de son univocité et Boutin-Quesnel la décrit comme un « support sur lequel sont consignées, selon un protocole établi, les données terminologiques relatives à une notion » (Boutin-Quesnel 1985, 28), Dubuc – pour sa part – définit la fiche comme un véritable document signalétique permettant de faire état d’un terme (cf. Dubuc 2002, 81). Pavel/Nolet observent, quant à eux, que « [l]a fiche terminologique est un outil de synthèse et de systématisation des données. Les principaux critères de la rédaction d’une fiche étant la validité, la concision, l’actualité et la complémentarité des données » (Pavel/Nolet 2002, 48). Instrument d’explication et de communication, donc, la fiche permet la bonne compréhension et la valorisation des termes et de leur usage quelle que soit la nature du travail terminologique : plutôt normative comme dans l’approche adoptée par les institutions de normalisation (AFNOR, DIN, ON et ISO, pour n’en citer que quelques-unes), se chargeant, par ailleurs, de la fixation des règles et des principes méthodologiques du travail terminologique ; ou descriptive, comme
Traits définitoires et configurations actantielles dans la fiche terminologique
281
c’est le cas de la terminologie orientée vers la traduction, laquelle se donne plutôt des critères pragmatiques et a, de ce fait, une nature plus opérationnelle. Si la nature de la fiche, sa finalité et ses spécificités se dégagent assez aisément, comme le démontrent les propos tenus par les auteurs cités plus haut, la conception et la rédaction d’une fiche, comme d’ailleurs l’analyse d’un terme, sont en revanche loin d’être des tâches anodines et sans entraves pour le terminologue qui s’y consacre. Pour préciser notre point de vue, pensons à la phase de conception car c’est proprement dès la désignation des rubriques qui composent la fiche que la tâche s’annonce de taille. Il faut, bel et bien, s’emparer des principes théoriques et méthodologiques préconisés dans les ouvrages théoriques, les manuels et les traités de terminologie ; entretenir un dialogue constant avec les modèles de fiches canoniques reconnus par les experts en terminologie ; adapter, enfin, la fiche aux utilisateurs, à la langue et aux différents domaines de spécialité. À ce propos, il importe de rappeler que la terminologie est, en effet, axée sur les usagers – linguistes, traducteurs, grand public – et sur leurs besoins réels (cf. Dubuc 2002) ce qui impose un travail, à faire en amont de la rédaction, d’explicitation des critères servant aux choix des propriétés à insérer dans la fiche (cf. section 3, Bonadonna/Frassi 2022). Par ailleurs, cela conditionne l’approche à privilégier et, comme indiqué auparavant, la prise en compte des variantes, des expansions et/ou des ajouts des champs. En parlant alors des transformations à opérer, on en vient à la phase de rédaction véritable de la fiche, c’est-à-dire, au cœur même du travail terminographique. Nous croyons que c’est précisément à ce moment que la tâche de tout rédacteur se complique davantage et que l’écart entre théorie et pratique devient flagrant. Le terminologue, pour commencer, systématise les contenus dans une langue de spécialité sans pour autant être un « expert du domaine dont il doit décrire les termes » (L’Homme/San Martín 2016, 145). Il est aussi tenu au respect des droits d’auteur (pensons, notamment, aux définitions d’ouvrages de référence citées dans les fiches car faisant autorité), tout en devant vigiler sur la cohérence stylistique des fiches, sur la maîtrise des règles régissant la mise en forme des données afin d’assurer la qualité et l’uniformité rédactionnelle. De surcroît, signalons que même la description de l’usage des termes et, donc, l’indication des renseignements d’ordre (con)textuel, témoignent d’un effort de sa part. Le terme – c’est notoire – est toujours identifié en contexte car « [p]our la terminologie, un terme n’existe pas hors de son domaine d’application » (Dubuc 2002, 35). En raison de cela, rendre compte des différentes situations concrètes d’emploi des termes (ce qui est particulièrement utile aux traducteurs, par exemple) représente, pour le terminologue, une autre tâche à accomplir sans, pour autant, négliger la nécessité de veiller à ce que la fiche ne soit pas surchargée
282
Nicoletta Armentano
devenant, dès lors, difficile à déchiffrer. Et même lorsqu’il se retrouve à remplir des champs assez standard – correspondant dans la plupart des cas aux données linguistiques (concernant le terme qui tient lieu d’entrée) ou aux données de gestion (portant essentiellement sur la date de création de la fiche, le nom du rédacteur, etc.) ou encore aux notes (techniques et/ou linguistiques recueillant des informations diverses, voire hétérogènes) –, il peut parfois arriver que la nature des informations insérées dans la fiche trahisse la double finalité de toute fiche terminologique : assurer la compréhension du concept et faciliter l’emploi du terme désignant le concept (cf. Francœur 2015). Ce qui nous amène à dire, une fois de plus, que la compilation d’une fiche terminologique s’avère être, en pratique, un travail bien plus complexe qu’elle ne l’est dans la littérature scientifique traitant de cette question. Nous arrivons, ainsi, au sens de ces notes préliminaires et donc à la visée de notre contribution. Dans le présent article, nous nous proposons de rendre compte de la démarche concrète du terminologue aux prises avec la rédaction d’une fiche terminologique. Nous nous attarderons sur sa méthode de travail et sur sa manière de faire face aux difficultés en avançant aussi des hypothèses pour leur résolution. Pour ce faire, nous nous focaliserons sur la rédaction des composantes sémantiques de la fiche, à savoir la définition et la structure actantielle, par le biais d’une étude de cas axée sur un échantillon de termes appartenant au domaine du commerce international ; domaine auquel s’intéresse le projet DIACOM. Ces termes ont été extraits du corpus DIACOM-fr – qui tire son nom du projet éponyme et porte donc sur la langue française – récemment établi au sein de l’Université de Vérone dans le cadre d’un projet d’envergure quinquennal portant sur les humanités numériques. Dans les pages qui suivent, consacrées à l’illustration d’un travail en cours, nous allons tout d’abord présenter notre terrain d’application, notamment le projet DIACOM, le corpus DIACOM-fr et la fiche terminologique spécifiquement créée pour les besoins du projet. Nous poserons, par la suite, le cadre théorique concernant les deux rubriques de la fiche prises en examen. Puis, nous passerons à l’exposition de notre méthode de travail qui consiste principalement dans l’identification d’un terme simple et de tous les termes complexes de type locution formés à partir de celui-ci, pour ensuite passer à la compilation des fiches. Suivront, enfin, une étude de cas et des remarques conclusives. Le but général sera d’appréhender sur le vif le travail du terminologue par le biais d’une application de son activité terminographique aux phrasèmes. Au demeurant, ce sera aussi l’occasion pour revenir sur certains aspects théoriques (et conceptuels) repérés dans les travaux antérieurs afin de combler quelques lacunes et offrir de nouvelles pistes de réflexion.
Traits définitoires et configurations actantielles dans la fiche terminologique
283
1 Un projet d’envergure, un corpus diachronique, une fiche terminologique ad hoc Tel qu’annoncé, regardons de près le projet DIACOM, le corpus DIACOM-fr et la fiche terminologique élaborée dans le cadre du projet. Le projet DIACOM (auquel nous participons) – qui est à son tour un des sousprojets du Projet d’Excellence portant sur Les humanités numériques appliquées aux langues et littératures étrangères (2018–2022) et conçu au sein du Département de Langues et Littératures étrangères de l’Université de Vérone – vise la constitution (et l’interrogation) de deux corpus, l’un en français (DIACOM-fr) et l’autre en espagnol (DIACOM-es), axés sur la terminologie du commerce international. Plus précisément, le projet DIACOM se propose de recenser les propriétés synchroniques et diachroniques des unités terminologiques de base, autrement dit, des termes les plus courants (selon un critère de fréquence) du domaine d’intérêt. Dans ce sens, DIACOM a l’ambition d’étudier les termes relatifs à un domaine spécifique (et à ses sous-domaines) et d’en observer le fonctionnement en contexte. Comme le précise Frassi dans sa contribution consacrée à la présentation de la méthodologie terminographique à la base du projet, « en conjuguant enfin des disciplines telles que la terminologie, la linguistique de corpus et la linguistique informatique on dépasserait le clivage synchronique dominant depuis l’apparition des toutes premières bases de données terminologiques » (Frassi 2021, 24). En plus de combler cette évidente lacune théorique, le projet DIACOM se propose aussi un résultat concret qui consiste dans la réalisation d’une base de données de type réseau lexical. Cette base de données, qui s’appuie sur un modèle intuitif, permettra, entre autres, la libre consultation des fiches terminologiques créées par l’équipe de recherche1. Pour ce qui est plus précisément des unités terminologiques extraites, il importe de préciser qu’elles n’auront pas la même représentation au sein de la base de données. Certains aspects des termes (notamment, la définition et la structure actantielle) trouveront leur place uniquement dans la fiche terminologique, tandis que d’autres aspects feront l’objet d’une représentation « sous forme de Le projet se propose aussi d’élaborer des ressources pédagogiques destinées à l’enseignement/apprentissage du lexique en langue de spécialité et/ou aux étudiants en terminologie et terminographie, et aux traducteurs. À ce propos, nous signalons la proposition et l’exploitation de corpus avancées par Alipour (2018). Pour ce qui est, plus précisément, de l’importance des connaissances métalinguistiques pour l’enseignement/apprentissage des unités phraséologiques, nous invitons à la lecture des réflexions théorico-applicatives de Cavalla/Labre (2009), Frassi (2018), Bonadonna/Zollo (2019) et Calvi (2021).
284
Nicoletta Armentano
graphe lexical dans lequel chaque nœud correspond à un terme simple ou à un terme complexe et affichant les liens syntagmatiques et paradigmatiques entre entités terminologiques » (Frassi 2021, 27). L’équipe DIACOM se propose, encore, d’analyser les phénomènes terminologiques et phraséologiques observables à partir des termes extraits (semi-automatiquement) du corpus. Une clarification complémentaire concerne les aspects informatiques à la base de notre ressource, ce qui permettra d’en préciser le champ d’action. En effet, « notre ressource terminologique sera créée selon les meilleures pratiques du semantic web et des semantic data. Ce choix permettra de créer un lien avec d’autres ressources linguistiques (par exemple Linguistic Linked Open Data), une interrogation plus flexible de la base de données et de toutes les informations qu’elle contient ainsi que la représentation des types divers d’entités terminologiques » (Frassi 2021, 43). Nous n’allons pas présenter le corpus constitué au sein du projet, pour lequel nous renvoyons à l’article de Calvi, Drouin et Frassi dans le présent ouvrage ; nous passons directement aux aspects saillants de la fiche terminologique, qui est pour nous l’occasion de faire le point sur des aspects ponctuels relatifs aux définitions et aux structures actantielles en cours de rédaction. Or, comme il se doit pour toute fiche terminologique, même celle élaborée dans le cadre du projet DIACOM-fr ne fait que réunir, en les organisant, les informations sur les termes tant du point de vue de la dénomination que de celui de la conceptualisation. Le contenu de chaque fiche est ainsi reparti dans des champs distincts correspondant à « autant de catégories de données ou d’éléments apportant, pour chaque terme vedette, un type d’information spécifique » (Gouadec 1990, 38). Rappelons, en passant, qu’une donnée terminologique est alors toute « donnée qui précise une notion et le terme qui la désigne » (Boutin-Quesnel 1985, 26). La fiche DIACOM-fr est divisée en huit macro-sections selon les propriétés de l’entité terminologique (vocable et lexie) que l’on se propose de prendre en examen. À présent, et avant de passer à l’illustration des différentes rubriques, précisons que la collecte des données pour l’élaboration des fiches se fait sur une feuille de calcul, organisée en fonction des différentes propriétés sémantiques et formelles que nous nous proposons de valoriser. Une fois la collecte complétée, un travail de conversion du contenu de la feuille en format RDF (Resource Description Framework) sera entamé. Il s’agit là d’un outil de base proposé par le W3C (Consortium World Wide Web) pour coder, échanger et réutiliser des métadonnées structurées. Cet outil permettra, dans cette direction, l’interopérabilité sémantique entre des applications partageant des informations sur le Web. Quant à sa structure, ce modèle de données se compose de ressources, propriétés et valeurs. Chaque déclaration – qui représente donc l’unité de base pour la représentation de l’information en for-
Traits définitoires et configurations actantielles dans la fiche terminologique
285
mat RDF – se présente, enfin, sous la forme d’un triplet du type sujet (une ressource) – prédicat (une propriété) – objet (une valeur). Pour revenir aux propriétés de la fiche, observons que les propriétés diachroniques inaugurent la fiche. Pour le terminographe, la compilation de cette macrosection revient à valoriser le critère temporel utilisé dans la constitution du corpus. Le terme est alors mis en exergue par rapport à la période la plus récente de son apparition – « l’époque contemporaine prime sur les deux autres » (Frassi 2021, 42) – pour ensuite être étudié, d’un point de vue formel et sémantique, sur la base des liens qu’il tisse avec les deux époques plus anciennes. C’est à nouveau Frassi qui précise la démarche : « [n]ous considérons, en effet, le lien diachronique comme un lien orienté, allant de l’époque la plus ancienne à l’époque plus récente. C’est pour cette raison que le comportement d’une unité terminologique au fil des trois périodes est tracé grâce à la valorisation des propriétés diachroniques dans les fiches terminologiques des deux périodes antérieures » (Frassi 2021, 32). Explicitons, d’ailleurs, que la modélisation des différents liens permettant d’analyser, et de noter sur la fiche, la variation en diachronie nous vient des études sur la terminologie diachronique et spécialement des travaux de Condamines, Rebeyrolle et Soubeille (2004), auxquels ont été ajoutées deux nouvelles typologies. Cette première rubrique est suivie par celle portant sur les propriétés thématiques qui, comme il est évident, permettent de préciser les divers sous-domaines caractérisant notre corpus : « [l]’indication du domaine [et/ou du sous-domaine, comme dans notre cas] contribue à la description et à la délimitation du concept. Cette indication constitue un élément définitoire, bien qu’elle figure en dehors de la définition » (Vézina 2009, 3). Conséquemment, par la compilation de cette rubrique, il devient possible de situer le concept à l’intérieur de son réseau conceptuel, bien qu’il ne donne qu’une « première approximation du sens du terme étudié [en précisant] le champ d’utilisation » (Boutin-Quesnel 1985, 20). Passant à la rubrique qui regroupe les propriétés interlinguistiques du termevedette, elle permet de porter l’attention sur les équivalents italien et anglais de l’unité terminologique française. En revanche, la rubrique consacrée aux aspects morphosyntaxiques des unités terminologiques extraites du corpus affiche la partie du discours, le genre, la structure et le nombre d’éléments qui composent essentiellement les termes complexes de type locution. Quant aux aspects paradigmatiques et syntagmatiques des termes, ils permettent aux usagers de se renseigner sur les différents liens que le terme entretien avec d’autres termes (ou avec les unités lexicales) pour l'identification desquels nous utiliserons les fonctions lexicales telles qu'elles sont conçues par la Lexicologie Explicative et Combinatoire (Mel’čuk 1996 ; 2007 ; 2015). Par la suite, ce genre de données deviendra accessible sous forme de réseau terminologique en ligne.
286
Nicoletta Armentano
Pour ce qui est encore des propriétés pragmatiques qu’il est possible d’inférer à partir des citations tirées du corpus DIACOM-fr, elles montrent le contexte d'emploi. En outre, notre fiche permet aussi de repérer ce qu’on a convenu d’appeler les propriétés didactiques des unités terminologiques extraites. Ces propriétés offriront aux usagers de notre base de données des précisions à propos des niveaux d’apprentissage et des niveaux de compétence (élémentaire, intermédiaire et avancé) envisagés pour chaque entrée terminologique (Bonadonna/Frassi 2022). Le but, dans ce cas, sera d’offrir des bases pour imaginer une progression didactique dans l’enseignement des unités phraséologiques de type locution. À la fin de ce tour d’horizon, nous en arrivons aux propriétés conceptuelles de la fiche – définition et structure actantielle – qui sont au cœur de cet article et de notre étude de cas. Avant d’en préciser les contours par le biais de leur contextualisation dans le cadre théorique de référence qui est le nôtre, nous nous permettons de compléter cette présentation de la fiche DIACOM-fr en proposant une liste synoptique ; ce qui rendra, à notre avis, plus tangible la structure et l'organisation de notre produit terminographique. Structure de la fiche DIACOM-fr I. Vocable et unité lexicale II. Propriétés diachroniques (période/lien avec les autres tranches – 4 typologies) : a) identité de forme et de sens b) expansion (variation) de forme et de sens c) élision (variation de forme et identité de sens) d) variation de sens et identité de forme III. Propriétés thématiques (sous-domaine) IV. Propriétés interlinguistiques : a) équivalent en italien b) équivalent en anglais V. Propriétés morphosyntaxiques : a) partie du discours b) type de locution > catégorie sémantique, structure syntaxique, nombre d’éléments de la locution VI. Propriétés didactiques (niveau d’apprentissage/niveau de compétence) VII. Propriétés conceptuelles : a) définition b) structure actancielle VIII. Propriétés pragmatiques (contextes) IX. Propriétés paradigmatiques et syntagmatiques :
Traits définitoires et configurations actantielles dans la fiche terminologique
a) b) c) d)
287
fonctions lexicales paradigmatiques fonctions lexicales syntagmatiques collocations locutions formées à partir du terme
2 Des composantes pertinentes : autour de la définition et de la structure actantielle Un rapide état des lieux des réflexions théoriques portant sur la définition et la structure actantielle s’impose. L’idée est de retracer, même si brièvement, les lignes directrices et les approches de la littérature scientifique des dernières décennies, de même que de préciser le créneau dans lequel nous allons situer notre application pratique et notre proposition méthodologique. Pour commencer, la pièce maîtresse de toute fiche terminologique est sans doute la définition2. De manière générale, une définition en terminologie consiste en une explication du sens du terme dans le domaine de spécialité. Selon Dubuc, une définition doit tout d’abord donner « une image mentale exacte » (Dubuc 2002, 95) de la notion. Pour Boutin-Quesnel elle doit aussi permettre « de la différencier des autres notions à l’intérieur d’un système notionnel » (Boutin-Quesnel 1985, 27). C’est, notamment, par l’énumération de ses « traits pertinents » (Rousseau 1994) ou de ses « traits essentiels » (Dubuc 2002), que la définition répond à cette dernière prérogative. Il importe, pareillement, de rappeler qu’il existe différents types de définitions3 appelés, selon les auteurs, définition par genre prochain et différences spécifiques – qui offre l’avantage de la brièveté en ramenant une notion justement à ses éléments essentiels –, définition par compréhension – « privilégiée tant en ter-
En revanche, pour un approfondissement des énoncés définitoires en discours repérés à partir du corpus DIACOM-fr, nous renvoyons à l’article de Bonadonna (2021). Nous rappelons que « [b]ien qu’il existe plusieurs types de définitions, certains d’entre eux ne sont que très rarement utilisés dans la pratique terminologique. C’est notamment le cas de la définition par extension, qui consiste à définir un concept au moyen d’une simple énumération de ses concepts spécifiques ou partitifs (par exemple, espèce menacée : Espèce en danger notable, espèce en danger ou espèce vulnérable). C’est également le cas des définitions qui se fondent essentiellement sur des relations linguistiques pour expliciter le sens d’un terme (comme la définition métalinguistique et la définition morphosémantique). Ces définitions ne sont généralement utilisées en terminologie que pour définir des termes de certaines catégories grammaticales, comme les adjectifs, une classe de mots nettement plus rare en terminologie que les substantifs » (Vézina 2009, 7).
288
Nicoletta Armentano
minologie qu’en lexicographie » (Vézina 2009, 5) bien qu’« elle subi[sse] toutes sortes de tortures en terminologie » (Bejoint 1993, 25) –, définition logique et définition en intention. Cependant, nombre de définitions figurant dans les bases de terminologie (ou dans les répertoires papiers) sont en fait une combinaison des typologies proposées (cf. Rey 1992), sans que cela signifie pour autant qu’elles ne remplissent pas leur rôle. Or, disons-le sans hésitation, la définition est la rubrique la plus difficile à remplir – « la tâche la plus ardue que doit accomplir le terminologue » (L’Homme/San Martín 2016, 145) – car elle doit répondre à différentes contraintes, spécialement selon la langue de rédaction (cf. Vézina 2009). Chaque rédacteur est amené à faire des choix sur plusieurs plans : le domaine, le définisseur initial, la structure, l’inclusion d’éléments nécessaires à éviter les ambiguïtés et aussi tenir compte de l’ensemble des concepts qui représentent l’entourage du terme à définir. En outre, « [p]endant des décennies, la littérature scientifique portant sur la définition terminologique s’est principalement focalisée sur ses aspects théoriques. La plupart de ces travaux n’ont pas eu d’application réelles dans la tâche que représente la rédaction d’une définition » (L’Homme/San Martín 2016, 146). Les travaux antérieurs se sont en effet bornés soit à la description de la vocation de la définition, soit à la caractérisation de la démarche conduisant à la définition terminologique en opposition à la définition. Quant aux recommandations de type pratique (Cabré 1993) qui ont quand même vu le jour, celles-ci n’ont cependant pas avancé des solutions pour la résolution des problèmes émergeant lors de la préparation d’une définition. Quelques pistes méthodologiques se proposant de standardiser les définitions apparaissent à partir des années 1990 et c’est précisément L’Homme qui ouvre la voie. Avec Sager, elle avance un modèle à sept champs qui permet d’encoder les composantes généralement repérables dans la définition (notamment, dans les définitions analytiques). D’autres propositions, arrivées par la suite, ont amélioré cette proposition. Pensons au modèle basé sur les matrices définitoires ou au modèle s’appuyant sur les matrices de comparaison conceptuelle (cf. L’Homme/San Martín 2016). Des développements ultérieurs (et des applications à des domaines spécifiques) de ces derniers modèles ont aussi été avancés. Pensons, par exemple, à la proposition élaborée par Seppälä (2015) à partir des modèles relationnels de l’ontologie de haut niveau (Spear 2006), qui a l’avantage de permettre la sélection de traits définitoires déterminés par la classe ontologique du concept servant ainsi de guide dans la rédaction d’une définition. Quant à nos définitions, elles ne se focalisent pas, comme les précédentes, sur les relations conceptuelles ou de classe. Elles sont essentiellement de type analytique permettant aussi, dans la mesure du possible, une automatisation du processus rédactionnel.
Traits définitoires et configurations actantielles dans la fiche terminologique
289
Quant à la structure actantielle, elle est à notre avis la deuxième rubrique la plus difficile à remplir après la définition. Puisqu’il n’y a pas de règles explicites pour l’identifier, en phase de rédaction, le terminologue avance par hypothèses qui sont confirmées ou abandonnées au fur et à mesure que la compilation des autres rubriques de la fiche permet d’avancer dans la description des contours du terme. Dans ce sens, les contextes d’emploi observables grâce au corpus représentent un support précieux pour l’identification des actants. Or, on l’aura sans doute compris à la suite de cette dernière affirmation, nous nous rattachons au modèle théorique de la LEC, branche lexicale de la Théorie Sens-Texte (Mel’čuk/Polguère 1995 ; Mel’čuk 2013), pour qui la structure actantielle est un élément central permettant de refléter de manière formelle le sens de l’unité lexicale (pour nous, de l’unité terminologique). Comme l’affirment Mel’čuk et Polguère « [l]e sens de la grande majorité des lexies ne peut être clairement compris, et donc décrit, sans prendre en compte les participants des situations que ces lexies désignent » (Mel’čuk/Polguère 2007, 24). On appelle ces « participants » des actants sémantiques. Ces actants sémantiques, dépendants des lexies et « prévu[s] par [leur] définition » (Mel’čuk 1997, 17), sont des participants obligatoires contribuant au sens. Dans cette direction, un actant sémantique d’une lexie, dans une structure sémantique donnée, est un sémantème qui remplit une position actancielle sémantique associée à la lexie dans le lexique. Cette position actantielle sémantique, associée à une lexie dans le lexique, sera représentée par le biais d’une variable sémantique (X, Y, Z…) qui remplira deux conditions : – correspondre à un participant de la situation dénotée par la lexie (perspective conceptuelle) ; – être exprimable dans la phrase sous le contrôle syntaxique de la lexie (perspective syntaxique). La structure actancielle prendra alors en compte tous les actants sémantiques d’un terme ainsi que les liens qu’ils entretiennent avec lui, ce qui rendra davantage explicites les actants sémantiques en permettant d'attribuer une structure plus logique à la définition. Rappelons aussi que la forme propositionnelle (que ce soit une expression linéaire, comme celle que nous avons privilégiée, ou un réseau sémantique) désignera la représentation de notre structure actantielle. Nous précisons, au passage, que nos définitions ne sont pas calquées sur les structures actantielles des différents termes vedettes : ces deux rubriques de notre fiche gardent une certaine autonomie de rédaction l’une par rapport à l’autre. Et puisqu’il est question de la démarche adoptée pour la rédaction de ces deux champs, passons à sa description plus détaillée.
290
Nicoletta Armentano
3 L’échantillon et la démarche Aux fins de notre étude, nous avons constitué un échantillon de quatorze termes (résultat de l'extraction semi-automatique à partir du corpus DIACOM-fr), dont un seul terme simple et treize termes complexes de type locution, relevant du sousdomaine de la politique commerciale. Nous avons commencé par isoler le terme simple transaction – qui apparaît dans la période la plus récente du corpus (avec une fréquence de 1464 occurrences) – et les termes complexes de type locution formés à partir du terme simple cité. Nous les énumérons en suivant un critère alphabétique : transaction bancaire, transaction commerciale, transaction commerciale électronique, transaction courante, transaction de référence, transaction électronique, transaction financière, transaction immobilière, transaction interbancaire, transaction interentreprises, transaction internationale, transaction invisible et transaction transfrontière. Quant à la systématisation typologique de ces unités phraséologiques de type locution, nous précisons qu’il s’agit de douze locutions faibles et d’une locution semi-compositionnelle (i.e. transaction invisible). Un autre aspect sur lequel il convient aussitôt d’attirer l’attention – et qui relève plutôt de l’approche méthodologique caractérisant le projet dans son intégralité – concerne ce que l’on pourrait appeler le parti pris du sous-domaine. En effet, nous avons décidé de ne pas suivre un ordre alphabétique dans la compilation des fiches terminologiques mais plutôt une rédaction qui procède par sous-domaines en partant du terme simple comme modèle. Cela signifie que lors de la rédaction des définitions et des structurelles actantielles de tous les termes complexes, c’est toujours de la formulation choisie et adoptée pour le terme simple que nous sommes partis pour ensuite remplir les mêmes rubriques pour les locutions. En d’autres mots, notre noyau-dur est représenté par l’unité terminologique de base qui constitue le degré zéro pour la rédaction des définitions et des structures actantielles des locutions. Ce choix méthodologique révèle clairement notre postulat selon lequel, comme pour toutes les langues naturelles, le terme complexe hérite des propriétés du terme simple. Nous précisons que la distinction entre terme simple et terme complexe nous vient du classement avancé par Mel’čuk (2013) pour la langue générale et qui peut également s’appliquer aux langues de spécialité (Frassi 2020 ; Frassi 2022). Or en terminologie, les termes complexes de type locution4 sont pour la plupart des locutions faibles simples (cf. Frassi 2020, 50–51) et donc complètement
Précisons que « ce qu’on a coutume de désigner en terminologie et en terminographie comme terme complexe coïncide pour nous avec un type spécifique d’unité phraséologique, à savoir la locution » (Bonadonna/Frassi 2022).
Traits définitoires et configurations actantielles dans la fiche terminologique
291
transparentes ; ce qui rend d’autant plus vrai notre postulat. Toutefois, ce postulat sera mis à l'épreuve par la pratique terminographique. Venons-en enfin aux supports que nous avons utilisés pour remplir les champs de notre fiche : nous avons tout d’abord consulté le GDT, la base de données Termium Plus et des glossaires (tel que Kantox). Dans le cadre des références bibliographiques répertoriées en phase de conception du projet DIACOM, nous avons aussi consulté des ouvrages terminographiques (cf. Massabié-François/Poulain 2002 ; Morelle 2003) pour parfaire la rédaction de la définition. Nous ajoutons à cela que les termes sur lesquels nous nous pencherons dans notre étude de cas (cf. section 4) seront regroupés en quatre cas de figure, en relation au degré de difficulté rencontré en phase de rédaction des définitions et des structures actantielles.
4 Le cas de transaction : du terme simple aux termes complexes et retour La méthodologie adoptée pour notre étude de cas prend donc comme point de départ le terme simple transaction, dont nous allons aussitôt présenter la définition, la structure actantielle et le détail des fonctions lexicales se réalisant sur l’axe paradigmatique. Un exemple de contexte d’emploi tiré du corpus DIACOM-fr rendra, enfin, notre démarche plus probante. Comme déjà précisé dans la section 3, nous allons toujours repartir de la définition et de la structure actantielle de notre terme simple pour élaborer celles des termes complexes. Dans la mesure du possible, nous offrirons aussi une schématisation de ce qui vient d’être annoncé. Cela permettra, à notre avis, de consulter plus facilement les rubriques des fiches terminologiques que nous traitons dans le cadre de cet article. Nous allons néanmoins faire des commentaires sur les traits plus saillants des termes analysés. Commençons précisément avec le schéma de transaction. – transaction
292
Nicoletta Armentano
Période : transaction_α, transaction_β Définition : ‘Opération commerciale ou boursière entre au moins deux parties-prenantes réglementée par un accord’ Structure actantielle : ‘Opération commerciale effectuée entre X et Y à propos de Z, réglementée par un accord V en contrepartie de W’ Fonctions lexicales paradigmatiques : X = nom d’agent [S] = acteur commercial Y = nom de patient [S] = acteur commercial Z = ASyntP III [S] = bien/service V = ASyntP IV [S] = contrat W = ASyntP V [S] = engagement Contexte DIACOM-fr : « Les transactions relatives aux transports effectuées par le Canada avec les autres pays se sont à peu près équilibrées pour les années étudiées »
4.1 Premier cas de de figure Prenons maintenant en considération notre premier cas de figure, à savoir, les termes complexes dont les fiches n’ont pas posé de difficultés en phase de compilation. C’est le cas de transaction immobilière, transaction bancaire, transaction interbancaire et transaction interentreprises. Or, pour le premier et le dernier de ces termes complexes il ne semble pas y avoir d’éléments particulièrement saillants à signaler en plus de ceux qui figurent dans les tableaux ci-dessous : – transaction immobilière Période : transaction immobilière_α Définition : ‘Opération commerciale qui a trait à l'achat et à la vente d'un immeuble’ Structure actantielle : ‘Opération commerciale entre X et Y concernant l'achat de Z en contrepartie de V à la suite de la signature de W’ Fonctions lexicales paradigmatiques : X = nom d’agent [S] = vendeur Y = nom de patient [S] = acheteur Z = ASyntP III [S] = immeuble, propriété V = ASyntP IV [S] = somme d’argent, argent W = ASyntP V [S] = contrat de vente, promesse d’achat ou de vente Contexte DIACOM-fr : « S’il est constant que les professionnels de l’immobilier interviennent en amont des transactions immobilières, ils disposent cependant d’un nombre conséquent d’informations de nature à les éclairer sur la licéité des opérations »
Traits définitoires et configurations actantielles dans la fiche terminologique
–
293
transaction interentreprises
Période : transaction interentreprises_α Définition : ‘Opération commerciale ou boursière entre deux parties-prenantes, réglementée par un accord et qui concerne deux entreprises’ Structure actantielle : ‘Opération commerciale effectuée entre les entreprises X et Y à propos de Z, réglementée par un accord V en contrepartie de W’ Fonctions lexicales paradigmatiques : X = nom d’agent [S] = entreprise Y = nom de patient [S] = entreprise Z = ASyntP III [S] = bien/service V = ASyntP IV [S] = accord W = ASyntP V [S] = engagement Contexte DIACOM-fr : « Tendances : dans les prochaines années, la part des entreprises réalisant des ventes en ligne devrait augmenter, surtout avec le développement des échanges électroniques entre les entreprises, mais aussi avec l’équipement croissant des ménages en connexion à l’internet haut debit »
Pour en venir aux deux autres termes, nous les illustrons conjointement (d’où un seul tableau) pour souligner les avantages dérivant de notre démarche. – transaction bancaire et transaction interbancaire Période : transaction bancaire_α Définition transaction bancaire : ‘Opération bancaire ou financière réalisée entre agents économiques qui consiste dans le transfert ou envoi d'argent d'un compte à un autre’ Structure actantielle transaction bancaire : ‘Opération bancaire ou financière entre X et Y qui consiste dans l'envoi d'une somme Z d'un compte V à un compte W’ Fonctions lexicales paradigmatiques de transaction bancaire : X = nom d’agent [S] = émetteur Y = nom de patient [S] = porteur, client Z = ASyntP III [S] = somme d’argent V = ASyntP IV [S] = accepteur W = ASyntP V [S] = acquéreur Nom de lieu [Sloc] = banque
Période : transaction interbancaire_α Définition transaction interbancaire : ‘Opération entre deux établissements bancaires ou de crédit, réglementé par un contrat et concernant un échange de liquidité, avec ou sans garanties’ Structure actantielle transaction interbancaire : ‘Opération entre les deux banques X et Y, qui consiste dans le transfert d'une somme Z et réglementée par V’ Fonctions lexicales paradigmatiques de transaction interbancaire : X = nom d’agent [S] = banque prêteuse Y = nom de patient [S] = banque emprunteuse Z = ASyntP III [S] = somme d’argent V = ASyntP IV [S] = accord W = ASyntP V [S] = --Nom de lieu [Sloc] = ---
Effectivement, une présentation rapprochée et comparée des deux définitions et des deux structures actantielles permet de saisir, d’une part, les changements apportés lors du passage d’un terme à l’autre ; et de l’autre, de montrer comment,
294
Nicoletta Armentano
dans les langues de spécialité, les noms typiques des actants viennent se préciser au fur et à mesure. C’est le cas du nom d’agent (« banque prêteuse ») et du nom de patient (« banque emprunteuse ») de la locution simple transaction interbancaire.
4.2 Deuxième cas de figure Continuons avec notre deuxième cas de figure qui regroupe les termes complexes sur lesquels nous avons avancé avec plus de prudence, faisant quelques modifications en cours de route. Il s’agit des locutions transaction commerciale, transaction commerciale électronique et transaction électronique. Prenons le premier terme : – transaction commerciale Période : transaction commerciale_α, transaction commerciale_β Définition : ‘Opération commerciale dans laquelle un vendeur et un acheteur conviennent de transférer la propriété de quelque chose en échange d'un prix’ Structure actantielle : ‘Opération commerciale entre X et Y à propos de Z, réglementée par un accord V, en contrepartie de W’ Fonctions lexicales paradigmatiques : X = nom d’agent [S] = vendeur, commerçant, marchand Y = nom de patient [S] = consommateur, client Z = ASyntP III [S] = bien/service V = ASyntP IV [S] = contrat W = ASyntP V [S] = somme d’argent, argent Contexte DIACOM-fr : « Dans toute transaction commerciale, il y a trois termes en présence la qualité, la quantité et le prix »
Notre remarque, révélatrice, entre autres, des liens existants entre les propriétés syntactico-sémantiques du terme simple et celles des termes complexes, concerne la structure actantielle de transaction commerciale qui est la même que celle avancée précédemment pour transaction. En revanche, nous signalons que les noms typiques [S1], [S2] se précisent (ou se modifient – [S5]) par rapport à ceux attestés pour le terme simple. Quant aux unités phraséologiques transaction commerciale électronique et transaction électronique il convient de les présenter en parallèle annonçant déjà, en partie, ce qui a été notre décision finale. Regardons, alors, le tableau avec des exemples tirés du corpus DIACOM-fr ;
Traits définitoires et configurations actantielles dans la fiche terminologique
–
295
transaction commerciale électronique ; transaction électronique
Période : Transaction commerciale électronique_α Contexte DIACOM-fr : « Une transaction commerciale électronique peut se faire entre entreprises, ménages, particuliers, gouvernements et autres organisations publiques ou privées. Ces transactions électroniques incluent les commandes passées sur le Web, l’extranet ou l’échange électronique de données »
Période : Transaction électronique_α Contexte DIACOM-fr : « Les sites permettant une transaction électronique sécurisée en ligne par communication du numéro de carte bancaire sont de plus en plus nombreux aux États-Unis comme en France »
Or, les contextes pris en considération nous présentent des emplois assez similaires pour les deux locutions. Nous avons, de ce fait, consulté la base de données terminologiques Termium Plus et ensuite le GDT. Sur Termium Plus le terme transaction commerciale électronique est attesté (tandis que le terme transaction électronique est absent), mais la fiche terminologique correspondante est vide. Le terme transaction commerciale électronique se trouve à l’origine d’une autre locution – transaction commerciale électronique interentreprises – n’apparaissant pas dans notre corpus et semblant plutôt l’union de deux locutions indépendantes, à savoir transactions interentreprises et commerce électronique. Nous observons, en fait, que sur la base de données cette unité phraséologique semble avoir été créée ad hoc, comme témoigné par le contexte cité – « [l]a promotion du commerce électronique sur les réseaux publics encouragera tant les consommateurs que les entreprises à avoir recours au réseau Internet. Néanmoins, les experts conviennent que, au départ tout au moins, les transactions interentreprises domineront le commerce électronique dans Internet comme il l'a fait sur les réseaux privés ». Ceci nous paraît un choix plutôt arbitraire. Quant au GDT, ce n’est que la locution transaction électronique qui y figure, par ailleurs, comme synonyme de transaction en ligne. Dans la définition disponible, nous lisons que « transaction électronique et transaction en ligne désignent généralement une transaction commerciale électronique (ou transaction commerciale en ligne) ou une transaction bancaire électronique (ou transaction bancaire en ligne) ».
296
Nicoletta Armentano
Avec ces repères, nous sommes passés à la rédaction des structures actantielles des deux termes remarquant ainsi leur équivalence. Transaction commerciale électronique_α Structure actantielle : ‘Opération commerciale entre X et Y à propos de Z, réglementée par un accord V, en contrepartie de W par le moyen T’ Fonctions lexicales paradigmatiques : X = nom d’agent [S] = vendeur, commerçant, marchand, entreprise Y = nom de patient [S] = consommateur, client Z = ASyntP III [S] = bien/service V = ASyntP IV [S] = accord W = ASyntP V [S] = somme d’argent T = Nom d’instrument [Sinstr] = internet, plateforme web
Transaction électronique_α Structure actantielle : ‘Opération commerciale entre X et Y à propos de Z, réglementée par un accord V, en contrepartie de W par le moyen T’ Fonctions lexicales paradigmatiques : X = nom d’agent [S] = vendeur, commerçant, marchand, entreprise Y = nom de patient [S] = consommateur, client Z = ASyntP III [S] = bien/service V = ASyntP IV [S] = accord W = ASyntP V [S] = somme d’argent T = Nom d’instrument [Sinstr] = internet, plateforme web
Nous en déduisons que transaction électronique serait simplement la forme elliptique de transaction commerciale électronique – d’où la même définition (« [o]pération commerciale dans laquelle un vendeur et un acheteur conviennent de transférer la propriété de quelque chose en échange d'un prix par voie télématique ») – et que ce dernier terme aurait, pour le GDT deux synonymes : transaction commerciale en ligne et opération commerciale en ligne, pas présents dans le corpus DIACOM-fr.
4.3 Troisième cas de figure Nous voici au troisième cas de figure qui réunit les exemples plus complexes5. Il s’agit bien de transaction invisible et de transaction internationale. En ce qui concerne la première locution, la consultation du GDT nous a permis d’avoir accès à des précisions d’ordre sémantique. Il s’agit effectivement d’« [o]pérations de commerce international dans lesquelles il n'existe pas de mouvement physique des marchandises. Par exemple, l'achat et la vente de services, les transferts unilatéraux, le paiement des intérêts d'une dette et les assurances et réassurances ». Sur la base de cette définition, nous avons essayé d’élaborer sa structure actantielle, de repérer les fonctions lexicales (ce qui a permis de préci-
Précisons que deux autres locutions – transaction courante et transaction de référence – auraient dû figurer dans cette section ; mais le travail de compilation étant encore en cours, nous nous proposons d’aborder ces deux cas dans une étude successive.
Traits définitoires et configurations actantielles dans la fiche terminologique
297
ser [S3] par rapport à ce qui avait été mentionné pour le terme simple), d’isoler un contexte riche en informations extrait du corpus et d’arriver à notre propre définition : – transaction invisible Période : transaction invisible_α, transaction invisible_β Définition : ‘Opération commerciale entre au moins deux parties-prenantes, réglementée par un accord, et réalisée à l'international sans qu'aucun actif tangible ne soit échangé’ Structure actantielle : ‘Opération commerciale effectuée entre X et Y et qui ne concerne qu'un service Z, réglementée par un accord V en contrepartie de W’ Fonctions lexicales paradigmatiques : X = nom d’agent [S] = acteur commercial Y = nom de patient [S] = acteur commercial Z = ASyntP III [S] = service V = ASyntP IV [S] = contrat W = ASyntP V [S] = engagement Contexte DIACOM-fr : « Opération commerciale entre au moins deux parties prenantes, réglementée par un accord, et réalisée à l'international sans qu'aucun actif tangible ne soit échangé »
À la fin de ce parcours, nous en sommes venues à définir notre locution comme appartenant aux locutions sémantiquement semi-compositionnelles et cela contrairement à ce qui avait été retenu dans les étapes préliminaires de notre travail, c’est-à-dire, au moment de l’extraction de cette unité terminologique et de la proposition du classement. La raison réside dans la semi-transparence de ces composantes, notamment de la partie adjectivale. Passons maintenant à la locution transaction internationale. Notre hypothèse est que cette unité terminologique est un vocable polysémique ; hypothèse qui sera ensuite validée grâce au glossaire Kantox. Pour commencer, nous sommes parties du corpus, ce qui nous a permis de mettre l’accent sur la diachronie (identité de sens et de forme entre les deux occurrences repérées) et sur les contextes d’emploi du terme. Comme le tableau le montre, nous avons isolé deux types de contextes différents : – transaction internationale Période : transaction internationale_α, transaction internationale_β Premier contexte DIACOM-fr : « Cette facilitation pourrait permettre aux négociants de réaliser des économies considérables en termes de frais généraux, et aux petites et moyennes entreprises de se lancer dans des transactions internationales » Deuxième contexte DIACOM-fr : « En fait, il existe une contradiction dans le système actuel, à savoir que l’on ne peut pas juxtaposer l’utilisation de monnaies nationales dans les transactions internationales et l’existence d’un régime de taux de change fixes »
298
Nicoletta Armentano
Puis, pour tenter de clarifier ce qu’on observait grâce au corpus, nous avons consulté le GDT retrouvant une définition laconique et, selon nous, incomplète : « [t]ransaction commerciale sur le plan international ». Ce qui nous a convaincues, une fois de plus, de l’opportunité de poursuivre nos recherches. Nous avons ainsi identifié le glossaire multilingue Kantox qui met à disposition des termes et des définitions du domaine des finances. Nous y avons repéré une définition et deux contextes d’emploi du terme complexe qui confirmaient notre hypothèse, à savoir que transaction internationale était un vocable polysémique. Définition KANTOX : ‘Une transaction internationale est une transaction transfrontalière entre deux ou parfois trois devises, si une monnaie de réserve comme le dollar est utilisée’ Premier contexte KANTOX : « Exemple d'une transaction internationale en deux devises : une entreprise allemande achète des matériaux à un fournisseur aux États-Unis. Le fournisseur accepte les paiements en dollars. L'entreprise allemande doit donc convertir ses euros en dollars pour payer le fournisseur » Deuxième contexte KANTOX : « Exemple d'une transaction internationale avec une troisième monnaie, la monnaie de réserve : la même entreprise allemande achète également des équipements à un fournisseur en Chine. La monnaie de l'entreprise chinoise est le Yuan Renminbi, qui n'est pas librement convertible. Pour effectuer la transaction, les deux parties choisissent d'utiliser le dollar américain comme monnaie de réserve. L'entreprise allemande convertit ses euros en dollars pour payer le fournisseur chinois »
Les contextes observés nous permettent d'identifier deux valeurs différentes dans la signification du terme, qui figurent donc comme deux acceptions de la polysémie. Ceci nous conduit vers un dédoublement de la fiche, avec le résultat suivant pour ce qui concerne les composantes sémantiques : transaction internationale_α Définition : ‘Opération commerciale ou boursière entre au moins deux parties prenantes, réglementée par un accord et dépassant les frontières nationales’ Structure actancielle : ‘Opération commerciale effectuée entre X et Y à propos de Z, réglementée par un accord V en contrepartie de W et se réalisant au moins entre deux pays P' et P''’
transaction internationale_ α Définition : ‘Accord commercial transfrontalier ou opération de crédit qui nécessite un règlement dans une devise étrangère’ Structure actancielle : ‘Opération commerciale effectuée entre X et Y à propos de Z, réglementée par un accord V en contrepartie de W et se réalisant au moyen d’une devise étrangère D’
Par ailleurs, avec l’idée d’approfondir nos résultats, nous avons également effectué des recherches en direction des termes complexes transaction transfrontalière et transaction transfrontière. Cette dernière unité terminologique ne fait pas partie de notre extraction mais elle semble pouvoir préciser davantage les contours sémantiques de notre vocable, en ajoutant des éléments sur l'axe syntagmatique.
Traits définitoires et configurations actantielles dans la fiche terminologique
299
Dans les remarques présentes sur Termium Plus nous lisons que l’« adjectif transfrontalier est à privilégier. Le mot transfrontière ne figure pas dans les dictionnaires, sauf rare exception, mais il est attesté dans les documents de l'Organisation mondiale du commerce et les accords de libre-échange du Canada ». Les termes transaction transfrontière et transaction transfrontalière sont donc liés par une relation de synonymie, motivant par la suite une nouvelle extraction à partir du corpus DIACOM-fr. Cette nouvelle extraction nous a permis d’isoler sept occurrences du terme transaction transfrontière et trois occurrences du terme transaction transfrontalière. Ces occurrences, dont deux sont citées dessous, nous font pencher pour une relation de synonymie même entre les deux acceptions du vocable transaction internationale et celles de transaction transfrontière, qui serait donc à son tour un vocable. Voici donc les deux occurrences, respectivement de transaction transfrontière et de transaction transfrontalière dans le corpus DIACOM-fr : – transaction transfrontière_α1 a. Cela signifie que pour ce qui concerne ces types de transactions transfrontières, et dans l'hypothèse où les réglementations n'auraient pas été harmonisées, les consommateurs seraient autorisés à choisir la juridiction dans laquelle ils entendent placer leurs activités en fonction des réglementations de celle-ci ; – transaction transfrontalière_α1 b. En effet, l'emploi de monnaies différentes crée une entrave additionnelle aux échanges puisque les transactions transfrontalières nécessitent une conversion monétaire et, dans certains cas, la couverture du risque de change ; Observons maintenant la relation de synonymie que nous venons d’établir entre la définition de transaction internationale_α1 (déjà citée) et celle de transaction transfrontière_α1 (que nous avons établie à la suite de la deuxième extraction) : Définition Termium Plus : ‘Vente et achat ou échange de marchandises entre pays’ Définition DIACOM-fr de transaction internationale_α : ‘Opération commerciale ou boursière entre au moins deux parties prenantes, réglementée par un accord et dépassant les frontières nationales’ Définition DIACOM-fr de transaction transfrontière_α : ‘Opération commerciale entre au moins deux parties-prenantes établies dans des pays qui partagent leurs frontières, réglementée par un accord’
Et encore, voici la possible relation de synonymie entre la définition de transaction internationale_α2 et celle de transaction transfrontière_α2 et que nous tirons des contextes observés :
300
Nicoletta Armentano
Définition DIACOM-fr de transaction internationale_α : ‘Opération commerciale effectuée entre au moins deux parties prenantes, réglementée par un accord et se réalisant au moyen d’une devise étrangère’ Définition DIACOM-fr de transaction transfrontière_α : ‘Opération commerciale effectuée entre deux parties prenantes, réglementée par un accord et se réalisant au moyen d’une devise étrangère’
4.4 Quatrième cas de figure Il ne nous reste, à présent, que passer au dernier cas de figure qui porte sur un cas équivoque, qui figure aussi comme moment charnière de ce travail terminographique. Et ce, dans la mesure où le terme complexe en question nous amènera à revoir certaines de nos considérations initiales. Il s’agit de la locution transaction financière. Dans le GDT nous lisons ce qui suit : « Affaire conclue entre deux parties, dont l'une fait l'acquisition d'un bien, mobilier ou immobilier, en échange d'un droit, d'argent, d'une concession » Cette définition s’accompagne d’une note : « On pourra employer simplement les termes opération ou transaction dans les cas où le contexte ne porte pas à confusion ». Deux options s'offrent à nous. Dans un cas, la transaction financière serait un synonyme de transaction ; dans l'autre, transaction financière serait un type particulier de transaction et les deux termes seraient donc liés par une relation d'hyperonymie/hyponymie. En essayant alors d’identifier la structure actantielle du terme considéré, nous déduisons qu’une transaction financière est : ‘Affaire conclue entre X et Y à propos de Z, réglementée par une accord V, en contrepartie de W’. Nous remarquons que la structure actantielle est identique à celle de transaction. Il nous semble donc opportun de repartir du simple terme qui a donné lieu à notre étude et qui s'est avéré être un vocable. Nous sommes donc confrontés, pour la troisième fois (ce qui est assez rare dans les langues de spécialité), à un cas de polysémie (Frassi 2022). Nous fournissons, de suite, les définitions et les structures actantielles actualisées par rapport aux significations nouvellement découvertes de notre terme simple transaction :
Traits définitoires et configurations actantielles dans la fiche terminologique
transaction_α Définition : ‘Opération commerciale ou boursière Opération entre au moins deux partiesprenantes qui consiste dans l’échange d’un bien ou d’un service et réglementé par un accord’ Structure actantielle : ‘Opération commerciale Échange effectué entre X et Y à propos de Z, réglementé par un accord V’
301
transaction_α Définition : ‘Opération entre au moins deux parties-prenantes qui consiste dans la circulation d’une somme d’argent et réglementée par un accord’ Structure actantielle : ‘Opération financière ou boursière entre X et Y à propos de Z et réglementée par un accord W’
Dans cette direction transaction financière et transaction_α2 seraient des synonymes, ce qui nous amène à la définition et à la structure actantielles suivantes pour ce dernier cas de figure : – transaction financière Définition : ‘Opération consistant en un échange d’un actif contre une somme d’argent entre deux parties cocontractantes’ Structure actantielle : ‘Opération entre X et Y à propos de Z et réglementée par V en contrepartie de W’ Fonctions lexicales paradigmatiques : X = nom d’agent [S] = agent économique Y = nom de patient [S] = agent économique Z = ASyntP III [S] = transfert/versement d’argent V = ASyntP IV [S] = contrat W = ASyntP V [S] = engagement juridique
5 Conclusion Dans cet article nous avons proposé un excursus de la pratique terminographique en cours au sein de l’équipe de recherche véronaise travaillant sur les humanités numériques et notamment à la création d’une base de données terminologique de type réseau terminologique portant sur le lexique de base du commerce international en langue française. Nous nous sommes penchées, plus précisément, sur la rédaction des composantes sémantiques de la fiche terminologique hybride élaborée dans le cadre de ce projet d’envergure. Notre démarche et la méthodologie adoptées nous ont permis de montrer, tout d’abord, que le travail terminographique se définit en termes d’un va-etvient constant entres les différentes entités terminologiques. L’analyse des phases de rédaction des termes composant notre échantillon a effectivement rendu vi-
302
Nicoletta Armentano
sible que la posture du terminologue est rétroactive, faite de reprises, d’autocorrections continues et d’un travail de réécriture réitéré et ce, pour chaque entrée. Ceci nous amène aussi à dire que la notion d’entourage d’un terme est fondamentale afin d’assurer une rédaction soignée, convenable et conséquente des différentes rubriques d’une fiche terminologique. C’est précisément en mettant à l’épreuve le présupposé théorique (voire épistémologique) de la pratique terminographique duquel nous sommes parties, que nous avons pu observer qu’il existe un réel transfert des propriétés du terme simple aux termes complexes composant, de ce fait, son entourage. Notre analyse a, ainsi, montré concrètement que le terme complexe (dans notre cas, des phrasèmes de type locution) hérite les propriétés du terme simple. Or, cette attention pour la relation entre les entités terminologiques simples et complexes semble bien se refléter dans la démarche de compilation que nous avons adoptée. Rappelons, à ce propos, que nous avons travaillé à la rédaction des fiches terminologiques DIACOM-fr en procédant par sous-domaines, plutôt que par le traditionnel ordre alphabétique. Nous sommes toujours reparties de la définition et de la structure actantielle du terme simple pour rédiger celles des termes complexes. Enfin, terminons cette étude par une toute dernière remarque sur la complémentarité des composantes sémantiques de notre fiche. Définition linéaire et structure actantielle, en effet, tout en gardant leur autonomie rédactionnelle, se complètent si constamment mises en relation dans le cadre d’une même entité terminologique et/ou dans le cas d’un ensemble d’entités terminologiques étudiées de manière comparative. Cela nous semble vrai surtout en cas de doutes, ambiguïtés et impasses de compilation à résoudre. Ce qui nous permet d’affirmer, en définitive, que ce potentiel résolutif devrait mieux être exploité et mis à profit de séquences didactiques axées sur l’enseignement/apprentissages du lexique : un chantier de recherche que nous nous tâchons d’approfondir prochainement.
Bibliographie Alipour, Marjan, Création d’activités lexicales basées sur corpus pour la formation des traducteurs, ILCEA 32 (2018), 1–18. Béjoint, Henri, La définition en terminographie, in : Arnaud, Pierre J. L./Thoiron, Philippe (edd.), Aspects du vocabulaire, Lyon, Presses universitaires de Lyon, 1993, 19–26. Bonadonna, Maria Francesca, Les énoncés définitoires en discours. Une analyse diachronique dans le domaine du commerce, Academic journal of modern philology 13 (2021), Special issue, 41–49. Bonadonna, Maria Francesca, L’enseignement des notions métaterminologiques en français L2. Un parcours fondé sur les corpus spécialisés, Cahiers de lexicologie 117 (2020), 11–13.
Traits définitoires et configurations actantielles dans la fiche terminologique
303
Bonadonna, Maria Francesca/Frassi, Paolo, Les termes complexes de type locutions dans l’enseignement du français L2 en langue de spécialité. Le cas du domaine du commerce international, Lidil 65 (2022), https://doi.org/10.4000/lidil.10633. Bonadonna, Maria Francesca/Zollo, Silvia, A didactic sequence for phrasemes, in : Corpas Pastor, Gloria/Mitkov, Ruslan/Kunilovskaya, Maria/Losey Léon, María Araceli (edd.), L2 French, computational and corpus based phraseology. Actes Europhras 2019 (Malaga, 25–27 septembre 2019), Geneva, Editions Tradulex, 2019, 53–60. Boutin-Quesnel, Rachel/Bélanger, Nycole/Kerpan, Nada/Rousseau, Louis-Jean, Vocabulaire systématique de la terminologie, Québec, Les Publications du Québec, 1985. Cabré, Maria Teresa, La terminología. Teoría, metodología, aplicaciones, Barcelona, Antártida/ Empúries, 1993. Calvi, Silvia, L’enseignement/apprentissage des unités phraséologiques en terminologie, Synergies Italie 17 (2021), 109–120. Cavalla, Cristelle/Labre, Virginie, L’enseignement en FLE de la phraséologie du lexique des affects, in : Tutin, Agnès/Novakova, Iva (edd.), Le lexique des émotions et sa combinatoire lexicale et syntaxique, Grenoble, Ellung, 2019, 297–316. Condamines, Anne/Rebeyrolle, Josette/Soubeille, Anny, Variation de la terminologie dans le temps. Une méthode linguistique pour mesurer l’évolution de la connaissance en corpus, in : Williams, Geoffrey/Vessier, Sandra (edd.), Proceedings of the 11th EURALEX international congress. EURALEX 2004, Lorient, 6–10 juillet 2004, Lorient, Université de Bretagne-Sud, Faculté des Lettres et des Sciences humaines, 2004, 574–557. De Besse, Bruno, La définition terminologique, in : Centre d’études du lexique (ed.), La définition, Paris, Larousse, 1990, 252–261. Dubuc, Robert, Manuel pratique de terminologie, Montréal, Linguatech, 2002. Escoubas-Benveniste, Marie Pierre, La définition dans le texte économique écrit de vulgarisation savante – deuxième partie, Publifarum 11 (2010), http://publifarum.farum.it/ezine_pdf.php?id=147 [dernière consultation : 15/05/2022]. Francœur, Aline, La fiche terminologique, entre théorie et pratique, Langues et linguistique 35 (2015), 24–39. Frassi, Paolo, L’enseignement/apprentissage de la collocation entre contraintes grammaticales et contenu sémantique, Études de linguistique appliquée 189 (2018), 63–84. Frassi, Paolo, La force des locutions faibles en domaine de spécialité, in : Conceiçao, Célio Manuel/ Zanola, Maria Teresa (edd.), Terminologia e mediação linguística. Métodos, práticas e atividades, Faro, UAlg Editora, 2020, 43–60. Frassi, Paolo, DIACOM-fr, une base de données terminologiques de type diachronique, Cahiers de lexicologie 118:1 (2021), 23–49. Frassi, Paolo, La représentation de la polysémie et des termes complexes de type locution faible dans une base de données terminologique, Terminology 28:1 (2022), 103–128. Frassi, Paolo/Calvi, Silvia/Humbley, John, Fouille de textes et repérage d’unités pharséologiques, in : Terminologie & ontologie. Théories et applications, Chambéry, Presses Universitaires Savoie MontBlanc, 2020, 321–338. Gouadec, Daniel, Terminologie. Constitution des données, Paris, AFNOR, 1990. L’Homme, Marie-Claude, Terminologie de l’environnement et sémantique des cadres, SHS Web of conferences 27 (2016), 1–14, https://www.shsconferences.org/articles/shsconf/abs/2016/05/ shsconf_cmlf2016_05010/shsconf_cmlf2016_05010.html [dernière consultation : 15/05/2022].
304
Nicoletta Armentano
L’Homme, Marie-Claude/San Martín, Antonio, Définition terminologique. Systématisation de règles de rédaction dans les domaines de l’informatique et de l’environnement, Cahiers de lexicologie 109:2 (2016), 145–172. Massabié-François, Martine/Poulain, Elisabeth, Lexique du commerce international. Les 2600 mots actuels et pratiques de l’import-export, Paris, Breal, 2002. Mel’ćuk, Igor, Lexical functions. A tool for the description of lexical relations in the lexicon, in : Wanner, Leo (ed.), Lexical functions in lexicography and natural language processing, Amsterdam/ Philadelphia, Benjamins, 1996, 37–102. Mel’čuk, Igor, Vers une linguistique Sens-Texte. Leçon inaugurale, Paris, Collège de France, 1997. Mel’čuk, Igor, Lexical functions, in : Burger, Harald/Dobrovol’skij, Dmitrij/Kuhn, Peter/Norrrick, Neal (edd.), Phraseologie/Phraseology, Berlin/New York, Walter de Gruyter, 2007, 119–131. Mel’čuk, Igor, Tout ce que nous voulions savoir sur le phrasèmes mais…, Cahiers de lexicologie 102:1 (2013), 129–149. Mel’čuk, Igor, Semantics. From meaning to text, Amsterdam/Philadelphia, Benjamins, 2015. Mel’čuk, Igor/Clas, André/Polguère, Alain, Introduction à la lexicologie explicative et combinatoire, Paris/Louvain-La-Neuve, Duculot, 1995. Mel’čuk, Igor/Polguère, Alain, Lexique Actif du Français (LAF). L'apprentissage du vocabulaire fondé sur 20000 dérivations sémantiques et collocations du français, Bruxelles, De Boeck, 2007. Morelle, Frédéric, Lexique du commerce international, Paris, Ellipses, 2003. Pavel, Silvia/Nolet, Diane, Précis de terminologie, Hull, Bureau de la traduction, 2001. Rey, Alain, La terminologie. Noms et notions, Paris, Presses Universitaires de France, 1992. Rondeau, Guy, Introduction à la terminologie, Québec, Gaëtan Morin, 1983. Rousseau, Louis-Jean, Vers une méthodologie de la définition terminologique, in : Martel, Pierre/ Maurais, Jacques (edd.), Langues et sociétés en contact. Mélanges offerts à Jean Claude Corbeil, Tübingen, Max Niemeyer Verlag, 1994, 169–174. Seppäla, Selja, An ontological framework for modeling the contents of definitions, Terminology 21:1 (2015), 23–50. Spear, Andrew, Ontology for the twenty firts century. An introduction with reccomandations, 2006, http://ifomis.uni-saarland.de/bfo/documents/manual.pdf [dernière consultation : 15/05/22]. Vézina, Robert/Darras, Xavier/Bédard, Jean/Lapointe-Giguère, Micheline, La rédaction de définitions terminologiques. Version abrégée et adaptée par Jean Bédard et Xavier Darras, Montréal, Office québécois de la langue française, 2009. Zanola, Maria Teresa, Che cos’è la terminologia, Roma, Carocci, 2018.
Claudia Cagninelli
Du développement durable à la transition écologique dans les tweets Des phraséotermes concurrents du domaine écologique ? Résumé : Cette contribution s’intéresse aux usages ordinaires de deux phraséotermes du domaine écologique, développement durable et transition écologique, dans les discours sur Twitter. Après un aperçu des traitements terminologiques, une analyse des thématiques les plus fréquemment associées à ces phraséotermes et une exploration de leurs profils lexico-discursifs mettent en évidence les usages principaux et les différences sémantiques et pragmatiques qui les caractérisent dans cet espace discursif. Les résultats montrent des profils discursifs partiellement distincts qui pourraient contribuer à mettre en valeur des perspectives différentes sur la question écologique. Mots-clés : phraséoterme, profil lexico-discursif, développement durable, transition écologique, discours écologique Abstract: This paper focuses on the common uses of two phraseological units from the ecological domain, développement durable ‘sustainable development’ and transition écologique ‘ecological transition’, in Twitter discourses. An overview of their terminological description is followed by an analysis of the themes most frequently associated with the two phraseological units. An exploration of their lexico-discursive profiles highlights then their main uses in this discursive space as well as their semantic and pragmatic differences. The results show partially distinct discursive profiles which could contribute to convey different perspectives of the ecological issue. Keywords: phraseological unit, lexico-discursive profile, sustainable development, ecological transition, ecological discourse
1 Introduction Depuis les dernières décennies du XXe siècle, les faits phraséologiques ont suscité un intérêt croissant dans les études linguistiques. En suivant Bendinelli (2017, §§3–4 et 6), nous adoptons la dénomination « faits phraséologiques » pour référer à la
https://doi.org/10.1515/9783110749854-015
306
Claudia Cagninelli
grande variété de « structures préformées combinant deux (ou plus) unités », reliées les unes aux autres « par une relation orientée ». Leur sens « peut varier le long d’un continuum allant de la non-compositionnalité [. . .] à la compositionnalité [. . .] et leur actualisation peut être sujette à variations lexicales et/ou morphosyntaxiques ». Si le mérite d’avoir mis en avant l’existence des séries phraséologiques déjà en 1909 est communément reconnu à Bally, plusieurs approches théoricométhodologiques se sont ensuite développées au fil des années. Entre autres, on peut rappeler les travaux anglophones de Firth (1957) et de Sinclair (1991) qui privilégient une approche statistique de l’étude des séquences lexicales cooccurrentes, les travaux d’orientation formelle-fonctionnelle de Hausmann (2005 ; Hausmann et Blumenthal 2006) et de Blumenthal (2006), ou encore la Théorie Sens-Texte de Mel’čuk (1997). Les faits phraséologiques foisonnent dans la langue générale (Mel’čuk 2013) et la riche variété de ces unités a donné lieu à plusieurs perspectives d’étude (voir, par exemple Blumenthal/Mejri 2008 ; Legallois/Tutin 2013 ; Mel’čuk 2013 ; Gonzales Rey 2021), sans pour autant négliger, plus récemment, leurs fonctionnements dans les langues de spécialité, comme le montrent les travaux de Gautier (2004), de Tutin et Grossmann (2013) ou de Dincă et Preite (2019), pour n’en citer que quelques-uns. Il faut toutefois souligner que la nature préconstruite des faits phraséologiques peut se fonder sur les mécanismes qui caractérisent aussi bien la langue que le discours1, en contribuant à leur tour aux processus de construction du sens : « [a]u même titre que les faits de langue et les faits de discours, les faits phraséologiques sont une unité fondamentale pour l’analyse de productions empiriques, en ce qu’ils participent à la construction du sens » (Bendinelli 2017, §11). Notre étude porte ainsi sur les usages ordinaires d’une unité phraséologique spécifique, le phraséoterme – c’est-à-dire une unité terminologique polylexicale (cf. infra) –, et l’aborde en relation avec l’étude des processus de construction et de négociation du sens en discours, qui influencent la (re)configuration des dimensions sémantique et pragmatique des ressources linguistiques ordinaires et terminologiques. Elle s’ancre dans une vision phénoménologique de l’activité langagière qui soutient la primauté du discours sur la langue (cf. Merleau-Ponty 1945 ; Benveniste 1966 ; 1974 ; Coquet 1992). En effet, si la langue cristallise – du moins temporairement – les usages linguistiques qui s’imposent à la fois intersubjectivement – aux divers sujets parlants d’une langue – et interdiscursivement – à travers divers types et genres de
À titre d’exemple, on pourrait renvoyer à la notion de pragmatème mise au point par Mel’čuk (2013), qui contribue à mettre en relief le rôle du discours dans la création de ces phrasèmes sémantico-lexicaux relevant d’une contrainte lexico-sémantique et d’une contrainte pragmatique, déterminée par la situation d’emploi.
Du développement durable à la transition écologique dans les tweets
307
discours –, c’est aux pratiques discursives d’en renégocier le sens et de faire évoluer la langue. En suivant Longhi (2018, 26), nous considérons le discours comme « un champ qui sémiotise l’appréhension du monde social » ; ce dernier « peut être saisi et décrit à travers les processus discursifs des sujets parlants, qui laissent les traces de l’appréhension qu’ils en ont dans la mise en mots ». Dans le cadre de cette étude, nous nous intéressons à un couple de phraséotermes du discours écologique, qui sont étroitement liés entre eux tout en n’étant pas équivalents (cf. Bourg 2012 ; Boissonade 2017 ; Larrère et al. 2016 ; Larrère 2021) : développement durable et transition écologique. L’attention est focalisée sur les usages de ces unités phraséologiques spécialisées dans les discours généralistes sur Twitter. À travers l’analyse de leurs propriétés lexico-syntaxiques, sémantiques et pragmatiques, nous nous attacherons à en cerner les traits communs ainsi que les différences d’un point de vue linguistique et discursif.
2 Développement durable et transition écologique : deux phraséotermes liés à la question écologique En suivant Hausmann et Blumenthal (2006, 4), nous entendons les phraséotermes comme des « mots composés polylexicaux terminologiques » qui, d’un point de vue fonctionnel, servent pour dénommer des concepts propres à un domaine spécifique (cf. Gautier 2004). Les deux phraséotermes envisagés présentent une structure formelle similaire, constituée d’un substantif suivi d’un adjectif, pouvant être toutefois sujette à des variations compositionnelles aussi bien dans le discours scientifique – songeons par exemple à transition agroécologique – que dans le discours ordinaire, où les variantes contribuent à la sémantisation hétérogène de la signification de structures formulaires (cf. Krieg-Planque 2010). Cependant, développement durable (DD) et transition écologique (TE) se rapprochent non seulement d’un point de vue structurel-fonctionnel mais aussi d’un point de vue sémantique, sans pour autant se superposer. De fait, la notion de transition apparait en relation avec celle de développement durable dès son introduction au cours des années 1970. Boissonade (2017) signale en effet que, dans le rapport Meadows de 1972, le développement durable est présenté en relation avec la nécessité de « transition d’un modèle de croissance à un équilibre global », qui prend en compte les risques écologiques entraînés par la croissance à la fois économique et démographique. Alors que la notion de développement durable a été centrale dans les discours écologiques à partir des
308
Claudia Cagninelli
années 1970, celle de transition écologique est devenue de plus en plus fréquente depuis le nouveau millénaire (Larrère et al. 2020), comme en témoigne aussi l’évolution de l’appellation2 du ministère s’occupant des questions environnementales (Fracchiolla 2019 ; Larrère 2021). Ainsi que le remarque Boissonade (2017), l’introduction de cette expression a contribué à un recadrage de l’action publique en matière d’environnement, en soulignant le passage à l’action, qui devrait être avant tout locale, citoyenne, sociale et équitable en réaction au « détournement marketing » de la notion de DD. Bien que les deux phraséotermes soient étroitement liés d’un point de vue sémantique, on essayera de mieux caractériser leurs contours sémantiques ainsi que leurs implications pragmatiques à travers l’analyse de leurs profils non seulement combinatoires (Blumenthal 2006) mais aussi lexico-discursifs (Veniard 2013). D’après Veniard (2013, §11), « un profil lexico-discursif rassemble les caractéristiques préférentielles du fonctionnement discursif d’un mot sur les plans syntagmatique, syntaxique, sémantique, énonciatif, textuel et interdiscursif. Au niveau pragmatique, le profil lexico-discursif d’un mot conditionne le rapport expérientiel unissant une communauté de locuteurs à un objet du monde et se rattache au phénomène plus général du point de vue ».
Afin d’étudier les profils lexico-discursifs de développement durable et de transition écologique, l’analyse sera articulée en deux phases. On explorera dans un premier moment les thématiques qui sont fréquemment abordées en association avec ces deux phraséotermes relevant du domaine de l’écologie. Cela permettra de rendre compte « de l’articulation des unités lexicales au discours, qu’il s’agisse des relations associatives entre éléments lexicaux ou des interactions entre unité lexicale et les niveaux du texte et du discours » (Veniard 2013, §9). Ensuite, l’analyse des relations cooccurrentielles aussi bien lexicales que grammaticales dans un cotexte plus restreint visera à mieux cerner la dimension sémantique et pragmatique des deux unités, en essayant de mettre en relief les traits distinctifs des deux concepts. Pour ce faire, on présente tout d’abord le domaine scientifique dont les deux phraséotermes relèvent et on donne un aperçu de leurs divers traitements terminologiques.
Ministère de la Protection de la nature et de l’Environnement (1971), ministère de l’Écologie et du Développement durable (2002) ; ministère de l’Écologie, du Développement durable et de l’Énergie (2012), ministère de l’Environnement, de l’Énergie et de la Mer (2016), ministère de la Transition écologique et solidaire (2017), ministère de la Transition écologique (2020).
Du développement durable à la transition écologique dans les tweets
309
2.1 Le domaine de l’écologie : de la terminologie scientifique aux usages courants Définie par le Trésor de la Langue Française informatisé (TLFi)3 comme la « science qui étudie les relations entre les êtres vivants (humains, animaux, végétaux) et le milieu organique ou inorganique dans lequel ils vivent », l’écologie est devenue au cours des dernières décennies un sujet central des discours institutionnels, politiques, médiatiques et finalement des discours ordinaires. Ainsi que le remarque Petiot (1994), si l’origine du mot écologie remonte à 1866, son usage devient courant dans les discours non scientifiques pendant les années 1970 grâce aussi à son entrée dans le discours politique et à la naissance des premiers mouvements et partis politiques d’inspiration écologique (cf. aussi Fracchiolla 2019). Ces nouveaux contextes d’usage ont donc influencé l’évolution du sémantisme du terme. Alors qu’on pourrait considérer la dimension naturelle-environnementale comme la couche sémantique originaire du terme d’après le préfixe éco- qui signifie « maison » ou « habitat »,4 les dimensions civique et politique ont acquis une importance grandissante en conséquence de la vulgarisation du terme (Petiot 1994). Ainsi, dans le TLFi, l’acception élargie de écologie renvoie aux « études des relations réciproques entre l’homme et son environnement moral, social, économique ». On assiste par conséquent à un élargissement progressif du sémantisme du terme, qui ajoute aux traits originaires [+ nature] [+ environnement] d’autres sèmes relevant des relations homme-nature [- polluant] [+ biodégradable] (Petiot 1994, 72). C’est donc un double système relationnel qui s’impose, étant d’ordre physique mais aussi social (Fracchiolla 2019). D’après Fracchiolla (2019, 28), « [l]’écologie politique semble être l’aboutissement de cette dynamique transpositive entre nature et culture, entre science ou principes scientifiques de définition de la vie et grands systèmes de la pensée humaine » ; d’où la difficulté de rendre compte de la complexité sémantique du terme, façonnée par et dans les pratiques discursives qui relèvent des interrelations entre « les systèmes scientifiques et les systèmes de pensée humaine ». Les discours écologiques ordinaires se servent ainsi de la terminologie d’un domaine scientifique déterminé et délimité, qu’ils ont pourtant enrichie et transformée, en la chargeant de plus en plus d’une dimension sociale, morale, écono-
http://atilf.atilf.fr/dendien/scripts/tlfiv5/visusel.exe?11;s=1504086900;r=1;nat=;sol=0 ; [dernière consultation : 10.04.2022]. Comme le précise le Termium Plus, ce préfixe est couramment exploité pour la formation de néologismes relatifs au domaine environnemental, https://www.btb.termiumplus.gc.ca/tpv2gui des/guides/clefsfp/index-fra.html?lang=fra&lettr=indx_catlog_e&page=9T0V131tgtJw.html [dernière consultation : 08.04.2022].
310
Claudia Cagninelli
mique et encore argumentative. Les termes forgés peuvent en effet viser à la promotion de modes de pensée, de comportements, de pratiques, en condensant aussi des enjeux politiques et sociaux, ainsi que l’a montré Krieg-Planque (2010) pour la formule développement durable, dont l’emploi ordinaire apparaîtrait toutefois en concurrence avec la notion de transition écologique.
2.2 Du développement durable vers la transition écologique Dans un article récemment paru dans The Conversation, Catherine Larrère, professeure en philosophie, voit dans l’usage croissant de la notion de transition – énergétique ou écologique – au détriment de celle de développement durable le signal d’« une volonté de changement plus radical », qui entraînerait un « changement de régime ». Le terme ferait en outre appel à « une rationalité planificatrice et gestionnaire » permettant « d’envisager la continuité d’un processus amorcé au sein des processus naturels et qui se continue dans le milieu social » (Larrère 2021). Déjà en 2012, Dominique Bourg soutenait l’emploi préférentiel de transition écologique au lieu de développement durable car ce dernier implique une idée de croissance, notamment économique, qui est en contraste avec les ressources limitées de notre planète. Si, dans la notion de DD, l’idée de « croissance économique » (Larrère et al. 2016) semble être primaire par rapport aux deux autres piliers de la notion (social et environnemental), celle de TE permettrait de mieux emphatiser la globalité des changements nécessaires (Larrère et al. 2020) pour faire face aux problèmes climatiques, en envisageant une « société sans croissance » (Larrère et al. 2016). Nous nous attacherons à tester ces considérations d’un point de vue linguistique sur un échantillon de discours abordant la question climatique sur Twitter dans le but d’ébaucher le profil lexico-discursif (Veniard 2013) des deux phraséotermes – DD et TE. Une exploration de leurs traitements terminologiques constituera toutefois le point de départ pour délimiter les concepts qu’ils désignent avant d’en observer les usages ordinaires sur Twitter.
2.3 Aperçu des traitements terminologiques Étant donné que les deux phraséotermes DD et TE désignent des concepts spécifiques propres au domaine écologique, une exploration préliminaire de divers glossaires et ressources terminologiques accessibles en ligne a été effectuée pour chercher à en délimiter les contours conceptuels. Depuis la sélection de ressources consultées, on atteste une présence limitée de transition écologique, alors que
Du développement durable à la transition écologique dans les tweets
311
développement durable apparaît dans toutes les sources, comme le résume le tableau suivant. On pourrait ainsi se demander si cette différence relève de l’introduction plus récente de TE par rapport à celle de DD. Tableau 1 : Présence/absence de DD et TE dans une sélection de ressources terminologiques. Base terminologique/Glossaire
Développement Transition durable écologique
Actu-environnement.com – dictionnaire environnement https://www.actu-environnement.com/ae/dictionnaire_environ nement/definition.php
oui
non
Dico écolo https://www.dico-ecolo.com
oui
non
Dictionnaire de l’environnement https://www.dictionnaire-environnement.com/dico_env.php
oui
non
EKOPO – glossaire https://www.ekopo.fr/definitions-glossaire/a/
oui
oui
France Terme http://www.culture.fr/franceterme
oui
non
Grand dictionnaire terminologique – Office québécois de la langue française https://gdt.oqlf.gouv.qc.ca/index.aspx
oui
non
IATE https://iate.europa.eu/home
oui
oui
Termium Plus https://www.btb.termiumplus.gc.ca/tpvalpha/alpha-fra.html? lang=fra&i=&index=alt&codomnd_wet=
oui
non
Termsciences – portail terminologique multidisciplinaire http://www.termsciences.fr/-/Index/Rechercher/Classique/Navi guer/Resultats/?#
oui
non
Wiktionnaire https://fr.wiktionary.org/wiki/Wiktionnaire:Page_d% E%%accueil
oui
oui
Si la plupart des définitions de DD mettent en relief les trois piliers – social, économique et environnemental – sur lesquels se fonde le concept (cf. aussi KriegPlanque 2010), on remarque la tendance à en souligner notamment le côté économique (cf. par exemple IATE, FranceTerme, TermiumPlus, TermSciences), ce qui confirmerait les raisons avancées par Bourg (2012), Boissonade (2017), Larrère et al. (2016 ; 2020) et Larrère (2021) pour prôner l’emploi privilégié de TE.
312
Claudia Cagninelli
Seulement trois ressources sur dix (le glossaire de l’Ekopo, la base de données IATE et le Wiktionnaire) comportent une fiche terminologique pour transition écologique. Dans le glossaire de l’Ekopo,5 « le média de l’économie responsable », la TE désigne le passage « d’un système énergétique polluant à un système énergétique respectueux de l’environnement », en réduisant « le recours aux énergies fossiles, aux énergies épuisables et aux énergies responsables du réchauffement climatique » avec l’objectif de préserver l’environnement. De plus, elle est assimilée à transition écoresponsable et à transition énergétique, les trois expressions étant présentées comme synonymiques. La base IATE met également l’accent sur la dimension économique de la TE,6 tandis que la version française du dictionnaire collaboratif Wiktionnaire7 en propose deux acceptions différentes. La première, liée au domaine de la géographie, renvoie à la « transition entre deux écosystèmes », alors que la seconde, relevant de l’écologie, désigne un « concept visant un nouveau modèle économique et social qui renouvelle nos façons de consommer, de produire, de travailler, de vivre ensemble pour répondre aux grands enjeux écologiques du XXIe siècle ». Outre la faible présence de l’entrée TE dans les ressources consultées, on peut observer des divergences significatives dans l’empan des définitions repérées. De fait, seulement le Wiktionnaire précise clairement la pluralité des dimensions impliquées dans le concept désigné (économique, sociale et environnementale). Au contraire, les deux autres ressources attirent plutôt l’attention sur son versant économique, d’une manière similaire à ce qui se passe pour le DD. Par ailleurs, la présence d’une note d’usage dans l’article du Wiktionnaire est particulièrement significative. Elle signale en effet que le concept de TE tend à se substituer à celui de développement durable et qu’il intègre dans son sémantisme le concept de transition énergétique, qui en constituerait ainsi un hyponyme. Cette note permet donc de clarifier les relations lexico-sémantiques et discursives qui s’établissent entre la TE et les deux autres concepts qui y sont souvent associés.
https://www.ekopo.fr/Definitions-Glossaire/Transition-ecologique-361220.htm [dernière consultation: 20.04.2022] « processus de transformation des normes de production, de consommation et d’investissement vers un mode de développement économique pauvre en carbone et compatible avec la préservation des ressources », https://iate.europa.eu/entry/result/3580910/fr [dernière consultation: 20.04.2022] https://fr.wiktionary.org/wiki/transition_écologique [dernière consultation: 20.04.2022]
313
Du développement durable à la transition écologique dans les tweets
3 Corpus d’étude Pour analyser les profils lexico-discursifs des deux phraséotermes dans les tweets centrés sur la question climatique, nous avons créé deux corpus d’étude en fonction de la présence de la suite des lemmes développement + durable (754 tweets) ainsi que transition + écologique (998 tweets), à partir d’un corpus thématique constitué de 317.409 tweets, publiés au long de l’année 2020 et incluant le lemme climatique. La constitution du corpus en fonction de la présence de l’adjectif permet ainsi d’avoir accès aux diverses collocations construites avec climatique par rapport à une recherche lancée sur le substantif climat, qui n’aurait pas nécessairement permis de les extraire. Bien que les deux phraséotermes apparaissent dans un nombre assez limité de tweets par rapport au volume du corpus total, on peut constater une fréquence plus élevée de transition écologique par rapport à développement durable, contrairement à la faible fréquence de ses attestations dans les ressources terminologiques (cf. supra 2.3). Par ailleurs, remarquons que, dans le corpus total (cf. tableau 2), le substantif développement est employé en cooccurrence avec durable dans 60% des séquences NOM+ADJ, alors que transition est utilisé en cooccurrence avec une plus grande variété d’adjectifs, même si écologique est le plus co-fréquent (33%). On pourrait ainsi faire l’hypothèse que la diverse proportion de cooccurrences NOM+ADJ pourrait relever du divers degré de figement de la dimension formulaire (cf. Krieg-Planque 2010) des deux phraséotermes, déterminée par la création plus récente de transition écologique par rapport à développement durable. Tableau 2 : Cooccurrences de développement/transition + ADJ affichées par lemme [corpus total] calculées via TXM (Heiden et al. 2010). Développement + ADJ développement durable développement économique développement humain développement agricole développement régional développement urbain développement international développement rural
Fréquence [tot. ]
Transition + ADJ transition écologique transition énergétique transition climatique transition juste transition social transition agricole transition agroécologique transition environnemental
Fréquence [tot. ]
On signale toutefois que, de manière similaire à DD, l’expression transition écologique est en train de donner lieu à des formulations voisines, qui pourraient
314
Claudia Cagninelli
contribuer à son figement formulaire au fil du temps (cf. Krieg-Planque 2010). En effet, il est possible de repérer des variantes produites par commutation nominale (transformation écologique), par commutation adjectivale (transition verte) et par coordination (transition écologique et + ADJ). Il s’agit de collocations qui s’attestent premièrement en discours, mais qui pourraient ensuite se figer et se stabiliser en langue et dans les dictionnaires. Voilà pourquoi les discours ordinaires comme des tweets peuvent constituer un observatoire privilégié de la variation des usages et des variantes de phraséotermes spécialisés.
3.1 Analyse thématique Dans le but de repérer les divers usages des deux phraséotermes dans les corpus d’étude respectifs, on articule une analyse thématique à une analyse lexico-syntaxique. Les deux s’appuient sur l’observation contextualisée des relations de cooccurrence, en prenant en compte deux paliers contextuels distincts. À la suite de Mayaffre (2008, 60), nous considérons la cooccurrence comme la « forme minimale du contexte », qui donne accès aux associations systématiques entre les mots, participant à leur sémantisation. Tout d’abord, les deux corpus d’étude sont soumis à une exploration outillée structurante et, plus précisément, à une classification hiérarchique descendante (CHD), effectuée sous Iramuteq (Ratinaud 2014) selon la méthode Reinert (1990). Elle permet de repérer les thématiques principales du corpus étudié en fonction de la distribution des mots selon leurs relations de cooccurrence au niveau de chaque tweet. Les différents tweets du corpus sont ainsi regroupés en classes distinctes sur la base des mots qui sont fréquemment en cooccurrence entre eux. Les mots les plus spécifiques sont listés au-dessous des diverses classes identifiées par la CHD (cf. Figure 1).
3.1.1 Transition écologique Le graphique suivant résulte de la CHD effectuée sur le corpus relatif à la TE. À travers une analyse contextualisée des tweets incluant les mots les plus spécifiques de chaque classe, il est possible d’identifier les aspects thématiques qui y sont principalement abordés.
Du développement durable à la transition écologique dans les tweets
315
Figure 1 : CHD dans le corpus TE obtenue via Iramuteq.
Dans le corpus des tweets comportant le phraséoterme TE, 41,89% de ces discours (regroupés dans la classe 1) ont abordé la transition écologique comme une réponse active pour réagir et agir contre le changement climatique. Les tweets suivants en constituent des exemples représentatifs8. 1. A l’heure du changement climatique, la #publicité doit se préparer à porter la transition écologique. Un nouveau projet de loi prévoit la formation des acteurs de la publicité aux enjeux liés à la préservation de l’environnement [mention] (24/09/2020) 2.
[ENVIRONNEMENT] La Ville a été reconnue « Territoire engagé pour la nature en Île-de-France » par @OFBiodiversite. Ce label valorise les actions menées en matière de transition écologique, d’adaptation au changement climatique & en faveur de la biodiversité. (14/09/2020)
En ce qui concerne la reproduction textuelle des tweets, précisons que les liens URL ont été supprimés par souci de concision, étant donné qu’ils ne sont pas pris en compte dans l’analyse. En outre, les mentions de comptes non reconnus par la plateforme comme étant d’intérêt public – par le biais du badge bleu certifié – ont été anonymisées. Les mots en gras correspondent aux occurrences les plus spécifiques de la classe identifiées par le logiciel.
316
3.
Claudia Cagninelli
[#TransitionEcologique ] En visite en #vaucluse @brunepoirson a signé avec les élus de la [mention] un contrat de transition écologique, Construit avec les acteurs du territoire pour œuvrer à l’adaptation aux changements climatiques et au maintien d’un cadre de vie de qualité (27/01/2020)
Dans les discours de cette classe, trois aspects récurrents ressortent en relation avec la TE : – la dimension active des actions et des projets qui participent à la TE (porter, engager, répondre, œuvrer, acteur), qui est présentée comme une solution nécessaire pour faire face aux enjeux et aux défis entraînés par le changement climatique ; – la mise en œuvre d’actions qui favorisent l’adaptation aux changements climatiques ; – la centralité de l’environnement naturel et de la biodiversité. La dimension active de la TE est mise en avant également dans les tweets rassemblés dans la classe 2 (40,1%), qui la présentent comme l’un des aspects de la relance suite à la crise non seulement climatique (réchauffement climatique) mais aussi sanitaire (covid). Ces discours concernent en particulier le versant économique de la TE. On peut en effet remarquer les références aux plans de relance économique et verte qui devraient être accélérés, mais aussi celles à la question énergétique (nucléaire) et au problème de la pollution (émissions, co2, gaz à effet de serre). On fait en outre appel à des stratégies et à des investissements (budget, argent, investir, milliards) pour réduire les facteurs qui causent le réchauffement climatique. 4.
L’ONU plaide pour des #plans de #relance plus #verts afin de limiter le #réchauffement à 2 °C La #crise #sanitaire n’aura qu’un effet négligeable sur le réchauffement #climatique, à moins que les pays accélérent la transition écologique. via [mention] (10/12/2020)
5.
Relancer l’économie après la crise #COVID19, en favorisant la transition écologique et la lutte contre le réchauffement climatique [mention] propose notamment d’accélérer la #rénovation des #logements, et de favoriser la production d’électricité renouvelable #EnR (07/04/2020)
6.
La baisse des émissions de CO2 en 2020 (– 7 %) n’aura qu’un effet négligeable sur le réchauffement climatique, à moins que les pays ne profitent de la crise sanitaire pour accélérer la transition écologique. (09/12/2020)
Du développement durable à la transition écologique dans les tweets
317
Enfin, les tweets de la classe 3 (18,04%) relèvent de discours liés principalement aux campagnes électorales municipales. La dimension sociale et citoyenne de la TE est plus accentuée dans ces tweets qui mettent en valeur la question écologique surtout dans des programmes et initiatives politiques. 7.
L’écologie, maire de toutes les batailles. Face à l’urgence climatique, le mandat municipal 2020–2026 sera plus que jamais celui de la transition écologique. Le sujet est au cœur de la campagne, et l’échelon local permet d’agir concrètement : [lien] via @libe (22/01/2020)
8.
La transition écologique à Paris ne se fera que si les politiques prennent leurs responsabilités et décident d’agir radicalement face a l’urgence climatique. Nous avons besoin d’écologie et de solidarité ds le 19e. Votez le 15 mars pr [mention] #Municipales2020 #EcologieParis (07/03/2020)
Ces discours dénoncent en outre l’urgence des questions climatiques et écologiques, en soulignant en même temps la planification (agir, organiser) d’actions et initiatives, l’investissement et les réalités sociales engagées. Économie, politique, société : autant de secteurs appelés à s’engager concrètement pour répondre aux changements climatiques à travers la modification des systèmes économiques et des modes de vie pour les adapter aux transformations de l’environnement causées par l’action humaine.
3.1.2 Développement durable En ce qui concerne le corpus relatif au DD (Figure 2), on peut constater que la plupart de ces discours (classe 2 ; 58,3%) abordent le DD en le mettant en relation, d’une part, avec les problèmes écologiques (lutte contre le réchauffement climatique ; gaz à effet de serre) et, de l’autre, avec les objectifs visés par la lutte contre ces défis (préservation, biodiversité, résilience, renouvelables). Si le DD partage des aspects thématiques avec la TE, on remarque cependant un profil syntaxique et une mise en discours différents. Comme on peut le voir dans les exemples suivants, le DD est souvent inséré dans une série coordonnée de termes et phraséotermes du domaine écologique (biodiversité, énergies renouvelables) et manque souvent de la dimension actionnelle qui caractérise le contexte de la TE (cf. supra les exemples 1–3). En outre, il est plutôt présenté comme un objectif à atteindre – comme ce serait le cas pour la préservation de la biodiversité – et non pas comme le moyen pour agir contre ces problèmes, à l’instar de la TE.
318
Claudia Cagninelli
Figure 2 : CHD dans le sous-corpus DD obtenue via Iramuteq.
9.
Reprise des débats cet après-midi à l’Assemblée nationale pour le #budget 2021. La Ministre de l’Écologie Barbara Pompilli nous présente le budget destiné à la lutte contre le réchauffement climatique, la préservation de la #biodiversité et au développement durable. (09/11/2020)
10. La forêt reste 1 véritable puits pr les gaz à effet de serre, la préserver c’ lutter activement contre le réchauffement climatique, pr la préservation de notre biodiversité, pr notre bonne santé et pour un développement durable. #JeMengagePourMaplanete [mention] [mention] (20/02/2020) 11. Biodiversité, développement durable, énergies renouvelables, .. Merci [mention] pour ce débat passionnant autour de la lutte contre le réchauffement climatique #Génération_Engagés (28/05/2020) Les deux autres classes regroupent en revanche des tweets focalisés sur des questions plus ponctuelles, qui pourraient être l’indication d’un usage plus restreint et plus spécifique du phraséoterme. Dans ces cas, le DD constitue souvent un complément de spécification, sans être l’objet de la prédication verbale, ou il
Du développement durable à la transition écologique dans les tweets
319
apparait aussi au sein de syntagmes figés (commissions des affaires économiques et du développement durable). Un bon nombre de tweets de la classe 1 concernent la « semaine européenne du développement durable » (sedd2020). Il s’agit souvent de discours qui présentent ou commentent les événements et les sujets de discussion de cette manifestation annuelle à visée de sensibilisation, qui se caractérisent par un ton positif et promotionnel. La promotion d’actions menées pour atteindre le DD fait également l’objet d’autres tweets de cette classe, qui aspirent à en valoriser l’agent (ex. 14). Un appel à l’engagement pour la réalisation du développement durable est aussi parfois présent. 12. #SEDD2020 | Semaine européenne du développement durable Éco-délégués, actions de sensibilisation, enrichissement des programmes.. Parce qu’elle construit les citoyens de demain, l’École joue un rôle majeur face aux enjeux écologiques et climatiques. @education_gouv (05/10/2020) 13. La lutte contre le changement climatique est l’affaire de tous. Aujourd’hui débute la Semaine Européenne Du Développement Durable ! L’occasion de réaffirmer notre engagement pour un numérique responsable à travers les mots de [mention] #SEDD2020 (18/09/2020) 14. NOUS NOUS DÉMARQUONS AVEC 8 CATÉGORIES ECO ÉNERGÉTIQUE Notre travail joue un rôle important dans les changements climatiques et nous sommes fiers de l’impact que nous avons sur le développement durable avec nos produits pour notre environnement (27/10/2020) Dans la classe 3, ce sont en revanche les objectifs du DD (odd) qui sont mis en avant et qui rappellent les divers enjeux condensés dans ce concept, en attirant en particulier l’attention sur deux questions – la pauvreté et les inégalités – qui, en revanche, ne sont pas autant abordées dans les tweets relatifs à la TE. En l’occurrence, on observe que les enjeux sociaux et environnementaux liés au DD sont explicités dans le cotexte de l’expression à la différence des aspects économiques. 15. Le meilleur moyen de mettre fin à la pauvreté, de réduire les inégalités et de lutter contre les changements climatique c’est d’atteindre les Objectifs de Développement Durables. #GlobalGoals #ODD #ForPeopleForPlanet (24/01/2020) 16. Les Objectifs de Développement Durable(ODD) donnent la marche à suivre pour parvenir à un avenir plus durable pour tous et faire face à : la pauvreté
320
Claudia Cagninelli
les inégalités la crise climatique la dégradation de l’environnement, le besoin de paix & justice #PlenBFC (16/11/2020)
3.2 Analyse des profils combinatoires et lexico-discursifs Après avoir repéré les thématiques principalement liées aux deux phraséotermes en fonction de la distribution cooccurrentielle des mots au niveau de l’unité textuelle constituée par chaque tweet, l’attention se déplace sur les cooccurrences lexicales et grammaticales les plus fréquentes dans un contexte plus restreint, en exploitant la fonction Word Sketch de Sketch Engine9 (Kilgarriff et al. 2014). Dans ce cas, l’analyse est lancée respectivement sur transition et sur développement, les deux substantifs étant principalement associés aux adjectifs écologique (1007 sur 1028 occurrences totales) et durable (762 sur 765) dans les deux sous-corpus ; cela empêcherait de biaiser les résultats. L’analyse des relations syntaxiques des deux phraséotermes montre avant tout leur rôle différent dans le discours. La TE fait souvent l’objet de verbes transitifs qui se caractérisent par des traits sémantiques pro-actifs et agentifs ainsi qu’axiologiquement positifs (cf. Tableau 3).10 On peut en effet observer que le verbe le plus employé en cooccurrence avec transition est accélérer, qui souligne la nécessité de rendre plus rapide la mise en œuvre de ce processus. Accélérer répond en outre à l’urgence climatique qui est souvent soulevée dans ces discours, une urgence qui détermine la nécessité d’agir dans l’immédiat. Il est ensuite suivi de réussir qui implique non seulement l’action mais aussi son accomplissement positif, tout comme par d’autres verbes pro-actifs tels que engager, faire, réaliser et mener. Les verbes qui font appel à l’action pour mettre en place la TE soulignent ainsi divers aspects de la dimension pro-active et agentive qui ressort souvent de l’analyse des cooccurrences verbales : – l’urgence à agir vite (accélérer), en sous-entendant aussi que l’on ne fait pas assez pour lutter contre les changements climatiques ou, du moins, que l’on n’agit pas assez rapidement ; – le fait de s’engager davantage à la fois concrètement et économiquement dans la TE (engager, faire, financer, réaliser, enclencher, mener, accompagner) ;
http://www.sketchengine.eu. Les tableaux 3–5 résument une sélection des résultats les plus pertinents obtenus via la fonction Word Sketch de Sketch Engine (Kilgarriff et al. 2014).
Du développement durable à la transition écologique dans les tweets
–
321
le fait de contribuer non seulement à la TE mais aussi à son succès, ce qui peut déterminer aussi une axiologisation positive du cotexte (réussir, réaliser, accompagner, assurer, favoriser, promouvoir).
Tableau 3 : Verbes avec transition comme complément. Mot-clé
Cooccurrent
Fréq.
Score
accélérer réussir engager faire financer placer réaliser enclencher mener accompagner être assurer favoriser permettre promouvoir
, , , , , , , , , , , , , , ,
transition
Au contraire, le DD n’est que rarement utilisé en tant que complément direct, alors qu’il apparait souvent en association avec une série de termes spécialisés du domaine écologique (notamment changement climatique, biodiversité) ou bien au sein de compléments de spécification (de + DD), d’argument (en matière de + DD, sur le DD) et de but (pour le DD). L’emploi privilégié de DD au sein de séries de termes coordonnés est également confirmé par le nombre plus élevé de mots avec lesquels il est mis en association ou bien en contraste dans le cotexte immédiat (Tableau 4). Par ailleurs, le DD est souvent utilisé dans des syntagmes constituant des compléments indirects, alors que la TE fait plus souvent l’objet de la prédication verbale. On pourrait donc se demander si ce différent comportement syntaxique pourrait être déterminé par le caractère formulaire consolidé de DD (cf. Krieg-Planque 2010) par rapport à l’introduction plus récente de TE. L’analyse des substantifs les plus utilisés en cooccurrence avec les deux phraséotermes (Tableaux 4 et 5) aide en outre à clarifier la négociation de leur sémantisme en discours ainsi que les implications pragmatiques qui en découlent. En effet, comme le souligne Veniard (2013, en ligne, §10), « la dimension associative du sens a été mise en évidence de manière nette par les outils de statistique
322
Claudia Cagninelli
Tableaux 4 et 5 : Substantifs en coordination ou en opposition à développement et transition. développement changement environnement biodiversité réchauffement transition lutte sécurité résilience énergie dérèglement éradication croissance urgence migration changements question enjeu santé humanité écologie climat transition lutte changement urgence plan réchauffement crise adaptation justice égalité emploi question santé engagement résilience
,
, , , , , , , , , , , , , , , , , , ,
, , , , , , , , , , , , , ,
textuelle, ce qui amène [. . .] à montrer comment le sens d’un mot dans un discours est infléchi par son contact régulier avec d’autres mots ». En ce qui concerne la TE, on relève tout d’abord la conception « instrumentale » qui caractérise ses emplois ordinaires, dans la mesure où elle est entendue comme
Du développement durable à la transition écologique dans les tweets
323
un moyen d’action pour répondre aux défis climatiques. Les mots identifiant le problème auquel la TE se propose comme solution (lutte, changement, réchauffement) et sa dimension imminente (urgence) sont en effet parmi les plus cooccurrents. De plus, comme il est ressorti de l’analyse thématique et comme le souligne Larrère (2021), l’aspect de la planification est attesté également par les cooccurrents nominaux, alors qu’il n’est pas autant présent dans les tweets relatifs au DD. Il nous semble également intéressant de souligner l’emploi du mot crise, qui non seulement renvoie à une situation qu’il faudrait chercher à dépasser sans délai, mais elle représente aussi une occasion d’agir pour changer le modèle actuel ; puisqu’elle marque une rupture avec un état de chose antérieur, elle peut devenir une opportunité pour opérer un changement positif (cf. par exemple Cagninelli 2023, à paraitre). La dimension agentive est donc mise en avant dans ce cas aussi. La TE ne fait toutefois pas appel à une forme de croissance et d’expansion – comme c’est le cas pour le DD – mais elle comporte plutôt des transformations même radicales qui visent à adapter le style de vie actuel aux ressources naturelles dont on dispose afin de garantir le respect et la préservation de notre planète. Une attention particulière à la dimension éthique et équitable du processus de transition ressort enfin de l’emploi des substantifs justice et égalité et notamment des adjectifs solidaire et social qui sont utilisés en coordination avec la TE (transition écologique et solidaire – 42 occurrences ; transition écologique juste – 23 occurrences ; transition écologique et sociale – 21 occurrences). Les substantifs cooccurrents avec développement montrent une contextualisation un peu différente du concept de DD. Si les questions environnementales sont les plus mobilisées – aussi bien en termes de défis (changement, réchauffement) que d’objectifs (environnement, biodiversité) – il ressort une attention particulière dirigée aux enjeux économiques (énergie, croissance) et sociaux (sécurité, migration, humanité). Il est en outre intéressant de remarquer la présence de transition, qui est toutefois suivi, dans ces occurrences, de l’adjectif climatique, qui est donc mis en relation avec le DD. Par contre, le cas contraire n’est pas attesté, bien qu’il arrive que les deux sont mobilisés à l’intérieur du même tweet. Si la dimension économique est considérée comme étant la plus spécifique du DD dans ses usages courants, on peut voir que les deux autres versants de la question tendent à être explicités linguistiquement – notamment sous forme nominale – dans son cotexte pour les mettre en relation avec les enjeux économiques. À cet égard, on pourrait se demander si la cooccurrence linguistique et discursive de ces deux aspects viserait à s’opposer à la perception d’une possible inconciliabilité entre la croissance économique entraînée par le DD et les enjeux sociaux et environnementaux. On remarque enfin que la question environnementale tend à être abordée aussi bien en relation avec ses causes (changement/réchauffement/dérèglement climatique) qu’avec les objectifs liés au DD (respect de la biodiversité, énergies renouvelables, etc.).
324
Claudia Cagninelli
3.3 Synthèse contrastive D’un point de vue lexico-discursif, le DD et la TE semblent s’opposer au niveau du type d’action à mener (croissance, expansion versus adaptation) face aux enjeux climatiques. Comme le soutient Bourg (2012), la TE permet de mieux mettre en avant la finitude de notre planète en soulignant la nécessité de modifier ce dont on dispose déjà – nos modèles économiques et sociaux – pour le rendre soutenable. D’après Larrère et al. (2016, 243), la TE implique « une transition vers une société sans croissance et néanmoins équitable et prospère, [. . .] qui anticipe des menaces certaines et l’éventualité d’une catastrophe à venir, afin de penser aux moyens de les éviter ». D’où la centralité de la notion d’adaptation attestée dans les cotextes de TE en association avec le sème [+transformation/passage] de transition. L’emploi de TE au lieu de DD permettrait ainsi de remplacer l’idée de croissance par l’idée d’adaptation, en recadrant l’approche des questions écologiques. L’anthropocentrisme et la conception instrumentale de la nature liés au DD laissent la place à une perspective moins économique, centrée sur l’écologie en tant qu’interaction équilibrée homme-nature, qui appelle l’humanité à transformer ses modes de vie pour les concilier avec le respect de l’environnement. Ce changement de perspective s’atteste non seulement dans les profils lexicaux des composants des phraséotermes développement [+croissance] durable [-pollution] [+biodiversité] [+énergies renouvelables] [+égalité sociale] et transition [+transformation/passage] écologique [+qui concerne tous les aspects de vie], mais aussi dans leurs co(n)textes d’emploi. Le profil discursif des deux phraséotermes dans les discours ordinaires sur Twitter comporte ainsi des enjeux pragmatiques différents, qui privilégient des versants différents de la question. La TE attire en particulier l’attention sur un processus de planification et de transformation concrète et imminente qui adapte les systèmes sociaux et économiques aux exigences de l’environnement naturel ; elle représente le moyen pour lutter contre les changements climatiques, en cherchant à éviter la détérioration ultérieure de la planète. Le DD se pose plutôt comme objectif à atteindre – comme en témoignerait aussi l’intitulé de la Stratégie nationale de transition écologique vers un développement durable, qui met en relation les deux phraséotermes selon un rapport de moyen à fin. D’après l’analyse des thématiques les plus fréquemment associées aux deux phraséotermes ainsi que de leurs profils combinatoires et lexico-discursifs dans les tweets, il nous semble possible de confirmer – d’un point de vue linguistique et discursif – les divergences mises en relief par Bourg (2012), Larrère et al. (2016, 2020) et Larrère (2021). On remarque avant tout un emploi statistiquement privilégié de TE par rapport à DD. Bien que les deux partagent un certain nombre de traits communs, ils se distinguent à plusieurs égards. Au niveau syntaxique, la TE est utilisée davantage en tant que complément d’objet direct, alors que le DD ap-
Du développement durable à la transition écologique dans les tweets
325
parait plus fréquemment dans des compléments indirects – notamment de spécification, d’argument et de but – et dans des syntagmes figés. Cela montre un rôle prééminent de la TE en qualité d’objet de la prédication verbale. Dans ce cas aussi, on pourrait se demander si c’est le divers degré de figement des deux phraséotermes qui influence les usages syntaxiques différents – et en conséquence leur rôle dans la construction discursive – plutôt que leur sémantisme. En effet, la création plus récente de TE pourrait déterminer son emploi privilégié en fonction de complément d’objet direct, constituant ainsi un élément informatif nouveau sur lequel porte la prédication. La condensation sémantique-pragmatique liée au caractère formulaire de DD serait en revanche exploitée davantage pour caractériser d’autres éléments informatifs au sein des tweets. On remarque en outre une mise en discours différente de la question de l’égalité sociale qui, d’une part, est nominalisée et représente un objectif à atteindre en parallèle au DD et, de l’autre, est réalisée surtout sous forme adjectivale constituant en conséquence un aspect qualificatif de la TE. D’un point de vue lexico-sémantique, le DD implique prioritairement le versant économique des problèmes écologiques, en soulignant l’idée de croissance ; une attention particulière est toutefois réservée aux objectifs à atteindre – aspect conceptuel également typique du secteur économique. À ce propos, nous faisons l’hypothèse que la perception du rôle de premier plan de la dimension économique pourrait déterminer la nécessité d’expliciter, dans le cotexte de DD, les deux autres piliers impliqués dans le concept, à savoir la justice sociale et la viabilité environnementale. Par contre, la TE met plutôt en relief dans son cotexte immédiat les notions de planification, d’adaptation et de justice, ainsi que la dimension pro-active et agentive du processus, qui est véhiculée notamment par les verbes dont le phraséoterme est le complément d’objet. Les différents contours lexicaux, sémantiques et discursifs des deux phraséotermes ressortent également de la comparaison des leurs profils combinatoires effectuée à travers la fonction Word Sketch Difference de Sketch Engine (Kilgarriff et al. 2014) et reproduite par l’image ci-dessous, après la fusion des deux corpus d’étude. Alors que les défis climatiques et la nécessité d’y faire face apparaissent en relation avec les deux phraséotermes (changement/réchauffement climatique, résilience) de manière assez équilibrée, on remarque une cooccurrence plus marquée de DD avec des termes renvoyant à l’écologie (environnement, biodiversité) et à la question des inégalités (sécurité [alimentaire]). Par contre, la TE est associée davantage à une action planifiée en réponse à une situation de crise, qui vise à l’adaptation des modèles socio-économiques actuels, selon un principe de justice sociale et économique.
326
Claudia Cagninelli
Figure 3 : Comparaison contrastive des profils combinatoires de transition et développement générée via la fonction Word Sketch Difference de Sketch Engine.
4 Conclusion L’exploration des usages de DD et de TE dans un échantillon de discours climatiques sur Twitter semble confirmer un emploi privilégié de TE, en ébauchant une contextualisation différente des deux unités terminologiques. Si des fréquences d’emploi diverses s’attestent au niveau quantitatif, les profils syntaxiques des deux phraséotermes témoignent de la centralité de la TE dans la progression thématique, qui fait souvent l’objet de verbes transitifs pro-actifs. Par contre, le DD apparait souvent dans des compléments indirects ou bien dans des séries de mots mis en coordination ou en opposition entre eux. Il arrive rarement qu’il soit utilisé en qualité de sujet ou de complément d’objet, comme le montre la pénurie de verbes qui y sont associés dans le cotexte immédiat. En outre, le DD s’impose dans sa dimension formulaire comme élément de syntagmes figés (semaine européenne du développement durable). Les profils lexico-discursifs des deux phraséotermes observés dans les discours sur Twitter laissent entrevoir des contextualisations thématiques privilégiées. La défense de l’environnement (biodiversité) comme réaction aux changements climatiques, la lutte à la pauvreté et aux inégalités sont les aspects les plus emphatisés dans le cotexte du DD pour compenser peut-être l’acception économique qu’il assume principalement dans les discours ordinaires et qui est également présente dans le contexte discursif. Le profil lexico-discursif de TE se caractérise en revanche par l’emphase sur la dimension pro-active qui fait appel
Du développement durable à la transition écologique dans les tweets
327
à une action immédiate, planifiée et engagée, en contribuant à rendre ce concept « plus opérationnel, plus concret et finalement plus efficace » (Boissonade 2017). Il contribue à véhiculer l’idée d’une action de transformation vers des modèles adaptés aux exigences de l’environnement naturel, en modifiant l’angle d’approche de la question. Cependant, malgré l’emploi privilégié de TE dans notre corpus de tweets, il faut signaler une présence assez limitée du phraséoterme dans les ressources terminologiques consultées, dont la définition est parfois circonscrite au domaine économique. Étant donné le volume limité de notre corpus d’analyse, cette étude ne prétend ni à l’exhaustivité ni à la généralisation des traits communs et des divergences qui ressortent de l’analyse. Elle voudrait toutefois montrer l’intérêt d’une exploration discursive des usages ordinaires de deux unités terminologiques en concurrence entre elles, afin de saisir leurs différences dans l’appréhension, la conceptualisation et la mise en discours de la question écologique. La comparaison de leurs profils lexico-discursifs dans cet espace discursif pourrait en effet contribuer à l’étude de la vulgarisation de ces termes ainsi que de l’évolution de leurs dimensions sémantique et discursive, bien que cette exploration doive être élargie à une quantité de données beaucoup plus vaste qui prendrait en considération des types et des genres de discours variés.
Bibliographie Bally, Charles, Traité de stylistique française, Paris, Klincksieck, 1909. Bendinelli, Marion, Segments phraséologiques et séquences textuelles. Questions méthodologiques et approches topologiques, Corpus 17 (2017), https://doi.org/10.4000/corpus.2844. Benveniste, Émile, Problèmes de linguistique générale 1, Paris, Gallimard, 1966. Benveniste, Émile, Problèmes de linguistique générale 2, Paris, Gallimard, 1974. Blumenthal, Peter, De la logique des mots à l’analyse de la synonymie, Langue française 150:2 (2006), 14–31. Blumenthal, Peter/Mejri, Salah (edd.), Les séquences figées. Entre langue et discours, Stuttgart, Franz Steiner Verlag, 2008. Boissonade, Léa, La transition. Analyse d’un concept, Théma Essentiel, Temis : Base documentaire du CRDD (Centre de Ressources documentaires Développement Durable), Paris, Commissariat général au développement durable/Ministère de la transition écologique et solidaire, 2017, https://www.ecologique-solidaire.gouv.fr/sites/default/files/Théma – Transition – Analyse d'un concept.pdf [dernière consultation : 07.11.2022]. Bourg, Dominique, Transition écologique, plutôt que développement durable, Vraiment durable 1:1 (2012), 77–96. Cagninelli, Claudia, Qu’en est-il de la question climatique face à la pandémie de Covid-19 ? Polarisations discursives sur Twitter, in : Paissa, Paola/Hamon, Yannick (edd.), Discours environnementaux. Convergences et divergences, Roma, Aracne editrice, 2023, à paraitre. Coquet, Jean-Claude, Note sur Benveniste et la phénoménologie, Linx 26:1 (1992), 41–48.
328
Claudia Cagninelli
Dincă, Danielă/Preite, Chiara, Les collocations verbales dans le discours juridique. De la terminologie vers la phraséologie, Phrasis 3 (2019), 136–147. Firth, John Rupert, Papers in linguistics 1934–1951, London, Oxford University Press, 1957. Fracchiolla, Béatrice, Écologie et environnement . Des mots aux discours. Mises en perspective historiques et discursives, Mots. Les langages du politique 119:1 (2019), 15–31. Gautier, Laurent, Terme, phraséoterme, phrasème. Question de délimitation en langue spécialisée, in : Hédi, Jatlaoui/Mejri, Salah/Majdūb, ʻIzz al-Dīn (edd.), Le continuum en linguistique, Sousse, Faculté des lettres et des sciences humaines de Sousse, 2004, 153–172. Gonzàlez ReyIsabel, La nouvelle phraséologie du français, Toulouse, Presses universitaires du Midi, 2021. Hausmann, Franz Josef, Isotopie, scénario, collocation et exemple lexicographique, in : Heinz, Michaela (ed.), L’exemple lexicographique dans les dictionnaires français contemporains, Tübingen, Max Niemeyer Verlag, 2005, 283–292. Hausmann, Franz Josef/Blumenthal, Peter, Présentation. Collocations, corpus, dictionnaires, Langue française 150:2 (2006), 3–13. Heiden, Serge/Magué, Jean-Philippe/Pincemin, Bénédicte, TXM : Une plateforme logicielle open-souce pour la textométrie – conception et développement, in : Bolasco, Sergio/Chiari, Isabella/Giuliano, Luca (edd.), Proceedings of 10th international conference on the statistical analysis of textual data – JADT 2010, vol. 2, Milano, Led Edizioni Universitaire, 2010, 1021–1032. Kilgarriff, Adam/Baisa,Vít/Bušta, Jan/Jakubíček, Miloš/Kovář, Vojtěch/Michelfeit, Jan/Rychlý, Pavel/ Suchomel, Vít, The Sketch Engine. Ten years on, Lexicography 1 (2014), 7–36. Krieg-Planque, Alice, La formule « développement durable ». Un opérateur de neutralisation de la conflictualité, Langage et société 134:4 (2010), 5–29. Larrère, Catherine, Pourquoi parle-t-on de « transition » écologique ?, The conversation (14 février 2021), https://theconversation.com/pourquoi-parle-t-on-de-transition-ecologique-154104 [dernière consultation : 15.04.2022]. Larrère, Catherine/Clerc, Marion/Federspiel, Claire/Salin, Mathilde, Éthique et justice dans la transition écologique, Regards croisés sur l’économie 26:1 (2020), 20–30. Larrère, Catherine/Larrère, Raphaël/Bouleau, Nicolas, Les transitions écologiques à Cerisy, Natures sciences sociétés 24:3 (2016), 242–250. Legallois, Dominique/Tutin, Agnès, Présentation. Vers une extension du domaine de la phraséologie, Langages 189:1 (2013), 3–25. Longhi, Julien, Du discours comme champ au corpus comme terrain. Contribution méthodologique à l’analyse sémantique du discours, Paris, L’Harmattan, 2018. Mayaffre, Damon, De l’occurrence à l’isotopie. Les co-occurrences en lexicométrie, Syntaxe et sémantique 9:1 (2008), 53–72. Mel’čuk, Igor, Vers une linguistique Sens-Texte, Paris, Collège de France, 1997. Mel’čuk, Igor, Tout ce que nous voulions savoir sur les phrasèmes, mais…, Cahiers de lexicologie 102:1 (2013), 129–149. Merleau-Ponty, Maurice, Phénoménologie de la perception, Paris, Gallimard, 1945. Petiot, Geneviève, Les mots de l’écologie, Mots. Les langages du politique 39:1 (1994), 69–78. Ratinaud, Pierre, IraMuTeQ : Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires [computer program], Version 0.7 alpha 2, 2014, http://www.iramuteq.org [dernière consultation : 21.11.2021]. Reinert, Max, Alceste – Une méthodologie d’analyse des données textuelles et une application : « Aurélia » de Gérard De Nerval, Bulletin of sociological methodology/Bulletin de méthodologie sociologique 26:1 (1990), 24–54.
Du développement durable à la transition écologique dans les tweets
329
Sinclair, John, Corpus, concordance, and collocation, Oxford, Oxford University Press, 1991. Tutin, Agnès/Grossmann, Francis, L’écrit scientifique. Du lexique au discours, Rennes, Presses universitaires de Rennes, 2013. Veniard, Marie, Du profil lexico-discursif du mot « crise » à la construction du sens social d’un événement, in : Londei, Danielle/Moirand, Sophie/Reboul-Touré, Sandrine/Reggiani, Licia (edd.), Dire l’événement. Langage, mémoire, société, Paris, Presses Sorbonne Nouvelle, 2013, http://books.ope nedition.org/psn/3222 [dernière consultation : 07.11.202].