Revue Romane, Bind 11 (1976) 2

A. E. Creore: A Word-Index to the Poetic Works of Ronsard. T. I—II. Maney and Son Ltd, Leeds, 1972 (Compendia: Computer-Generated Aids to Literary and Linguistic Research, vol. 5, part I-II). XII + 1662 p. Joachim du Bellay: La Deffence et illustration de la langue françoyse. Concordance établie par Suzanne Hanon; traitement automatique: Poul Bonne Jorgensen et Ulf Hagen Kollgaard. Odense, Odense University Press, 1974 (Etudes romanes de l'Université d'Odense, vol. 6). 187 p.

B. Munk Olsen

Side 364

Comparé à celui de l'ancien français ou du français classique, le vocabulaire du moyen français a toujours été un peu délaissé par les philologues. Il est vrai que nous avons maintenant le grand Dictionnaire de la langue française du XVIe siècle d'Edmond Huguet (7 volumes, Paris 1925-1967), mais ce travail, conçu initialement - en 1895 - comme un lexique des textes littéraires les plus importants de la Renaissance, tient compte uniquement des mots qui ont disparu ou qui ont subi des changements de sens après le XVIe siècle, et il ne permet pas aux spécialistes de se faire une idée de l'ensemble du lexique de cette époque.

Grâce à l'utilisation de plus en plus répandue des ordinateurs électroniques en vue de la confection d'index et de concordances, des progrès notables ont été enregistrés ces dernières années dans ce domaine (on trouve une description des projets en cours dans l'article de Richard L. Frautschi, «Récent Quantitative Research in French Studies»: Computers and the Humanities, vol. 7, no. 6 (1973), p. 365). Jusqu'à présent, deux «outputs» ont été publiés : l'index des œuvres poétiques de Ronsard, procuré par A. E. Creore (1972), et la concordance de La deffence et illustration de la langue françoyse de Joachim Du Bellay, due à Suzanne Hanon (1974).

Le travail de Creore est un index, dans lequel le vocabulaire poétique de Ronsardest inventorié sous 11.889 lemmes normalisés (graphies en principe modernes)sans que les mots concrets du texte n'y figurent. Après chaque lemme sont rassemblées les références numériques, qui renvoient au volume, à la page et à la

Side 365

ligne de l'édition de Paul Laumonier (Œuvres complètes de Ronsard, Paris 1914-1967); deux chiffres à la fin de la référence indiquent l'année de parution du texte où se trouve le mot en question. S'il s'agit d'une variante (figurant dans une version qui n'a pas été publiée par Laumonier), les deux chiffres sont précédés de la lettre V. L'index n'est pas complet: en sont exclus les mots-outils les plus fréquents(«à, de, en, je, tu, il, on, nous, vous, se, le, la, un, et, qui, que, ne, ni, pas, mon, ton, son, etc. »), de même que les emplois des formes d'être et d'avoir comme verbes auxiliaires.

Le travail de Suzanne Hanon est une concordance non lemmatisée de type KWIC («Key-Word-in-Context»); elle est complète et comprend les quelque 17.700 mots de l'ouvrage de Du Bellay. Les mots-vedettes, qui correspondent aux formes concrètes du texte sans aucune normalisation des graphies, y sont placés dans une colonne verticale au milieu de la page, entourés d'espaces blancs pour être mieux mis en relief. Le contexte qui précède le mot-vedette est de 50 caractères environ el celui qui suit de 30 à 50 caractères (il dépend de la longueur du motvedette), ce qui donne un contexte tout à fait satisfaisant d'une vingtaine de mots en moyenne. La référence numérique à la fin de chaque ligne renvoie à la page et à la ligne de l'édition publiée par Henri Chamard (Paris 1945). La présentation typographique est très agréable et l'emploi de majuscules, de lettres grecques et d'accents permet de reproduire fidèlement le texte original; les 23 mots grecs utilisés par Du Bellay sont réunis dans une petite concordance à la fin du volume (p. 187).

Si l'on compare l'index de Creore et la concordance de Suzanne Hanon, il faut reconnaître que le premier prébcnte Jes avantages non négligeables:

1) II est moins encombrant et plus économique
qu'une concordance (il a été possible
siblede condenser les 375.000 renvois en
1482 pages de 4 colonnes chacune).

2) Les mots sont lemmatisés, si bien qu'on est toujours sûr d'y trouver les références à toutes les formes qui se rapportent à un même lemme.

3) Le procédé permet d'établir facilement, à partir des lemmes, des statistiques et des classifications selon différents critères. Ainsi Creore donne, en appendice (p. 1483-1652), une liste alphabétique des lemmes avec leurs fréquences, une liste des lemmes par ordre dégressif des fréquences et, enfin, une liste des lemmes par ordre alphabétique inverse. Toutefois, les mots-outils les plus fréquents, qui avaient été exclus de l'index, ne figurent pas dans les statistiques, ce qui nous semble une lacune regrettable.

Le principal inconvénient d'un index est qu'il est très incommode à l'usage: pour les mots rares et peu utilisés les problèmes ne sont pas trop graves, mais dès qu'un mot atteint une certaine fréquence d'emploi, l'utilisation de l'index exige un va-et-vient continuel entre les références et le texte, et est souvent cause d'erreurs et d'une importante perte de temps (il faut prendre des notes au fur et à mesure, ou copier les exemples). Un grammairien qui s'intéresserait à l'emploi du pronom indéfini tout chez Ronsard, n'aurait certainement jamais l'idée saugrenue d'en chercher les occurrences à partir des 5200 références qui remplissent 78 colonnes serrées de l'index, alors qu'il serait infiniment plus simple de dépouiller les textes mêmes.

La concordance de type KWIC présente aussi quelques inconvénients, qui correspondent,en gros, aux avantages de l'index:elle est plus encombrante et plus chère (elle demande à peu près quatre fois plus de place qu'un index); elle ne permet pas d'établir facilement des statistiques utiles et, comme les mots n'y sont pas lemmatisés, l'utilisateur doit faire un certaineffort,

Side 366

taineffort,surtout lorsqu'il s'agit de textes dont le système graphique n'est pas fixe (il faut penser, par exemple, à chercher «ivrogne» sous la forme yvrogne).

En revanche, il est infiniment plus facile et plus rapide de consulter une concordance: dans la plupart deseas, les contextes sont largement suffisants pour qu'on puisse se rendre compte sur-le-champ si l'emploi d'un mot ou d'une forme présente un intérêt ou non. Même en ce qui concerne les mots les plus fréquents, il est techniquement possible, le plus souvent, de tirer quelque chose d'une concordance: il suffit, par exemple, d'un coup d'œil pour qu'on soit renseigné sur l'ordre des pronoms personnels chez Du Bellay (les mots qui suivent les mots-vedettes étant classés par ordre alphabétique); une telle recherche aurait demandé des heures de travail à partir d'un index - à supposer qu'il fût complet.

Tout compte fait, il nous semble que la solution retenue par Suzanne Hanon est de loin la meilleure: une concordance KWIC est plus facile et plus rapide à établir, le maximum de travail étant laissé à l'ordinateur, et elle est d'une consultation plus aisée; en outre, elle est la seule qui soit vraiment appropriée à des recherches linguistiques et la seule qui puisse raisonnablement être complète.

Suzanne Hanon est sur le point de terminer une concordance complète du même type, qui traitera YHeptaméron de Marguerite de Navarre. On y trouvera les quelque 180.000 mots de ce texte correspondant à 1840 pages imprimées. Les références numériques renverront à l'édition d'Yves Le Hir (Paris, P.U.F., 1967) et aux numéros de la journée et de la nouvelle. Il y aura également, en appendice, une table des équivalences avec l'édition de Michel François (Paris, Garnier, 1950), qui est certainement la plus courante. On ne peut que souhaiter à Suzanne Hanon de pouvoir la faire imprimer primeret de mettre ainsi à la disposition de tous les chercheurs un instrument de travail d'une valeur inestimable pour notre connaissance de la langue et de la littérature de la Renaissance française.

Copenhague