Revue Romane, Bind 4 (1969) 1

B. MUNK OLSEN: Anvendehen af elektronisk databehandling ved løsningen af filologiske opgaver: konkordanser, indices verborum. (Le Traitement automatique appliqué à la solution de problèmes philologiques: concordances, indices verborum.) Københavns universitets fond til tilvejebringelse af læremidler. Copenhague, 1968, 128 p.

CarL Vikner

Side 102

L'indexation automatique constitue un domaine déjà classique de la mécanolinguistique. C'est peut-être parce que, justement dans ce domaine, les avantages de la mécanisation semblent le plus évidents. Il n'est pas besoin, en effet, de souligner l'intérêt capital que présenterait pour les linguistes et critiques littéraires de toutes sortes (lexicographes, syntacticiens, stylisticiens, historiens de langue, etc.) le fait de posséder des index totaux ou sélectionnés des textes d'une période donnée ou même d'un seul ouvrage. Jusqu'à une époque récente, les entreprises de ce genre semblaient chimériques ou du moins impliquaient un travail énorme et fastidieux. Or, l'adaptation des ordinateurs électroniques au dépouillement des textes a rendu possible l'élaboration automatique d'index et de concordances.

C'est à une tâche de ce genre que s'est attelé B. Munk Olsen en se proposant d'établir des concordances de trois ouvrages du philosophe anglo-français Jean de Salisbury (t 1180). Le livre de Munk Olsen rend compte des méthodes qui ont présidé à son travail. Il comporte trois parties: aspects techniques, établissement d'une bande magnétique contenant le texte, utilisation de cette bande. Dans les deux dernières parties, l'auteur donne un excellent aperçu des multiples problèmes que soulève le traitement automatique des textes, et il décrit soigneusement les solutions que lui-même a apportées à ces problèmes. 11 s'agit notamment des problèmes de codage, de préédition, de références, de corrections, de iemmatisation, de présentation des textes de sortie, etc. Particulièrement intéressante me paraît l'utilisation qu'a faite Munk Olsen du lecteur optique.

Je ne m'arrêterai qu'à un seul de ces problèmes, crucial celui-là: comment réaliser les programmes qui dictent à la machine les opérations à effectuer. Munk Olsen esquisse trois procédés: utilisation de programmes déjà existants, programmation par un programmeur professionnel (non linguiste) et programmation par l'utilisateurlui-même (p. 52-54). Munk Olsen a opté pour la deuxième solution tout en reconnaissant qu'elle pose des problèmes délicats de coopération entre le linguiste et le programmeur, ce dernier ne comprenant ordinairement rien aux problèmes spécifiquement linguistiques. Bien que, actuellement, cette solution soit de loin la plus répandue en mécanolinguistique, il me semble qu'il faille absolument préconiser le troisième procédé: le linguiste - comme tout autre scientifique qui désire utiliser l'ordinateur - doit apprendre à programmer. Avec un langage comme l'Algol, c'est chose relativement facile qui fera que le linguiste apprendra à maîtriser la machine

Side 103

au lieu d'en devenir l'esclave. Nombre de questions linguistiques (par exemple les définitions d'entités comme mot, phrase, préfixe, désinence, etc.) sont résolues à l'intérieur des programmes, et c'est très précisément la tâche du linguiste que de résoudre ces questions. S'il ignore le langage de programmation, il n'aura qu'une influence superficielle sur ces décisions et sera peut-être même hors d'état de les comprendre.

L'épineuse question d'éviter la préédition1 n'est résoluble que si le linguiste connaît à fond son instrument de travail et ses possibilités. Munk Olsen se demande par exemple comment réussir, sans préédition, à faire distinguer par la machine un point d'abréviation d'un point tout court (p. 83). Cependant, il n'est pas impossible de programmer une machine de sorte qu'elle puisse distinguer, à l'aide du contexte immédiat, ces deux signes de ponctuation, c'est-à-dire de définir la notion de limite de phrase.

A qui désire s'initier aux techniques d'élaboration automatique de concordances, l'ouvrage de Munk Olsen apporte une aide inestimable. Ce n'est pas un de ses moindres mérites de nous montrer un romaniste qui s'attaque courageusement aux nombreuses difficultés que rencontre le linguiste quand il aborde cette discipline nouvelle et singulièrement prometteuse.

COPENHAGUE



1 : La préédition d'un texte consiste a ajouter a certaines entités du texte des. codes particuliers, par exemple un .v pour marquer un substantif, un astérisque pour marquer le début d'une phrase, etc.