Revue Romane, Bind 25 (1990) 2Paraphrases et relativespar Henrik Prebensen 0. IntroductionII y a 13 ans, j'ai publié, en collaboration avec mon collègue et ami, Ebbe Spang-Hanssen, un opuscule en danois sur la typologie des propositions relatives: Defranske relativsœtningers typoiogi, Romansk Institut, Kobenhavns Universitet, 1977. Malheureusement, nous n'avons jamais trouvé le temps de rédiger une version plus définitive de ce travail. Des changements radicaux dans les conditions de travail des romanistes danois nous ont conduits l'un et l'autre vers d'autres occupations. Pour ma part, j'ai donné un résumé de nos idées dans un article sur La proposition relative dite attributive, Revue Romane, XVII, 1, 1982. Cet article a donné lieu a une discussion avec Henri Van den Bussche publiée en 1986 (Revue Romane, 21,1). Un travail de linguistique computationnelle sur la compréhension des syntagmes nominaux (désormais: SN) et des anaphores, m'a conduit à tenter une simulation sur ordinateur de notre théorie. Tout en confirmant la solidité de celle-ci, cette expérience a montré comment on peut soumettre certaines hypothèses linguistiques formalisées ou formalisables à des tests expérimentaux semblables à ceux qu'on rencontre dans les sciences traditionnellement qualifiées d'expérimentales. Elle a aussi contribué à modifier quelques détails dans la théorie primitive. 1. La problématiqueLes grammairiens ont toujours eu du mal à trouver des critères concernant la Pour la distinction entre propositions relatives explicatives (parenthétiques) et détenninatives/restrictives, il y a des cas canoniques qui ne posent pas de problèmes, par exemple lorsque l'antécédent est un nom propre. Mais dès que le contexte se complique, les critères font défaut.
Side 241
A l'origine des difficultés se trouvent surtout l'imprécision dans la délimitation Faute de critères syntaxiques, on a, par exemple, mis dans la même catégorie que les propositions relatives canoniques, des propositions qui n'en sont pas, telles les relatives indépendantes. Ou bien, on a voulu appliquer la distinction à des propositions qui, bien que relatives, ont une syntaxe différente des relatives canoniques. On a essayé de définir la distinction en utilisant des concepts flous tels que «nécessaire au sens général» ou «essentiel» pour définir le concept de determinative, et l'on s'est trouvé en difficulté devant des exemples comme le suivant: (1) Devant Marot qui tirait son poignard, Sagon s'enfuit (Jean Plattard, Clément Il en est allé de même lorsqu'on s'est appuyé sur l'idée d'extension pour (2) Molière a écrit une tragédie qui est perdue. Certains ont douté de l'importance d'une distinction précise. Pourquoi ne (3) La hausse des matières premières qui ont baissé depuis un an a été déterminée il faut posséder des critères sûrs. 2. La typologieLa typologie que nous avons établie dans notre étude écarte d'abord un (4) a. c'est Paul qui est venu (cf. Paul est venu) des relativesprésentatives: (5) a. il y a quelqu'un qui vous envie (cf. quelqu'un vous envie) et les relatives possessives: (6) a. j'ai quelqu'un qui m'attend (cf. quelqu'un m'attend)
Side 242
Ces types obéissent à des contraintes sémantiques spécifiques et font ressortir des rapports morpho-syntaxiques entre l'antécédent et le pronom relatif qu'on ne retrouve pas dans les relatives canoniques. Ils comportent être et avoir dans des acceptions sans contenu sémantique spécifique. Grammaticalement, on peut les décrire comme des transformations de phrases simples. Cette description correspond bien à leur emploi sur le plan pragmatique. Quant aux relatives pour lesquelles la distinction explicatifldétemiinatif est pertinente, on peut utiliser le rapport anaphorique entre l'antécédent et le pronom relatif. Pour cela, on a recours à des transformations paraphrastiques En explicitant la relation anaphorique, on peut constater si l'antécédent constitue une base anaphorique par rapport au pronom relatif ou non, par exemple, si l'ensemble des référents du discours couvert par l'antécédent et celui couvert par le pronom sont co-extensifs, comme dans le rapport normal entre un SN et son terme anaphorique. Si la relation: antécédent-pronom relatif est un rapport anaphorique ordinaire, Si l'antécédent est un nom propre ou un SN entièrement déterminé par le (7) a. je n'ai pas vu Paul qui a dû rater son train Un paraphrasage au moyen d'une proposition incise ou postposée rend explicite (8) a. je n'ai pas vu haui - // a dû rater son train On peut généraliser et formaliser (7) et (8) dans le schéma suivant (0 (9) a. b. et définir le concept de relative explicative (parenthétique) ainsi: (10) Une proposition relative est explicative (ou parenthétique) si elle est paraphrasable S'il n'y a pas de rapport anaphorique entre l'antécédent et le pronom, d'où il
Side 243
dans la détermination sémantique de l'extension de l'antécédent, qui est ( 11) a. la question qui se pose maintenant est la suivante ont comme paraphrases: (12) a. une question se pose maintenant - elle est la suivante et sont formalisables par le schéma: (13) En comparant (9)a. et (13), on voit que les deux définitions prédisent l'existence (14) a. b. c. Ainsi: (15) a. la question qu'on se pose maintenant est la suivante On peut donc ajouter la définition: (16) Une proposition relative est determinative si elle est paraphrasable à l'aide On remarque que la définition (14) marche dans les deux sens: (10) bis Une proposition relative dont l'antécédent est indéfini est explicative si Une relative restrictive restreint le domaine d'extension de l'antécédent: (17) Molière a écrit des comédies qui sont perdues équivaut à: (18) a. Molière a écrit des comédies - certaines d'entre elles sont perdues En formalisant, on obtient les deux schémas suivants: ( 19) (20) II s'ensuit la définition (21):
Side 244
(21) Une proposition relative est restrictive si elle est paraphrasable à l'aide des Dans tous les cas ci-dessus le SN enchâssant la relative est spécifique. Lorsqu'il s'agit de SN non-spécifìqiies, l'application des critères de définition se complique du fait que les SN non-spécifiques sont sous le contrôle d'un opérateur: verbe d'attitude, expression modale, négation, quantificateur, conjonction, etc. Or, il est difficile, généralement, d'extraire un SN non-spécifique ou une partie d'un tel SN du contrôle de l'opérateur, comme l'exigeraient les paraphrases de type (10),(13) et (19): (22) a. Si Molière a écrit des comédies qui sont perdues, on les retrouvera un jour On peut, dans ces cas, avoir recours aux formes variantes (lObis) (14) et (20) (23) a. Si certaines des comédies qu'a écrites Molière sont perdues, on les retouvera Restent les propositions relatives dites attributives. Elles obéissent à un ensemble de contraintes spécifiques, mais appartiennent aux relatives explicatives, comme le montre la co-extension entre l'antécédent, qui peut être un nom propre ou un pronom personnel, et le relatif: (24) a. Je vois Pierre qui joue dans le jardin Je n'entrerai pas dans plus de détails, mais terminerai par le tableau d'ensemble (25) 1. clivées
Side 245
3. Le paraphrasage, outil de méthodeLa paraphrase a toujours joué un rôle important dans les raisonnements linguistiques. Sous la forme de principe d'heuristique, par exemple: épreuve de commutation chère à Hjelmslev. Comme dispositif formel permettant d'identifier et d'effectuer des opérations syntaxiques correctrices: transformations Avant tout, elle sert d'outil de vérification au grammairien ordinaire. Celui (26) a. son plus grand désir est de voyager peut avoir recours à ces paraphrases: (26) b. son plus grand désir est-il de voyager? et utiliser dans son raisonnement des schémas qui souvent restent implicites, (27) Le signe d'équivalence, «< = > », pose un problème. Les paraphrases ne sont pas des identités, ni ici, ni en général. Quel que soit le changement opéré au niveau de la forme, on peut l'investir d'une signification. Même dans la paraphrase entre l'actif et le passif, l'équivalence sémantique n'est pas évidente. Néanmoins, le pivot du raisonnement grammatical est souvent l'identité postulée entre des paraphrases. Le grammairien est amené à distinguer entre différence accidentelle et identité essentielle dans le maniement des paraphrases. Le grammairien, souvent, aura l'impression qu'un certain «bon sens», un «sentiment linguistique», des intuitions le guident. Sandfeld, à qui l'on doit le raisonnement (26)-(27), n'insiste pas sur une évidence: les faits (les exemples) sont parlants {L'lnfinitif, 1943, §§44 ss.) Malheureusement, lorsque le «bon sens» s'avère réparti avec parcimonie, Formaliser un raisonnement, une théorie, une méthode, revient à choisir une représentation symbolique de ses concepts fondamentaux, donner des règles syntaxiques pour en dériver des expressions complexes (formules), trouver des règles de transformation ou de calcul permettant de relier les formules entre elles de façon incontestable et finalement spécifier des règles
Side 246
sémantiques (ou d'interprétation) pour établir le rapport entre les formules Le but d'une formalisation est d'introduire la calculabilité et la décidabilité dans la recherche pour voir si une controverse est d'ordre technique (dans l'application de concepts sur lesquels on est en principe d'accord, par exemple), ou d'ordre théorique (sur la validité d'un concept quel que soit son degré de précision, par exemple.) L'idée directrice des définitions à la base de notre typologie est qu'elles • (28) Pour maintenir leurs recettes, les constructeurs d'automobiles qui doivent et l'ensemble des schémas ci-dessus, il faut (i) pouvoir identifier les schémas (9) a. (13) (ii) pouvoir identifier les syntagmes de (28) qui correspondent aux «variables» (29) le N:= les constructeurs d'automobiles (iii) effectuer la transformation paraphrastique prescrite: (30) a. les constructeurs d'automobiles ont relevé leurs tarifs - Le test donne deux solutions différentes: (30)a. - sens d'une relative explicative, (30)b. - sens d'une relative determinative. Pour interpréter ce résultat, il faut trouver à (30)a. et b. des contextes appropriés, soit le contexte original, soit des contextes inventés. (30)a. et b. sont tous les deux appropriés dans un contexte, s'il y a un (30)a. décrit une situation où l'ensemble (tous lés constructeurs) ont relevé
Side 247
(30)b., par contre, décrit une situation où seul un sous-ensemble est menacé Le test est opérationnel en ce sens qu'il précise comment faire pour obtenir une réponse à la question concernant le type de la relative, et que les opérations qu'il prescrit sont mécaniquement applicables. Ce qui n'est pas mécanique et qui ne pourra jamais le devenir dans ce genre de test, c'est l'évaluation du résultat. Dans le cas d'un test linguistique, il faut comprendre la langue objet. Je reviens à la question de l'équivalence entre paraphrases. Si (30)a. et b. sont tous les deux des paraphrases de (28) et différents l'un de l'autre, ces paraphrases ne sont pas des équivalences. Néanmoins, l'évaluation du test a comme prémisse qu'elles le sont: les constructeurs...qui et soit les constructeurs...ils soit certains constructeurs.dls doivent avoir le même sens pour être interchangeables. Pour expliquer cette contradiction apparente, nous avons recours à la logique et aux techniques de la mesure. Le fondement de la mesure est la possibilité de décider, avec la précision adéquate, de l'équivalence entre deux objets. Ce jugement est d'ordre empirique et non formalisable. Par contre, l'étalon, c.-à-d. l'ensemble d'objets canoniques qu'on propose pour effectuer les mesures, est, lui, un objet formel. L'étalon réduit les possibilités de celui qui mesure. Pour décider de la longueur d'un objet, on force le mesureur à choisir dans une collection d'objets bien délimités, représentés par les petits traits sur le mètre, l'objet qui lui semble le plus exactement représenter l'objet mesuré sous le rapport pertinent. Avoir une longueur (un poids ou un volume) dans un système de mesure veut donc dire avoir la même longueur (le même poids ou volume) qu'un objet bien déterminé de l'étalon avec le degré de précision requis par la tâche. L'étalon définit un ensemble de classes d'équivalence dans un univers mesuré. Chaque classe a un représentant: l'objet canonique. Ma table mesure 1,74m. Cela signifie que l'objet de l'étalon métrique désigné par l'expression «1,74m» la représente. Cette mesure n'est certes pas exacte au micron près. L'équivalence absolue n'existe pas en dehors des mathématiques. Il suffit que la précision soit adéquate pour mon but. L'étalon permet de prendre des décisions rationnelles dans des cas litigieux. La typologie proposée ici repose sur un étalon qui comprend les trois schémas canoniques primaires: (9), (13), (19), et les deux schémas secondaires(14) et (20). Elle requiert l'identification d'un objet linguistique avec le représentant d'une classe à l'aide d'un schéma canonique. L'enquêteurest
Side 248
teurestforcé de faire un choix dans un ensemble restreint. Il doit par la suite Parfois, la quantité d'informations présentes est insuffisante pour effectuer ce choix. C'est le cas de (28) où le choix entre les deux sens (30)a. et b. n'est possible, en pratique, que si le contexte contient les informations nécessaires sur la situation des constructeurs d'automobiles. Pour conclure provisoirement, - le paraphrasage est un outil de méthode qui peut être formalisé à - le but de la formalisation est de prescrire un procédé quasi mécanique - la formalisation contribue ainsi à une clarification théorique et méthodique en séparant clairement les questions de technique des questions de validité; une classification opérationnelle n'est pas nécessairement valide ni l'inverse - la question de savoir si la typologie ici proposée est opérationnelle peut être discutée rationnellement; le travail que nous avons publié en 1977 s'efforce de montrer qu'elle l'est; pour réfuter cette preuve, il suffit d'alléguer un matériel empirique où les tests sont effectivement - d'un tout autre caractère est la question de savoir si la typologie est valide; nous avions essayé de la justifier en démontrant qu'elle est conforme à l'intuition et qu'elle est fructueuse: elle permet par exemple de formuler des règles grammaticales claires sur l'emploi du subjonctif, du passé simple, etc., et d'expliquer les phénomènes sémantiques. Dans la section suivante, je voudrais montrer comment on peut utiliser 4. Typologie des relatives, paraphrases et simulationUn procédé formalisé, quasi mécanique est déjà un algorithme. Les opérations Puisqu'il est possible de réaliser une évaluation du sens sur ordinateur, il
Side 249
Si une machine peut simuler la compréhension d'expressions d'un certain On peut monter une expérimentation selon les lignes suivantes: (i) Un ordinateur peut effectuer des actions. On peut donc le programmer pour l'amener à exécuter des procès, par exemple activer un robot, réel ou simulé sur l'écran, jouer aux échecs ou à d'autres jeux, dessiner des figures, analyser un texte, consulter une base de données, etc. Appelons monde l'ensemble des états et des processus qu'on peut obtenir dans une telle application. Ainsi l'échiquier, les pièces, les différentes situations d'un jeu, les mouvements, les stratégies, etc. constituent le monde contrôlé par un programme d'échec. (ii) On peut ensuite implémenter une interface, basée sur un dictionnaire, une grammaire syntagmatique augmentée et un moteur d'inférence, le tout capable d'engendrer des représentations sémantiques à partir de phrases et d'expressions entrées en langue naturelle et de les interpréter dans le monde d'un programme. (iii) L'interface n'a pas besoin d'être excessivement grande, puissante et compliquée. Au contraire, élément d'un montage expérimental, on a intérêt à ne pas la surcharger de mécanismes encombrants qui nuiraient à la transparence. Il suffit qu'elle donne à l'utilisateur le sentiment d'avoir un accès linguistique au monde, par exemple, de pouvoir poser certaines questions, donner des ordres, etc. (iv) Dictionnaire, grammaire et moteur d'inférence doivent incorporer dans leur formalisme les hypothèses sur le phénomène de langue à vérifier expérimentalement. Un utilisateur qui tape une phrase au clavier, a une intention et, partant, des idées sur des réponses appropriées. Si la machine réagit en accord avec son attente, il conclura que le message a été «compris» (ou que le programme donne l'illusion de comprendre.) S'il accepte la réaction de la machine comme naturelle, son jugement, qui n'a rien de spécifiquement linguistique, corrobore les hypothèses incorporées. Ici, il s'agit de réaliser une confirmation expérimentale d'hypothèses sur On simule pour cela le monde classique des objets (blocs, pyramides, etc.) du fameux programme SHRDLU de Winograd, dans lequel opère un robot capable de déplacer les objets et de répondre à des questions sur leurs positions. Une partie de l'interface linguistique, qui nous intéresse ici, est capable
Side 250
(31) a. Regarde l'objet blanc qui se trouve sur le bloc qui vient d'être déplacé et place-le sur un bloc que porte le grand bloc noirl b. Mets un bloc sur la table qui soutient la pyramide] c. Quel objet qui supporte un autre objet se trouve sur la table? Pour interpréter les SN et les propositions relatives, la grammaire sépare d'abord les SN définis: le bloc (qui), celui (qui), le (pronom), des SN indéfinis: un bloc (qui), quel objet (qui). Le déterminant est considéré comme contenant des informations sur l'unicité du réfèrent. Si le déterminant est défini, le moteur d'inférence essaiera de l'interpréter en posant des questions à deux bases de données dynamiques qui représentent le monde à son état actuel et le discours précédent. En délimitant les syntagmes minimaux de gauche à droite: le bloc noir, - le bloc noir sur la table, - le bloc noir sur la table qui supporte une pyramide, il vérifiera s'il existe un bloc noir unique soit dans le monde, soit dans le discours précédent (une base anaphorique.) Si un SN défini, antécédent d'une proposition relative, a un réfèrent unique, il constitue une base anaphorique complète, et le pronom relatif est un terme anaphorique. Le schéma de paraphrase valable est le schéma (9)a. Pour constater cela, le moteur d'inférence transforme la relative en interrogative totale: est-ce que le bloc noir supporte une pyramide? et cherche à trouver une réponse à cette question. Si la réponse est oui, il aura validé la paraphrase correspondant à (9)a. Si Si l'antécédent est défini, mais sans avoir un réfèrent unique, la relative doit être analysée selon le schéma (13). Le moteur d'inférence transforme la relative en interrogative partielle: quel bloc noir sur la table supporte une pyramide? Si la réponse à cette question donne la référence à un bloc précis: le petit bloc noir, par exempie, le moteur d'inférence aura validé la paraphrase correspondant à (13). Si la réponse est aucun ou plusieurs, il aura de nouveau décelé un désaccord entre les présuppositions du discours (où la relation supporter une pyramide prétend définir un être unique) et la réalité. Si l'antécédent est indéfini: un bloc qui se trouve surla table, la question du réfèrent unique ne se pose pas. Le SN doit être analysé selon l'un des schémas (9)a. ou (19)/ Le moteur d'inférence transformera la relative en interrogative totale contenant un indéfini à la place du pronom relatif: est-ce qu'un bloc se trouve sur la table? Si la réponse trouvée par le système est oui - accompagnée du nom de
Side 251
Si la réponse est oui, plusieurs, c'est soit le schéma (9)a., soit le schéma (19)/ qui entre en jeu. Si le moteur d'inférence peut achever l'interprétation de la phrase entière en choisissant un objet quelconque parmi les blocs désignés, l'interprétation valide le schéma (9)a. Si ce choix se limite à un seul bloc déterminé, elle valide le schéma (19)/ La raison en est que l'ensemble des objets désignés par la relation se trouver sur la table n'est pas inclus dans l'ensemble déterminé par la relation que définit le prédicat de la proposition supérieure (cf. Molière a écrit une comédie qui est perdue - dans l'interprétation selon (19)/ il y a des comédies écrites par Molière qui ne sont pas perdues et des comédies perdues qui ne sont pas écrites par Molière). Comme dans les autres cas, une réponse négative révèle un désaccord Les opérations effectuées en interprétant (31)a.-c. peuvent être représentées (32) a. Regarde l'objet blanc qui se trouve sur le bloc qui vient d'être déplacé et On voit que le moteur d'inférence transforme les relatives en interrogatives et non en principales comme dans les schémas paraphrastiques que nous avons proposés dans le paragraphe 2. La raison en est un changement de perspective locutionnelle. Les schémas originaux étaient conçus dans la perspectivedu locuteur. Lui connaît déjà les référents du discours qu'il est en train d'encoder. Sa tâche est de trouver les formules qui permettent à son interlocuteur de les identifier. Il peut choisir pour cela la construction relative,mais il pourrait aussi choisir d'autres types d'expressions. En effet, on pourrait imaginer une société dirigée par un fou, ayant décidé pour des raisons insondables de punir de la peine de mort tout emploi de propositions
Side 252
relatives. Y aurait-il une seule pensée que les habitants de cette société ne Le moteur d'inférence voit un message linguistique dans la perspective du décodage. Pour interpréter le discours, identifier les objets auxquels réfère le message et ajuster sa version de l'univers du discours à la version du locuteur, il doit poser des questions et y répondre. Lorsqu'il s'agit de propositions relatives, ces questions prennent la forme des interrogatives ci-dessus. On peut donc mettre en parallèle les mouvements d'encodage et de 6. ConclusionUn paraphrasage formalisé à l'aide de schémas canoniques a servi à établir La formalisation aboutit à un procédé quasimécanique, donc décidable, La validité de la typologie peut être justifiée en démontrant qu'elle est conforme à l'intuition et qu'elle est fructueuse. Cependant, on peut aussi profiter de son caractère opérationnel pour monter une expérimentation par simulation sur ordinateur. L'ordinateur peut contrôler un monde restreint. Une interface peut simuler Cette interface peut incorporer dans son formalisme les hypothèses sur Lorsque la machine réagit en accord avec l'attente d'un utilisateur, ce
Henrik Prebensen Université de Copenhague
Side 253
RésuméUne hypothèse sur la typologie des propositions relatives, conforme à l'intuition linguistique |