Revue Romane, Bind 4 (1969) 2Le syntagme du nombre cardinal en français modernePAR CARL VIKNER 0. IntroductionLe syntagme du nombre cardinal (pour plus de commodité désigné dans la suite par «le syntagme cardinal») constitue un domaine de la grammaire qui, jusqu'à une époque récente, n'avait pas particulièrement retenu l'attention des grammairiens. En effet, les manuels de grammaire se limitent ordinairement à donner une liste renfermant les formes simples (un, deux, ... onze, douze, ... vingt, trente, ..., etc.) plus quelques échantillons de formes composées (vingt et un, deux cents, etc.). A partir d'une telle liste, le lecteur (étranger - car il va de soi que, pour le francophone, cette liste n'offre aucun intérêt pratique) est censé pouvoir construire des cardinaux corrects et éviter les constructions incorrectes. Et il le peut effectivement. Cela revient à dire que le lecteur établit lui-même, plus ou moins consciemment, une grammaire qui engendre les cardinaux - ce qui n'est possible, sans doute, que parce qu'il existe une très grande affinité entre Íes systèmes des numéraux cardinaux des différentes langues indo-européennes: un Français, un Anglais, un Allemand, un Russe, un Scandinave, etc. auront plutôt tendance à trouver «naturel» qu'on exprime le nombre 2963 au moyen d'un syntagme cardinal composé de six formes simples et le nombre 3000 à l'aide de deux formes simples seulement. Qu'il n'y ait là rien de «naturel» se révèle par le fait que la représentation en système décimal utilise quatre symboles pour chacun des deux nombres. Comme les descriptions traditionnelles des numéraux cardinaux remplissent leur tâche de manière satisfaisante d'un point de vue pédagogique, on pourrait juger superflu de tenter une description plus exhaustive. Or, il y a, au moins, deux raisons d'effectuer pareille tentative: I°. La méthode
traditionnelle, implicite, est insuffisante lorsqu'il
2°. Une grammaire
précise et exhaustive du syntagme cardinal
offriraitbeaucoup Side 202
raitbeaucoupd'intérêt sur le
plan théorique. Brainerd (p. 4l)1 note «Number ñames . .
provide a small, usually well-defined, corpus upon which
Et il enchaîne:
«Thé use of formai grammars in thé description of number ñames and numerical expressions has thé advantage of giving a potentially complète description of thèse corpuses, unlike many of thé descriptions given in thé classical grammars. In thé case of a formai grammar for a corpus such as thé numerical expressions of a given language, inadequacies in thé description given by thé grammar at any stage become readily apparent and can be corrected by introducing changes in thé grammar.» De fait, il se trouve justement que ces dernières années ont vu, avec l'avènement de la grammaire generative, s'accroître l'intérêt pour la structure des numéraux, accroissement dont témoigne surtout la publication récente, par H. Brandi Corstius, du livre Grammars for Number Ñames. Cet ouvrage contient une série d'articles sur la description formelle des numéraux de différentes langues (hollandais, anglais, roumain, etc.); en particulier, Barron Brainerd a inséré (pp. 47-48), dans son article «A Transformational-Generative Grammar for Rumanian Numerical Expressions», une grammaire des cardinaux français, sur laquelle je reviendrai plus 10in.2 I! convient de mentionner également l'ouvrage intéressant de Hans Chr. Sorensen: Tal - numre - navne. Glossematiske studier (Copenhague, 1969), qui aborde le problème des noms de nombre d'un point de vue assez différent du mien. Dans ce qui suit, je vais tâcher de décrire la structure du syntagme cardinal (dans la langue écrite). Pour ce faire, je me servirai des méthodesélaborées par les tenants de la grammaire generative. Qu'on me pardonne d'avance ce que la notation peut avoir de rebutant pour le 1 : Les références renvoient à la bibliographie de la page 229. 2: Je n'ai pu, malheureusement, - parce que j'en ai eu connaissance trop tard - me procurer l'article mentionné dans Corstius, 1968a (p. 107): R. P. G. de Rijk: «Une grammaire «context-free» pour la génération mécanique des noms de nombre français», in: Braffort and F. van Schepen, Automation in language etc., Euratom CID. Brussels, 1967. Side 203
non-initié.
Mais j'ai cru pouvoir me dispenser d'explications
supplémentairesà J'ai laissé de côté les problèmes d'accord entre le cardinal et un éventuel substantif le suivant (un/une, ainsi que le flexif du nombre dans le substantif, etc.). Ces phénomènes, ne concernant que le rapport entre le syntagme cardinal et d'autres syntagmes dans la phrase, n'ont pas d'incidence sur la structure interne du syntagme cardinal. Par contre, quand il se présente des problèmes de ce genre à l'intérieur du syntagme, je me suis efforcé d'en tenir compte. Bien que le
syntagme cardinal m'intéresse d'abord et surtout en tant
le pont aérien .
. a comporté mille huit cent trente-sept vols il n'y a pas lieu
de distinguer ici cet emploi de celui où le cardinal
figure Le nombre des
hélicoptères américains abattus . . est ainsi porté,
selon les puisque la
structure du syntagme cardinal reste exactement la même
Ce qui est intéressant avec le syntagme cardinal, et ce qui en fait en quelque sorte une espèce de «microlangue», c'est qu'à partir d'une trentaine de formes simples, il est possible de construire - selon des règles rigoureuses - un très grand nombre de formes composées: «Indeed, when we employ thousand, million, billion in American English we can make IO12 -1 number ñames which would take about 100 years to list at 300 ñames per second. Yet any speaker of English can construct any given one of them in a few seconds» (Brainerd, p. 41). Pourtant le système n'utilise qu'une infime partie des combinaisons possibles: ainsi *dix-cinq, *deux trentes, * trente douze, *trente vingt-deux, *quarante cents, *cent deux cents, *mille douze cents, *deux millions mille milliards, etc. etc. sont totalement exclus. Il convient donc d'établir avec précision une grammaire qui permette d'engendrer toutes et rien que 3: Je pense surtout aux ouvrages de Ruwet (1967) et de Bach (1964). Side 204
les
combinaisons correctes, et d'examiner ensuite la
structure que cette 1. G1 - la grammaire de BrainerdCommençons par examiner la grammaire que propose Brainerd (pp. 47-48) pour les numéraux cardinaux français et que je désignerai dans la suite par GÌ. Le numérotage des règles employé par l'auteur se réfère à sa grammaire des cardinaux roumains, je l'ai remplacé par des numéros consécutifs: Vocabulary :
Terminal: œ, yn,
do, trwa, katr, sèk, sis, set, z//Y, nœf, di, dis, diz,
Auxiliary: S, SO,
R, Sit S2, T, T^ T2, Q, /?,/?', N, U. initial
string: #S#. Production
rules: Contcxî-frcs
rulcs! 1. - ' Side 205
5 O. 1
8 9. 1U- a. 12. Context-sensitive
rules: 13. 14. Side 206
15. for p=£ U and /?
not of thé form a miljô or a miljair. 16. GÌ appelle tout
d'abord quelques remarques sur des fautes dues peutêtre
L'auteur note les formes di, dis, diz dans son vocabulaire terminal. Pourquoi ne pas y inclure également se, si, siz, ifi ? Dans la règle 10, il marque l'alternative di ¡dis. Pourquoi pas diz aussi ? Et pourquoi n'y a-t-il pas d'alternative dans la règle 7? L'emploi de o et
de y semble quelque peu fortuit. Dans la liste du
vocabulaire auxiliaire (c'est-à-dire non-terminal), R
16 ¿è\ ou bien il faudra
introduire Q directement dans les règles 3 et 4, sinon
Dans la règle 14, il faudra supprimer l'indicateur de frontière (#). Qu'il ne s'agisse pas là d'un lapsus se révèle à la page 49, où l'auteur dit expressément: «Tn thé case of French, un is inflected for gender, only when it occurs alone before a noun syntagma».4 C'est inexact: un s'accorde toujours en genre quand il occupa la dernière - ou la seule - position du syntagme cardinal: vingt et un
anciens amiraux (Julien, Empire 368); mais: vingt et une
régions (Monde 30/3 1969, 23) la fermeture de
vingt et une autres banques nationales (Afrique 31/3
1969, 20) Cf. aussi
Grevisse (§ 405). 4: L'expression «before a noun syntagma» me semble peu heureuse. Je préférerais inside. Side 207
Défaut peut-être plus grave: GÌ n'engendre pas les formes d'empiétement («overlapping»), c'est-à-dire que des nombres comme 1270 ou 2 942 000 000 ont aussi bien les formes mille deux cent soixante-dix et deux milliards neuf cent quarante-deux millions que douze cent soixantedix et deux mille neuf cent quarante-deux millions. Or, G! n'engendre que les premières. Voici quelques
exemples des formes d'empiétement : les quinze cents
élèves des cinq écoles nationales de la marine marchande
Le conseil des
ministres a porté à 2 942 millions le programme
d'économies des contrats totalisant 26.700 millions de dollars (Julien, Empire 370) 3.429 millions de dollars .. les 29.000 millions investis en Europe .. une augmentation de 1.251 millions .. un total de 5.297 millions (ib. 226-227) 1 273 millions de mètres cubes (Calvet, Société 270) 22 942 millions
de dollars (Afrique 31/3 1969, 16). Dans le cas des
nombres allant de 1100 à 1699, c'est même cette forme
Ce qui me gêne
surtout dans GÌ, c'est la description structurale
qu'elle (1) S0 (2) R (3) C (12) S2 sa T
(6) d0 sa T
A cette
dérivation correspond l'indicateur syntagmatique
(«phrase structure Side 208
On voit que la structure associée à l'élément duz est plutôt «abondante». En effet, l'arbre de la figure 1 nous apporte l'information structurale que duz fait partie de la catégorie T2 (c'est-à-dire la classe des éléments susceptibles d'être postposés à swasât sans e, cf. la règle 10), laquelle fait partie de la catégorie T! (une des classes d'éléments susceptibles d'être postposés à katr v£, cf. la règle 10), qui elle-même fait partie de la catégorie T (une des classes d'éléments susceptibles d'être postposés à sa, cf. la règle 12). Or, pour le syntagme considéré, c'est uniquement cette dernière information qui paraît pertinente. Cette «abondance»
de structure devient encore plus évidente si l'on
Side 209
A remarquer que
l'arbre associé à diznœf ne révèle même pas que ce
Cette particularité provient de l'économie de la grammaire de Brainerd. En effet, à l'exception de dis, 3z et swasât, les éléments terminaux ne figurent qu'une seule fois dans les règles indépendantes du contexte. Cependant, comme l'a bien dit R. W. Langacker5, la description structurale qu'une grammaire associe aux suites terminales engendrées importe plus que l'élégance des règles elles-mêmes. Je vois mal à quoi correspondrait, dans l'intuition du sujet parlant, les structures de la figure 2. C'est pourquoi je
proposerai une grammaire, certes moins élégante et
2. G2 - une grammaire des cardinaux danoisLa difficulté d'établir une grammaire simple des cardinaux français tient notamment à ce que les cardinaux de un à dix-neuf se répartissent en 5 ou 6 classes différentes, à cause des différences de combinabilité de ces éléments. Tel n'est pas le cas des cardinaux danois, et il ne sera sans doute pas inutile d'esquisser d'abord une grammaire engendrant ceux-ci (Gì): 1. 2. 3. 5: «Transformational analysis does not consist just in finding a set of rules that work; rather, what thé linguist is aller is thé RIGHT set of rules, one that makes true structural claims about thé nature of a speaker's linguistic compétence» (Langacker, p. 108). Side 210
4. 5. 6. , 8. 9. NDI-19^en, to,
tre, fire, fem, seks, syv, otte, ni, ti, elleve, tolv,
10. NDII-19 ->
elieve, tolv, tretten, fjorten, femten, seksten, sytten,
11. NDÍ-9 -> en,
to, tre, fire, fem, seks, syv, otte, ni J'utilise des
majuscules pour désigner les éléments non-terminaux, des
Cette grammaire est une grammaire de constituants indépendante du contexte (« context-free phrase structure grammar»). Il faut la compléter par des règles transformationnelles obligatoires, qui tiendront compte des problèmes d'accord interne: T.l. Side 211
T.2. G2 répartit les éléments de en à nitten en trois classes différentes (règles 9 à 11). NDI-19 est la classe des éléments qui n'admettent pas d'antéposition ni de postposition d'autres éléments. NDI-9 est la classe des éléments susceptibles d'être antéposés à tyve, tredive, etc. (cf. règle 8). NDII-19 se justifie uniquement par le fait qu'il faut exclure ti de la règle 7, pour éviter le syntagme *ti hundrede. Le caractère compliqué des règles 3 à 7 ainsi que la répétition des éléments terminaux dans les règles 9àll sont compensés par la description structurale très simple que la grammaire assigne aux suites terminales. En voici quelques exemples : HUN1 de la
règle 7 permet d'engendrer les formes d'empiétement avec
Side 212
cationdela règle 5 donnerait :(o tusinde to hundrede, etc.6 Il semble tentant, à première vue, de réunir les règles 6 et 7 en une seule, mais ce n'est pas possible, car HUN apparaît dans les règles 3 à 5 et donnerait ainsi naissance à des syntagmes agrammaticaux, tels que *tre tusinde ioogtyve hundrede. 3. G3 - une grammaire des cardinaux français3.1. Structure du syntagme cardinalLa grammaire
suivante (G}) est construite en partie selon les mêmes
1. 3. 4. < 2 6: La délimitation de la liste des éléments antéposables présente toutefois des difficultés. Dirait-on, par exemple, tredive hundrede ou nioghalvfems hundrede^. J'en doute. Side 213
6. 8. 9. 10. 11. 12. 13. 14. NF2-9 ->•
deux, trois, quatre, cinq, six, sept, huit, neuf
15. NF7-9 -> sept,
huit, neuf Les règles 1 à 15 ne constituent qu'une partie de GT,, à savoir la grammairede constituants indépendante du contexte qui assigne aux syntagmes cardinaux leur structure profonde. Les problèmes d'accord interne seront traités au § 3.2. En attendant. G? engendrera donc des syntagmes tels que *un millions, *deux cents trois, *quatre-vingts-dix, etc., mais ceci n'a Side 214
aucune
influence sur la structure profonde des syntagmes et il
me paraît Voici d'abord, à
titre d'illustration, une dérivation avec l'indicateur
(1) #CARD# (2) MIO (4) DIZAINE
millions MIL (6) DIZAINE
millions NF2-19 mille CENT (7) DIZAINE
millions NF2-19 mille NF2-9 cents DIZAINE (9) cinquante
millions NF2-19 mille NF2-9 cents DIZAINE G3, à l'instar
de G! et de G2, ne donne pas de règles pour les
cardinaux 7: Pourtant, pour ne pas trop agacer le lecteur, j'utiliserai les formes orthographiquement correctes, sauf dans les cas où il s'agit expressément de syntagmes engendrés par 03. Side 215
lion,etc.Mais, d'une part,
ces syntagmes sont «pour ainsi dire inusités»
Je n'ai pas inclus zéro parmi les éléments terminaux, car il n'entre dans la formation d'aucun constituant. Si on tient à le considérer comme un cardinal, on pourrait l'introduire directement dans la règle 2, mais, dans ce cas-là, ne faudrait-il pas y inclure également plusieurs, comme le fait Togeby (1951, p. 162)? - Dans une grammaire des nombres décimaux, il faudrait naturellement placer zéro sur un pied d'égalité avec les autres éléments terminaux, puisque, dans une telle grammaire, il ferait partie intégrante du système. Les éléments MIO1 et CENT1 donnent naissance aux formes d'empiétement. Pour million, il s'agit des cardinaux de mille millions à neuf cent mille millions; pour cent, il s'agit seulement des cardinaux de onze cents à dix-neuf cents (cf. p. 207), puisque, à l'encontre de l'usage danois, des formes telles que *vingt-deux cents sont exclues, cf. Togeby, 1965, p. 154. - II est nécessaire d'avoir aussi bien les éléments nonterminaux MIO et CENT que MIO' et CENT1, parce que MIO figure dans la règle 3 et CENT dans les règles 3 à 6, où ils contribuent à la formation de constituants placés à un niveau supérieur. Si l'on se contentait d'un élément CENT en réunissant les règles 7 et 8 en une seule, la règle 6, par exemple, donnerait naissance à des syntagmes comme *douze cents mille douze cents. - Qu'il ne soit pas nécessaire d'avoir également un élément MIA1 tient au fait que MIA n'apparaît pas dans des syntagmes supérieurs. Si j'avais voulu faire engendrer par G3 des syntagmes contenant trillion, il m'aurait fallu scinder la règle 3 en deux pour établir les constituants MIA et MIA1. - II n'y a pas d'élément MIL1. C'est que les formes contenant mille ne peuvent recouvrir le domaine de million: ainsi 1500000 se lit un million cinq cent mille et non *quinze cent mille.1A 7 A: Et pourtant. . . Lors de la correction des épreuves de cet article, Henrik Prebcnicn me communique cet exemple inquiétant' Quelque quinze cent mille habitants des provinces orientales (A. Fontaine: Histoire de la Guerre Froide. I, Paris, Fayard, 1967, p. 204). Side 216
quatre-vingts figure comme un seul élément terminal et n'est pas analysé en vingt précédé de quatre. Il y a plusieurs raisons à cela: D'abord, il me semble douteux qu'une telle analyse corresponde à l'intuition du sujet parlant.8 Ensuite, cela compliquerait inutilement la grammaire, et le fait que vingt admette un élément antéposé dans ce seul cas ne me paraît pas une raison suffisante pour le traiter isolément. Enfin, selon Togeby (1965, p. 153), quatre-vingts se prononce [katra ve] et non [katvê], ce qui pourrait indiquer qu'il ne s'agit pas de l'élément terminal quatre, puisque quatre cents, quatre mille se prononcent bien [kat sa], [kat mil]. - Cependant, la manière dont quatre-vingts s'attache les éléments postposés dénote une affinité avec les éléments cent(s) et mille. Cf.: quatrevingt-un et cent un, mais: vingt et un. Et aussi: quatre-vingt-onze et cent onze, mais : soixante et onze.9 Comme dans G2, mais à la différence de GÌ, la règle 2 permet d'engendrer plus directement (c'est-à-dire avec «moins de» structure) des syntagmes tels que trois, dix-neuf, vingt-deux, qui auront les structures suivantes : 8: En danois, firs(indstyve) est senti comme un seul élément terminal à part entière et n'évoque pas l'idée 4 x 20. Il est vrai que, là, l'élément tyve a disparu depuis longtemps de l'usage courant. 9: Huit cent quatre-vingt-onze trains (Monde 28/3 1969, 10), cent quatre-vingt-onze enseignants (ib. 16/4 1969, 13), cent soixante et onze votants (ib. 28/3 1969, 20), En 1967, deux cent soixante et onze prêtres auraient quitté la vie religieuse (ib. 15/4 1969, 12). Cf. Gougenheim, p. 69, Grevisse, § 403, Rem. 1, Togeby, 1965, p. 153. Side 217
On remarquera
que, contrairement à ce qui se produisait pour
l'engendrement GT, répartit les éléments terminaux un, deux ... dix-neuf en 6 classes (règles 10 à 15). NFI-19 comprend tous les éléments concernés. Les éléments appartenant à NFI-19 peuvent apparaître avant et après milliards (règle 3) et millions (règles 4 et 5), après mille (règle 6), cent (règles 7 et 8) et quatre-vingt (règle 9). NF2-19 comprend ceux des éléments de NFI-19 qui sont susceptibles d'être antéposés à mille (règle 6). NFII-19 comprend les éléments susceptibles d'être antéposés à cents dans les formes d'empiétement (règle 8). NFIO-19S comprend les éléments susceptibles d'être postposés à soixante à l'aide d'un trait d'union, mais non à vingt, trente, ... cinquante (règle 9). NF2-9 comprend les éléments susceptibles d'être antéposés à cents dans les formes sans empiétement (règle 7) et postposés à vingt, trente, etc. à l'aide d'un trait d'union (règle 9). NF7-9 comprend les trois éléments susceptibles d'être postposés à dix (règles 10 à 13). On voit que NF7-9 constitue un sous-ensemble de NF2-9, et NF2-9 un sous-ensemble de NF2-19, etc. Il aurait été plus élégant de faire exprimer ce fait explicitement par la grammaire, par exemple au moyen des règles suivantes (G3A) :10:10 C'est justement une
formulation analogue11 qui confère aux syntagmes
iOA. 11 A. 12A. 14A. 15A. 10: dix figure, isolé, dans la règle 11A et la classe NFIO-19S a disparu. Cela est dû au fait que NFII 19 n'est pai un sous-ensemble de NFIO 19S. 11: Cf. G,, règles 5 à 9. Side 218
engendrés par la
grammaire de Brainerd ce «surplus» de structure que
Tandis que G^A
lui imposerait cette structure: Ce dernier
indicateur syntagmatique nous fournit pas mal
d'informations Togeby (1951, p.
162) estime qu' «il n'y a pas de différence
fonctionnelle Side 219
d'accord avec lui. sept, huit et neuf se distinguent effectivement des autres en ce qu'ils sont les seuls à pouvoir apparaître après dix. dix se singularise de plusieurs manières: il ne peut pas apparaître avant cent, ni après vingt, trente, etc., alors que les autres le peuvent; il peut s'adjoindre un élément postposé, les autres, non. Le phénomène des sous-ensembles se manifeste également si l'on examine les règles 3 à 8 de 63. Par exemple, l'ensemble des constituants spécifiés dans la règle 4 après millions est un sous-ensemble des éléments spécifiés dans la règle 3 après milliards. En tenant compte de ce fait, on pourrait simplifier considérablement la grammaire (j'omets les formes d'empiétement): 3A. 4A. 6A. 7A. 9A. Suivent les
règles 10A, etc., de G3A. Mais ici encore
la simplicité des règles s'acquiert au prix d'une
description Side 220
Comment les rapports de subordination sont-ils rendus par nos grammaires? Il se trouve qu'ici G^ a au moins un avantage sur GÌ. Prenons, par exemple, le syntagme deux millions trois mille. G\ lui assigne la structure suivante: alors que 03
produirait cet arbre: Side 221
Ce qui signifie que G! analyse le syntagme en quatre constituants immédiats, n'indiquant pas si trois se rattache à millions ou à mille. G$ exprime clairement que trois se rattache à mille, les deux éléments étant des constituants de MIL. Il y a toutefois un rapport très important qui n'est indiqué explicite ment ni par GÌ ni par Gs. Ainsi, en regardant la figure 7, on se rend compte que sept et douze sont considérés comme se rapportant à cents d'une manière identique. Ce phénomène ressort peut-être plus clairement si l'on se sert de parenthèses étiquetées pour représenter la description structurale (cette représentation est exactement équivalente à la représentation par «arbre»). Voici le même syntagme parenthétisé: (((sept)NF2-9 centS
(doUZe)NFI-19)cENl)cARD Pourtant, pour
obtenir la valeur numérique 712 - c'est-à-dire pour
1° multiplier
cent par sept, 2° additionner le
résultat de cette multiplication et douze. Personne ne
songerait à additionner d'abord et à multiplier ensuite.
On pourrait faire
exprimer explicitement ces rapports par la grammaire
7A- Side 222
78. Avec cette
modification, 03 affectera une autre description
structurale Ou en
représentation parenthétisée: ((((sept)NF2-9 CCnts)cENT-M
(doUZe)NFM9)cENT-A)cARD CENT-M sera alors
interprété: «les constituants immédiats doivent être
Toutefois, pour une application automatique de G3, si l'on veut, par exemple, faire traduire par un ordinateur des cardinaux français en chiffres arabes ou dans une autre langue, cette nouvelle analyse n'est pas indispensable. On pourrait se tirer d'affaire par les trois conventions suivantes: 1° A l'intérieur
d'un même constituant, les éléments antéposés doivent
2° Le rapport
d'antéposition équivaut à la multiplication ; Mais ces conventions ne peuvent s'appliquer à GÌ, qui ne distingue pas dans tous les cas de manière suffisamment claire entre antéposition et postposition. Pour G2, il y aura des complications supplémentaires parce qu'il y a des cas où l'élément antéposé, dans un syntagme cardinal danois, doit être additionné, voir G2 règle 8. Side 223
Les éléments
terminaux de 03 se répartissent en cinq grandes classes
: Classe 1 : un, deux,
trois, quatre, cinq, six, sept, huit, neuf, onze, douze,
treize,
quatorze, quinze, seize. (Les éléments qui
n'admettent pas d'autres éléments postposés Classe 2: dix, vingt,
trente, quarante, cinquante, soixante, quatre-vingts.
(Les éléments qui
admettent un élément postposé.) Classe 3:
cent(s), mille. (Les éléments qui
admettent à la fois des éléments antéposés Classe 4:
millions, milliards. (Les éléments qui
admettent un élément postposé et exigent Classe 5: -
(trait d'union), et. (Les éléments qui
apparaissent uniquement entre un élément La distinction
entre les classes 3 et 4 est nécessitée par le fait qu'à
près de cent
experts (Express 18/9 1967, 22) Ces classes ne se
dégagent pas nettement de G3. On pourrait les faire
1. 2 3. Mais on voit
immédiatement que, pour formuler les règles spécifiant
les Side 224
constituants de
COMPOSÉ (c'est-à-dire de formes comme vingt-deux,
3.2. Problèmes d'accord internePour donner aux
syntagmes engendrés par Gj une forme en accord T.l. T.2. T.3. T.2 et T.3
transforment des syntagmes comme *deux cents vingt et
Chevalier et al. (§ 403) sont d'avis que «cette bizarrerie orthographique, qui date de la fin du XVIIe siècle, semble peu à peu sortir de l'usage». Cette opinion semble - malheureusement - un peu trop optimiste. Du moins n'ai-je pas trouvé, parmi les quelques centaines d'exemples que j'ai relevés, un seul qui profite de la libéralité accordée par l'arrêté min istèrici du 26 février 1901. Cf.: Quatre-vingts
postes d'assistants (Monde Hebdomadaire 28/11 1968, 8)
quatre-vingt-dix
lits (ib. 24) quatre-vingt-dix-neuf ans (Monde
27/3 1969, 5) quelque deux
cents barons de l'empire (Julien, Empire 351) Treize mille
demandes d'inscription ont été reçues, dont quatre mille
six cents avec ses huit
cent quatre-vingt-trois filiales (Monde 28/3 1969, 6)
Side 225
Huit cent quatre-vingt-onze trains (ib. 28/3 1969, 10) deux cent cinquante mille personnes (Zegel, Idées 19) sept cent mille étudiants (Observateur 17/3 1969, 9) un million trois cent mille familles (ib. 8/5 1968, 22) deux millions huit cent mille (Monde 27/3 1969, 12). Même la règle
«superbizarre» qui veut que cents et quatre-vingts
il y a deux cents
millions d'années (Afrique 31/3 1969, 44) Lorsqu'il s'agit d'engendrer des suites terminales, les règles transformationnelles ne posent pas de problèmes particuliers pour le traitement automatique. Il suffit d'examiner les suites engendrées par G$ avec leur description structurale pour voir si une des suites à gauche de la flèche dans T.l, T.2 et T.3 s'y trouve et, dans l'affirmative, lui substituer la suite correspondante à droite de la flèche. Le problème est autrement délicat si l'on veut faire analyser par la machine des suites terminales données. Dans ce cas-là, les règles de la grammaire doivent être considérées non plus comme des règles d'expansion, mais comme des règles de réduction. Autrement dit, il faut les lire à rebours, de droite à gauche. Pour appliquer une règle comme T.2, il faut donc savoir si, dans une suite donnée, se trouve un constituant DIZAINE: mais cela, on ne peut pas le savoir avant d'avoir analysé la suite, ce qu'on ne peut pas faire avant d'avoir appliqué la règle T.2, s'il le faut. Cette difficulté tient au fait que les règles transformationnelles sont dépendantes du contexte. Il serait donc intéressant de pouvoir exprimer les faits d'accord à l'aide de règles indépendantes du contexte. Dans notre cas, cela est parfaitement possible puisque l'ensemble des syntagmes que nous considérons est un ensemble fini. On pourrait, par exemple, construire une grammaire G4 en modifiant les règles de 03 de manière que celles-ci engendrent l'ensemble des syntagmes orthographiquement corrects et rien que ceux-là. Ces modifications entraînent évidemment une complication assez considérable de la grammaire, mais les syntagmes engendrés par G4 seront structuralement équivalents à ceux de G3. Voici les règles de Gd (je ne donne pas celles qui restent identiques aux règles correspondantes de GV): Side 226
3. 6. 7. 7A. 8. 9. Side 227
9A. II y a encore une autre manière de résoudre ce problème à l'aide de règles indépendantes du contexte. Cette méthode m'a été suggérée par Peter Moller-Nielsen. D'abord, il faut entourer l's final dans les règles 3, 4, 7 et 8 de GT, par des parenthèses: milliard(s), million(s), cent(s). J'appellerai G5 la nouvelle grammaire qui résulte de ces modifications. Si l'on désigne par L(Gi) le langage (c'est-à-dire l'ensemble des suites terminales) engendré par une grammaire GÌ, on voit que L(GS) contient plus de suites que L(G3), parce que G5 engendre maintenant toutes les suites qui forment des syntagmes corrects, plus quelques suites incorrectes (*deux cent, *deux cents trois, par exemple). Il s'agit maintenant de construire une autre grammaire (Gs) qui, par des règles indépendantes du contexte, engendre toutes les suites incorrectes de L(GS), plus, éventuellement, d'autres suites incorrectes, mais aucune suite qui soit un syntagme cardinal correct. Cette «antigrammaire» servira de «filtre» pour les suites de L(Gs), en ce sens que seulement celles des suites de L(GS) qui ne seront pas acceptées par Gg (qui n'appartiennent pas à L(Gg)) sont des syntagmes cardinaux corrects. Symboliquement: une suite S est un syntagme cardinal français si et seulement si Se L(GS) p) L(G6). Voici comment
pourrait être conçue Gg : 1. Side 228
2. , 4. 5. Ainsi *deux cents
trois, qui appartient à L(GS), n'est pas un syntagme
ANTICARD (1) T cents T"
(3) T1 cents TERM
(4) TERM cents
TERM (5) deux cents
TERM alors que deux cent trois, qui appartient également à L(GS), est correct puisqu'il ne peut pas être engendré par G6. En effet, cent, dans la règle 1 de G£, n'apparaît qu'immédiatement avant millions ou milliards, ou bien comme élément final d'une suite. * Je tiens à remercier cordialement mes amis et collègues, M. Peter Moller-Nielsen (Institut de Mathématiques Supérieures de l'Université de Copenhague), qui m'a fourni de précieuses suggestions relatives au sujet de cet article, ainsi que M. François Marchetti (Institut d'Études Side 229
Romanes de
l'Université de Copenhague), qui a bien voulu me prêter
Cari Vikner
COPENHAGUE
BIBLIOGRAPHIEOuvrages de
référence: Bach, Emmon. An
Introduction to Transfor mattonai Grammars. New York,
Holt, Brainerd, Barron. «A Transformational-Generative Grammar for Rumanian Numerical Expressions». Cahiers de Linguistique Théorique et Appliquée 4 d967), pp. 35-45. Réimprimé dans Corstius. 1968b, pp. 41-52. Je renvoie à cette dernière Chevalier, J.-C.,
C. Blanche-Benveniste, M. Arrivé et J. Peytard.
Grammaire Larousse Corstius, H.
Brandi. 1968a. «Automatic Translation between Number
Ñames». Corstius, H.
Brandì, éd. 1968b. Grammars for Number Nantes.
Foundalions of Gougenheim,
Georges. Système grammatical de la langue française.
Paris, d'Artrey, Grevisse,
Maurice. Le Bon Usage. Gembloux, Duculot, 1964. 8e
édition revue. Langacker, R. W.
Compte rendu de A. Koutsoudas: Writing Transformational
Ruwet, Nicolas.
Introduction à la grammaire générative. Paris, Pion,
1967. Togeby, Knud.
1951. Structure immanente de la langue française.
Copenhague, Togeby, Knud.
1965. Fransk grammatik. Copenhague, Gyldendal, 1965.
Textes cités:
Calvet, Henri: La
Société française contemporaine. Paris, Nathan, 1956.
Jeune
Afrique. Julien, Claude:
L'Empire américain. Paris, Grasset, 1968. Le Monde -
Sélection hebdomadaire. Zegel, Sylvain:
Les idées de mai. Paris, Gallimard, Collection «Idées»,
1968. |