Revue Romane, Bind 26 (1991) 1

Nouvelle classification des langues romanes

par

Witold Manczak

1. En 1836, Frédéric Diez a divisé les langues romanes en trois groupes: IoIo le groupe oriental, qui comprend l'italien et le valaque (= roumain); 2° le groupe sud-occidental, qui contient l'espagnol et le portugais; 3° le groupe nord-occidental, qui embrasse le provençal et le français.

Il est surprenant que nombre de romanistes soient convaincus que Diez ait divíseles langues romanes en deux groupes. Par exemple, Meier (1948, p. 16) écrit que «tem urna tradiçâo mais velha a subdivisâo da Romania em dois grandes blocos, já preconizada por Diez e recentemente renovada nos trabalhos de W. v. Wartburg». Wagner (1948, p. 16) pense que «das Kapitel Ostromanisch und Westromanisch... geht von der von Diez an angenommenen Einteilung in diese zwei Hauptzweige des Romanischen aus». Il en est de même pour Vidos (1959, p. 304), qui affirme que «la suddivisione del territorio linguistico neolatino in romanzo orientale e romanzo occidentale deriva già da Diez». La même opinion est partagée par lordan (1961, p. 174): «Se sabe que, comenzando con Diez, muchos romanistas han dividido los idiomas romances en dos grupos: oriental y occidental.» Même tout récemment, Geckeler et Kattenbusch (1987, p. 3) mentionnent «die geographisch begriindete Klassifizierung der romanischen Sprachen in eine Ost- und eine Westromania (so im Grunde auch schon bei F. Diez...)».

L'explication de ce fait bizarre est la suivante. Il est vrai que Wartburg a écrit quelque part qu'il s'était inspiré d'une vieille division, mais il n'a jamais précisé que son idée de diviser la Romania en deux parties le long de la ligne La Spezia-Rimini n'était pas autre chose qu'une modification de la conception de Bartoli (1903, p. 131-133). En outre, bien que des romanistes se soient imaginé que Wartburg développait une idée de Diez, ce premier n'a pas jugé utile de les tirer de leur erreur.

Side 15

2. En ce qui concerne la classification des langues romanes, Diez avait au moins une quarantaine de successeurs, qui essayaient de présenter les relations de parenté entre langues romanes des façons les plus diverses. Loin d'avoir l'intention de faire un historique de ces recherches, nous voudrions attirer l'attention sur le fait que ces tentatives avaient ceci en commun qu'elles n'ont jamais été précédées d'un examen de la nature de la parenté des langues.

Le premier à se demander en quoi consistait la parenté des langues est un orientaliste allemand qui a vécu au XVIIe siècle et s'appelait Ludolf. C'est lui qui a formulé le principe d'après lequel «die Sprachverwandtschaft offenbart sich nicht im Wòrterbuch, sondern in der Grammatik» (cf. Schuchardt 1928, p. 198). Pendant les 300 dernières années tellement d'autorités ont approuvé l'opinion de Ludolf qu'elle est devenue un dogme de la linguistique. Pourtant il nous est venu à l'esprit de confronter ce dogme avec des faits et ainsi nous sommes arrivé à la conclusion qu'il était faux. Voici des arguments à l'appui de cette thèse.

Selon une opinion unanime des slavistes, le polonais est plus apparenté à l'ukrainien qu'au russe. Cependant, en considérant les traits phonétiques, nous avons trouvé 10 convergences polono-russes et 2 polono-ukrainiennes. C'est dire qu'au point de vue phonétique il y a plus de ressemblances entre le polonais et le russe qu'entre le polonais et l'ukrainien. Mais il suffit d'appliquer notre méthode de comparaison du vocabulaire dans des textes parallèles pour obtenir un autre résultat. Dans le manuel de Kondrasov, il y a le fragment d'un roman russe traduit en d'autres langues slaves. La comparaison de ce fragment en russe, en ukrainien et en polonais a révélé qu'il y avait 13 ressemblances lexicales polono-ukrainiennes et à peine 1 polono-russe. Par conséquent, la comparaison du vocabulaire dans des textes parallèles fait arriver à la conclusion juste que le polonais est plus apparenté à l'ukrainien qu'au russe (pour plus de détails, voir Manczak 1984a, p. 11-12).

En outre, nous avons analysé plusieurs textes et avons obtenu les résultats
suivants en ce qui concerne les ressemblances flexionnelles et lexicales:


DIVL392
Side 16

II résulte de ces données statistiques que la division des langues indo-européennes en langues slaves, baltes, germaniques et fomanes se laisse justifier uniquement par des ressemblances lexicales, et non flexionnelles. Evidemment, il est facile de répondre à la question de savoir pourquoi le bulgare, l'anglais et le français présentent si peu de ressemblances flexionnelles respectivement avec le polonais, l'anglais et le gotique. C'est que le bulgare, l'anglais et le français sont des langues analytiques, où la flexion est fort réduite. Pour plus de détails, voir Mañczak 1987 a et b.

Parmi les innombrables autorités qui, pendant les 300 dernières années, ont approuvé l'opinion de Ludolf, selon laquelle la parenté des langues dépendrait de la structure grammaticale, et non du vocabulaire, on peut citer Meillet (1925, p. 33), qui affirmait que «la morphologie... est ce qu'il y a de plus stable dans la langue». Il est impossible de qualifier cette assertion autrement que d'absurde. En français, il y a des milliers de substantifs à thèmes en -o, -/', -u (par exemple peuple, pan, fruit). En proto-indo-européen, ces substantifs présentaient, au nom. sing., la désinence *-s (cf. lat. populus, pars, fructus), qui en français a disparu presque complètement {fils constitue une exception). En français, il y a des milliers de verbes, qui en proto-indoeuropéen présentaient, à la 3e3e pers. sing., la désinence primaire *-ti. Cette terminaison a disparu en français sauf à la liaison, cf. plaît en regard de plaît-il. Cependant, dans tous les milliers de substantifs et de verbes français mentionnés, la racine a persisté. Des processus semblables ont lieu, sur une échelle plus ou moins grande, dans toutes les langues indo-européennes. Évidemment, il est impossible de nier que, sporadiquement, la racine puisse disparaître (par exemple, dans russe vy-nu-t' «herausnehmen»), mais c'est un fait que les désinences disparaissent des centaines de fois plus fréquemment que les racines, ce qui s'explique par la loi du développement phonétique d'après laquelle la fin du mot est plus exposée à la chute que le reste du mot.

3. En ce qui concerne les critères sur lesquels s'appuyaient les classifications des langues romanes proposées jusqu'ici, on peut distinguer plusieurs cas: IoIo la classification de Diez (1836, p. 3) s'appuie sur l'impression générale que donnent les langues en question; 2° celle de Bartoli (1903, p. 131-133) s'appuie sur des critères phonétiques; 3° celle de Trager (1934, p. 136) s'appuie sur des critères phonétiques et morphologiques; 4° celle de Muljaéié (1967, p. 37) s'appuie sur des critères phonétiques, morphologiques et syntaxiques; 5° celle de Contreras (1962-1963) s'appuie sur des critères morphologiques et syntaxiques; 6° celle de Pohl (1965) s'appuie sur un trait syntaxique; 7° celle de Guiter (1978, p. 240) s'appuie sur une liste de mots de Swadesh légèrement modifiée.

Side 17

A notre avis, la parenté des langues dépend uniquement du vocabulaire, à ceci près que les mots doivent être comptés non pas dans des dictionnaires ou sur des listes de mots (cf. les listes de mots préparées par Swadesh), mais dans des textes, où les mots conservent leur trait essentiel qu'est leur fréquence d'emploi. Pour justifier notre opinion, voici deux exemples. Il y a un dictionnaire anglais intitulé Oxford Advanced Learner's Dictionary ofCurrent English. Il commence par les 17 mots suivants, qui figurent à la première page: a, aback, abacus, abaft, abandon, abase, abash, abate, abattoir, abbé, abbess, abbey, abbot, abbreviate, abdicate, abdomen, abdominal. Parmi ces mots, il y en a 3 qui sont germaniques et 14 (imprimés en italique) qui sont d'origine étrangère. Dans la préface du dictionnaire mentionné ci-dessus, il y a les deux phrases suivantes: «In this revised impression, the représentation of pronunciation differs somewhat from that shown previously. The phonetic notation now conforms to that to be found in the majority of important English dictionaries used by non-native learners of English, and in particular to the latest (14th) édition of the English Pronouncing Dictionary.» Dans ce bref texte, la proportion des mots indigènes et empruntés est inverse: il y a 32 mots germaniques et 18 mots d'origine étrangère (imprimés en italique). Il en résulte que seul le fait de compter les mots dans des textes permet de justifier le caractère germanique de l'anglais.

Autre exemple. Dans le dictionnaire étymologique du roumain publié par Cihac dans les années soixante-dix du XIXe siècle, il y a eu 5765 mots, dont 2361 d'origine slave, 1165 d'origine latine, 965 d'origine turque, 635 d'origine grecque, 589 d'origine hongroise et 50 d'origine albanaise. On arrivera quand même à une autre conclusion si l'on examine les mots dans un texte. Voici le fragment d'un roman de Sadoveanu, où les mots d'origine non latine sont imprimés en italique:

în munte, la altitudinea aceea unde ne duceam sa gâsim cucosii sàlbatici, seva primàverii încà nu pornise, desi ne aflam la începutul lunii Mai. Siibt brazi erau încà pete de ornât §i subt ballile mlastinilor, gheÇuri. Tufari§urile arbustilor pàreau moarte în umbra cetinilor, soarele nou încà nu le facuse sa scoate ace de muguri.

Dans ce texte, plus de 80% des mots sont d'origine latine. Par conséquent,
pour arriver à la conclusion juste que le roumain est une langue romane, il
faut compter les mots dans des textes.

4. Etant donné que la parenté des langues dépend uniquement du vocabulaire,à cette condition près qu'il faut compter les mots dans des textes, nous avons décidé d'examiner les relations de parenté entre langues romanes en comparant les traductions de fragments de l'Évangile (Matthieu, I-11, X, XXVII-XXVTII) en catalan1, espagnol2, français3, italien4, portugais5, provença

Side 18

vençal6, romanche7, roumain8 et sarde9. En analysant le vocabulaire dans des
textes parallèles, on a observé les règles suivantes:

IoIo On ne prend en considération que les mots qui ont des équivalents dans
tousles textes examinés.

2° On considère comme apparentés les mots qui présentent le même
squelette consonantique de la racine; autrement dit, on ne tient pas compte
d'alternances vocaliques dans la racine.

3° On considère comme apparentés uniquement les mots qui le sont du point de vue de la grammaire comparée des langues romanes, et non pas du point de vue de la grammaire comparée des langues indo-européennes. Par exemple, cat. centuria, esp. centurión, fr. centenier, etc. sont traités comme apparentés parce que tous ces mots présentent la même racine que le mot latin centum, tandis que le roum. suta§, provenant en fin de compte du v. slave sûto, est considéré comme non apparenté aux mots romans mentionnés ci-dessus, bien que, du point de vue de la grammaire comparée des langues indo-européennes, le lat. centum et le v. slave sûto proviennent d'un même étymon.

4° On considère comme apparentés également les mots qui ont subi ce que nous appelons un développement phonétique irrégulier dû à la fréquence d'emploi (Mañczak 1969). Par exemple, esp. el et port, o son traités comme apparentés parce que les deux mots proviennent finalement du lat. Ule ou illum.

5° Si un mot composé a pour équivalents des groupes de mots dans les autres langues, on prend en considération les deux racines du mot composé. Par exemple, on tient compte de l'article postposé -/ dans roum. poporul parce que poporul a pour équivalent fr. le peuple. Il en est de même pour fr. chanterai et roum. am sa cînt: sont considérés comme identiques fr. chanteret roum. cînt ainsi que fr. -ai et roum. am.

6° Si le mot composé a pour équivalent, dans une autre langue, un mot simple, on ne prend en considération qu'une racine du mot composé. Par exemple, en ce qui concerne fr. dans ( <de + intus), on tient compte uniquement de la seconde racine parce que le fr. dans a pour équivalent l'it. in.

7° Quand plusieurs mots sont suivis d'une même lettre (A,B, C ou D), cela
signifie qu'ils sont apparentés.

8° Si, dans un mot composé, la première racine est apparentée au mot d'une langue et la seconde, au mot d'une autre langue, un tel composé n'est pas pris en considération et est suivi de la lettre X. Par exemple, dans le port. para, par- est apparenté au rom. pro, tandis que -a est apparenté au fr. à. Voilà pourquoi on note à, para X, pro parce qu'aussi bien l'interprétation à A, para A, pro que l'interprétation a, para A, pro A seraient inexactes. Évidemment,si plusieurs mots sont suivis de X, ils sont considérés comme apparentés entre eux. Dans la série cat. llavors X, esp. entonces A, fr. alors X,

Side 19

it. allora X, port, entâo A, prov. alor X, rom. quella, roum. aiutici A, sarde ad s'hora, certains mots ont été marqués par X parce que, par exemple, le fr. alors ressemblait à la fois au rom. quella et au sarde ad s'hora; d'autre part, il est évident que Pétymologie de fr. alors, cat. llavors, etc., est la même.

9° On emploie X aussi dans des séries comme la suivante: cat. no A, esp. no A, fr. ne pas X, it. non A, port, nâo A, prov. pas, rom. nun A, roum. nu A, sarde non A. Le fr. ne pas est marqué par X parce qu'il ressemble à la fois à l'it. non et au prov. pai.

En observant ces règles, nous avons dressé une liste de mots, dont voici un
fragment:


DIVL394

DIVL396

Au point de vue statistique, les ressemblances lexicales entre les langues en
question se présentent comme suit:


DIVL398
Side 20

DIVL400

5. Ces données statistiques doivent être prises cum grano salis pour deux raisons:

IoIo II y a des traductions plus ou moins fidèles et il y en a qui sont plus ou moins libres. L'idéal consisterait en ce qu'un même homme fasse toutes les traductions, mais on sait que cet idéal est irréalisable. Parmi les traductions des Evangiles que nous avons eues à notre disposition, la version espagnole était la plus libre, et cela explique pourquoi, en ce qui concerne le nombre de ressemblances aux autres langues romanes, l'espagnol s'est trouvé en troisième place au lieu d'être à la deuxième.

2° II n'est pas toujours facile de répondre à la question de savoir si tel mot est apparenté à un autre ou non parce que les opinions des étymologistes sont parfois partagées. Pourtant il suffirait d'un coup d'œil sur notre liste de mots pour que les lecteurs puissent se convaincre que les cas où l'on peut avoir des doutes sur Pétymologie de tel ou tel mot constituent une quantité négligeable par rapport aux cas où Pétymologie des mots est absolument sûre.

En ce qui concerne les résultats obtenus, la somme de ressemblances lexicales qu'une langue donnée présente par rapport aux autres langues romanes (par exemple, le fait que l'italien en présente 7498 et le roumain, à peine 3564) est la plus importante. Or, à ce point de vue, on arrive à la première conclusion que le roumain et le sarde sont des langues aberrantes, tandis que les autres langues constituent une Romania continua. A cette occasion, rappelons que nous avons déjà attiré l'attention sur le fait que, contrairement à l'opinion unanime des romanistes, le sarde n'est nullement la langue romane la plus archaïque, voir Mañczak 1985a.

La seconde conclusion, non moins importante, est qu'il existe grosso modo un lien entre la date de la conquête d'une province et le degré de la romanisation de sa ou ses langues, l'italien étant la langue la plus romane et le roumain, le moins.

Side 21

DIVL402

Sur cette liste, le sarde constitue une seule exception. Nous ignorons comment interpréter ce fait: serait-il dû au substrat non indo-européen ou bien à l'isolement de l'île? Dans le livre édité par Harris et Vincent (1988, p. 316), on lit que «although it is an established historical fact that Roman dominion over Sardinia lasted until the fifth century, it has been argued, on purely linguistic grounds, that linguistic contact with Rome ceased much earlier than this, possibly as early as the first century BC», tandis que Wartburg (1950, p. 63) affirme que les Sardes «der Romanisierung lange einen erbitterten aktiven und passiven Widerstand entgegensetzt hatten - im 1. Jahrh. n. Chr. konnte man in den Bergen des Zentrums noch die einheimische Sprache hòren». Évidemment, c'est l'opinion de Wartburg qui permettrait de comprendre le caractère aberrant du sarde. Mais quoi qu'il en soit pour le sarde, il nous semble que le lien entre nos données statistiques et la chronologie des conquêtes romaines est remarquable.

A titre de curiosité, mentionnons que tandis que Wartburg opposait l'italien et le roumain au reste de la Romania, nous estimons que la plus grande différence sépare plutôt ces langues, l'italien étant la langue romane la plus archaïque et le roumain, la langue la plus innovatrice.

6. Après avoir constaté que l'emploi de notre méthode avait permis d'élaborerune classification des langues romanes reflétant grosso modo la chronologiedes conquêtes romaines, nous avons décidé d'appliquer la même méthodeà l'examen des langues slaves pour obtenir des renseignements sur les migrations préhistoriques des Slaves (Manczak 1985b). Et ces renseignementsnous ont donné la possibilité d'expliquer le «miracle de la Roumanie», c'est-à-dire l'absence de parallélisme entre le sort de la romanité dans les provinces situées plus près de l'Adriatique d'une part et celles situées plus

Side 22

près de la mer Noire de l'autre: en Dacie et en Mésie, la romanité a persisté,
tandis qu'ailleurs elle a disparu (Mañczak 1987c).

En ce qui concerne le problème de l'habitat primitif des Indo-Européens, Hirt (1927, p. 72) a écrit que «schon frimzeitig hat man die Altertümlichkeit der Sprache herangezogen, um die Urheimat zu bestimmen. Und in der Tat darf man annehmen, dass sich die Sprachen da verhâltnismàssig langsam veràndern, wo keine Sprachmischung eintritt (Finnisch und Tiirksprachen)». Évidemment, le fait que c'est l'italien (et non le sarde) qui est la langue romane la plus archaïque, confirme l'opinion de Hirt et de ses prédécesseurs d'après laquelle la langue parlée dans l'habitat primitif évolue plus lentement que les langues qui se développent sur des substrats. Dans cet état de choses, il nous semblait opportun de déterminer quelle langue est la plus archaïque parmi les langues slaves (Manczak 1986) et quelle langue est la plus archaïque parmi les langues indo-européennes (Manczak 1984b).

7. Somme toute, notre classification des langues romanes diffère de toutes celles qu'on a jusqu'ici proposées par les trois traits suivants: IoIo elle a été précédée d'un examen de la nature de la parenté des langues; 2° elle reflète grosso modo la chronologie des conquêtes romaines; 3° elle n'a pas seulement une valeur pour la linguistique romane, mais elle trouve aussi une application dans les recherches ethnogénétiques.

Witold Mañczak

Cracovie



Notes

1. La Biblia. Versió deis textos origináis i notes pels monjos de Monserrat, 4e4e éd., Andorra, 1986.

2. Nuevo Testamento. Versión directa del texto original griego por E. Nácar Fuster y A. Colunga Cueto, 35e éd., Madrid, 1980.

3. Le Nouveau Testament. Traduction d'après le Texte grec par L. Segond, nouv. éd. revue, Paris, 1953.

4. Il Nuovo Testamento. Versione riveduta in testo originale dal Dott. G. Luzzi, Roma, 1951.

5. O novo Testamento de Nosso Senhor Jesus Cristo. Traduzido em portugués por J. Ferreira de Almeida, éd. revue et corr., Lisboa, 1979.

6. D. Savie de Fourviero. Lis Evangèli segui di pichòtis ouro dóu crestian, Avignoun, 1904.

7. La Soncha Scrittura. Vegl e Nouv Testamaint, Samedan, 1953.

8. Noul Testament al Domnului Nostru Isus Hristos, Societatea Biblicâ, 1953.

9. Il Vangelo di S. Matteo, vulgarizzato in dialetto sardo logudorese dal. can. G. Spano, Londra, 1858.

Side 23

Résumé

L'orientaliste allemand Ludolf (XVIIe s.) a été le premier à affirmer que «die Sprachverwandtschaftoffenbart
sich nicht im WOrterbuch, sondern in der Grammatik».
Répétée pendant 300 ans, cette opinion n'a jamais été soumise à vérification. En

Side 24

réalité, elle est fausse. Il résulte de la comparaison de textes parallèles qu'on peut justifier le caractère roman du français, le caractère germanique de l'anglais et le caractère slave du bulgare uniquement par des ressemblances lexicales, et non flexionnelles.Les relations de parenté entre le polonais, l'ukrainien et le russe montrent que l'examen de traits phonétiques n'est pas moins décevant que celui de ressemblancesmorphologiques. Dans ces conditions, l'auteur propose une nouvelle classificationdes langues romanes basée uniquement sur l'examen du vocabulaire dans des textes parallèles: IoIo italien, 2° langues de l'Espagne, 3° langues de la Gaule, 4° romanche,5° sarde, 6° roumain, l'italien étant la langue la plus romane et le roumain, la moins romane. Il y a donc grosso modo un lien entre la date de la conquête d'une province et le degré de sa romanisation. Non seulement cette constatation a une valeur pour la linguistique romane, mais elle trouve aussi une application dans les recherches ethnogénétiques (relatives à l'habitat primitif des Slaves et à celui des Indo-Européens).

Références

Bartoli, M. G. (1903): Un po' di sardo, Archeografo Triestino, 3e3e série, vol. 1.

Contreras, H. (1962-1963): Una clasificación morfo-sintáctica de las lenguas románicas,
RomPh, 16, p. 261-268.

Diez, F. (1836): Grommatile der romanischen Sprachen, I. Bonn.

Geckeler, H., et D. Kattenbusch (1987): Einfiihrung in die italienische Sprachwissenschaft.
Romanistische Arbeitshefte 28. Tübingen.

Guiter, H. (1978): Du latin aux langues romanes: évaluations quantitatives, La latinité
hier, aujourd'hui, demain. Actes du Congrès internat. Avignon.

Harris, M., et N. Vincent (éd.) (1988): The Romance Languages. London.

lordan, I. (1961): El lugar del idioma rumano en la Romania. BRPh, 1,1, p. 159-177.

Mariczak, W. (1969): Le développement phonétique des langues romanes et la fréquence.

- (1984a): W sprawie czasu i miejsca zapozyezeri germarîskich w praslowiariskim.
IJSLP, 29, p. 7-15.

- (1984b): Le problème de l'habitat primitif des Indo-Européens, FoLH, 5, p. 199-210.

- (1985a): Le sarde est-il la langue romane la plus archaïque? Actes du XVllème
Congrès Internat, de Linguistique et Philologie Romanes, vol. 2, p. 111-130. Aix-en-
Provence.

- (1985b): Przedhistoryczne migracje Stowian. SSp, 9, p. 129-142.

- (1986): Nowy argument za zachodnrç praojczyzna. Stowian. 510,43, p. 79-86.

- (1987c): Miracle de la Roumanie a przedhistoryczne migracje Slowian. SSp, 13, p.
55-59.

Meier, H. (1948): Ensaios de filologia romànica. Lisboa.

Meillet, A. (1925): La méthode comparative en linguistique historique. Oslo.

Pohl, J. (1965): Le roumain, seule langue romane centrifuge? In: Omagiu lui A.
Rosetti, p.709-717. Bucure§ti.

Schuchardt, H. (1928): Hugo Schuchardt-Brevier. Ein Vademécum der allgemeinen
Sprachwissenschaft, 2e2e éd. Halle (Saale).

Trager, G. L. (1934): On the Classification of the Romance Languages, Rom. Rev., 25,
p. 129-136.

Vidos, B. E. (1959): Manuale di linguistica romanza. Firenze.

Wagner, M. L. (1948): Zu Harri Meier's «Die Entstehung der romanischen Sprachen
und Nationen», RF, 61, p. 1-20.

Wartburg, W. v. (1950): Die Ausgliederung der romanischen Sprachraume. Bern.