CHAPITRE 2
L’explosion néolithique

Familles recomposées

— Nous voici donc arrivés au grand bouleversement linguistique du néolithique. Que sait-on des langues parlées à cette époque ?

— Nombre de linguistes passent leur temps à essayer… de remonter le temps ! Ils comparent les langues pour tenter de déterminer leurs liens de parenté, de les grouper en familles ou super-familles, et de reconstituer leur arbre généalogique. Et ils essaient parfois de reconstruire les protolangues, les ancêtres disparus des différentes familles. Autant les travaux pour retrouver des bribes de la supposée langue mère sont hautement spéculatifs, autant ceux menés pour reconstruire les langues parlées il y a, disons, moins de 10 000 ans sont assez consistants. Aujourd’hui nous avons assez d’expérience pour identifier les parentés génétiques entre langues, et reconstruire leur ancêtre commun.

— On fait remonter l’histoire de la classification moderne des langues à William Jones, un juriste anglais de la seconde moitié du XVIIIe siècle, c’est cela ?

— Exactement. Fils d’un mathématicien célèbre, William Jones est polyglotte : il parle parfaitement treize langues et se débrouille avec vingt-huit autres ! Bien évidemment il connaît les langues classiques – latin, grec, hébreu –, mais aussi l’arabe, le persan et surtout le sanskrit, langue parlée autrefois par les brahmanes, qu’il a étudié alors qu’il était en poste à Calcutta. Dans une adresse célèbre à la Société asiatique du Bengale, Jones affirme que le sanskrit, le latin et le grec ont des caractéristiques semblables tellement nombreuses que la seule explication possible, à l’exclusion de toute autre, est une origine commune. Il ajoute que ces trois langues sont également liées au persan, aux langues celtiques et au gotique, la langue des Goths et des Wïsigoths. Depuis, l’étude de cette famille indo-européenne et la reconstruction du proto-indo-européen ont beaucoup progressé, comme d’ailleurs celle d’autres proto-langues tels le proto-bantou, le proto-sémitique, le proto-austronésien… Dans d’autres cas, nous savons que les langues forment bel et bien une famille, mais nous n’en avons pas encore de reconstruction : par exemple le sino-tibétain, l’austro-asiatique (cambodgien, vietnamien, etc.).

— Comment fait-on pour mettre des langues dans une famille ?

— On s’appuie sur leurs ressemblances. Elles peuvent en avoir pour trois raisons : par héritage d’un ancêtre commun, par emprunt mutuel, ou par simple coïncidence. La difficulté est de distinguer entre ces trois cas, et donc d’exclure les emprunts et les coïncidences. Nous avons déjà vu le cas du grec et du taroko qui, par hasard, présentent exactement les mêmes formes pour mon et ton. Il se trouve que, par hasard là aussi, plusieurs nombres dans les langues austronésiennes et les langues indo-européennes se ressemblent fortement : ainsi, pour le nombre deux, le sanskrit a dva, et le malais dua. En 1841, Franz Bopp, par ailleurs l’un des pionniers de la linguistique indo-européenne, n’avait pas compris que ces ressemblances étaient accidentelles et il pensait que le malais et les autres langues austronésiennes étaient des parents proches du sanskrit. Pour éviter de tomber dans ce panneau, les linguistes modernes exigent que les paires de mots présentées comme preuves de parenté génétique entre deux langues aient des correspondances systématiques au niveau des sons qui les composent. Si l’on garde notre exemple, il faut donc que le « d » du sanskrit corresponde au « d » du malais dans toute une série d’autres paires de mots de même sens, de même pour le « v » du sanskrit et le « u » du malais, ainsi que pour le « a » du sanskrit et le « a » du malais, de sorte que, dans chaque paire de mots supposés hérités de l’ancêtre commun, chaque son soit explicable en termes de ces correspondances.

— Ça se complique…

— Je vous passe les détails. Disons que, si cette procédure est suivie avec soin, on arrive à éliminer assez facilement les ressemblances accidentelles. Mais il y a mie autre difficulté : il reste possible que des ressemblances non accidentelles entre langues soient dues à l’emprunt. Il nous faut donc un second critère, qui nous est fourni par le vocabulaire de base. Comme celui-ci est assez difficile à emprunter, on s’attend à le trouver en abondance lorsque deux langues ont un ancêtre commun, et en faible quantité si les ressemblances sont dues à l’emprunt. C’est ainsi que le linguiste américain Paul Benedict a pu montrer que les nombreux mots communs au thaï et au chinois étaient des emprunts, malgré l’existence de correspondances phonétiques (parce que le vocabulaire de base y était très peu représenté).

« Tchi ki boum »

— Mais comment passe-t-on du classement des langues par degré de parenté à la reconstruction de leur ancêtre ?

— Grâce à tous les outils et les techniques que les linguistes se sont forgés au fil des décennies. Au cours du XIXe siècle, les chercheurs font des découvertes importantes : ils comprennent que les langues évoluent non pas de façon désordonnée, mais ordonnée. Et donc quil est possible de remonter le temps en suivant les changements. Ainsi, si un « s » devient un « h », on observe que tous les « s » dans tous les mots, ou les « s » qui apparaissent dans une certaine position (au début des mots, à la fin, ou encore précédés d’une certaine voyelle), vont se changer en « h ». Évidemment, ce type de modification ne se réalise pas du jour au lendemain, mais il s’opère régulièrement et presque sans exception. De plus, on s’est aperçu que les changements phonétiques dans les langues sont assez stéréotypés. Par exemple pour les voyelles : un « a » va souvent devenir un « é » ou un « o », un « é » va souvent se changer en un « i », un « o » va souvent évoluer vers un « ou », un « ou » va devenir un « u »… Ce sont des évolutions fréquentes. L’inverse est plus rare : un « i » ne devient un « u » que dans des conditions très particulières. Un « k » suivi d’un « i » va souvent se changer en « tch », mais un « tch » suivi d’un « i » ne deviendra que très exceptionnellement un « k »… En comparant les langues filles, qui présentent toutes en principe des évolutions régulières à partir de leur langue mère, on peut faire des hypothèses bien fondées sur la prononciation de cette langue ancestrale. Par exemple, si on trouve, dans deux langues sœurs et dans le même mot, un « tchi » dans l’une, un « ki » dans l’autre, on peut supposer que ce mot avait la forme en « ki » dans la langue mère.

— Cette régularité paraît presque trop belle pour être vraie…

— Elle s’explique facilement. Si les sons de la parole changent souvent dans le même sens, cela est dû au fait qu’on utilise tous le même appareillage, les mêmes muscles, les mêmes os et le même système nerveux pour les contrôler. Bref, nous avons les mêmes contraintes mécaniques et physiologiques. L’évolution du « ki » en « tchi » s’explique très bien : quand vous prononcez la consonne « k », le dos de votre langue est contre le voile du palais, puis pour prononcer le « i » le dos de votre langue s’avance ; si votre langue anticipe trop la position du « i », ça donne « tchi ». Les changements de sons sont normalement sans exception (il faut nuancer cette affirmation, mais le principe général demeure). C’est là une des découvertes majeures de la linguistique dans la seconde moitié du XIXe siècle, même si on continue de débattre à propos de leur mécanisme précis.

— Observe-t-on le même type de régularité au niveau de la structure de la langue, de la grammaire ?

— D’une certaine façon, oui. Prenez la forme négative des verbes en français, qui se construit en mettant ne avant et pas après. Cette construction, d’emploi courant en français écrit, s’est simplifiée en français parlé : le ne est tombé, il ne reste plus que le pas (« j’sais pas », « il en veut pas », « t’y vas pas »). Eh bien, cette simplification s’est opérée quel que soit le verbe : le ne est tombé partout. Il y a là en effet quelque chose qui ressemble à la régularité des changements phonétiques. Cette évolution de la grammaire suit aussi souvent des chemins bien tracés (les linguistes parlent de « grammaticalisation ») qui aboutissent à créer de nouveaux mots grammaticaux. Car ceux d’aujourd’hui viennent habituellement de mots ayant eu autrefois un sens plein. Par exemple, dans beaucoup de langues, le futur proche des verbes se forme avec des mots grammaticaux provenant du verbe aller : en français, « elle va venir », en anglais, « she’s going to come ».

Poètes et bouchers

— Ce qui nous amène aux changements du vocabulaire…

— Les mots changent souvent de sens, et, souvent aussi, les étymologies se retrouvent de façon frappante d’une langue à l’autre. Par exemple, dans beaucoup de langues, le nom de la lune provient d’un mot signifiant « brillant » ; le mot pour demain vient souvent d’un mot voulant dire « matin ». Les noms d’animaux domestiques adultes dérivent fréquemment du nom du jeune animal : ainsi, cochon et poulet désignaient au départ le porcelet et le jeune poulet. D’après Haudricourt, cela viendrait de ce que les bouchers cherchent à faire passer la viande de l’animal adulte pour plus tendre qu’elle ne l’est ! Peut-être nos petits-enfants appelleront-ils veau la viande de bœuf… C’est cette longue expérience accumulée, l’analyse de tous les changements phonologiques et grammaticaux, qui permet aux linguistes de remonter le temps.

— Avec tous ces outils linguistiques, comment faites-vous concrètement pour reconstruire une langue morte ?

— On part toujours des langues actuelles. Si vous avez beaucoup de chance, l’ancêtre du groupe de langues qui vous intéresse est une langue écrite connue. Dans ce cas, le travail est à moitié fait : vous connaissez le vocabulaire, la grammaire, la graphie… La seule question qui vous reste est la prononciation. Par exemple, en latin, vous pouvez avoir des doutes sur la prononciation du signe « c » : se prononçait-il « k », ou « tch » comme en italien ? Vous avez deux types d’indices pour trancher : la prononciation dans les langues filles et les emprunts faits au latin par les langues étrangères. Si l’on part du principe, comme on l’a vu tout à l’heure, que le son « k » est ancestral au son « tch », on voit qu’il y a une langue fille, le sarde, qui a conservé les « k » : par exemple, le mot ciel se dit cælum (« kaéloum ») en latin, celu (« kélou ») en sarde et cielo (« tchélo ») en italien… Cela plaide pour une prononciation « k » en latin. On confirme en remarquant que Cæsar a donné Kaiser en allemand et devait bien se prononcer « Kaesar ».

— On comprend bien le procédé. Mais l’exercice est-il possible avec les écritures non alphabétiques comme l’égyptien ou le chinois ?

— Eh bien, pour le chinois, sur lequel je travaille, on dispose de plusieurs outils, notamment un dictionnaire qui date de l’an 601, le Qiè-Yùn, dans lequel les mots sont classés par rimes : la poésie est un art très important en Chine et composer un poème faisait partie des examens obligatoires pour tous ceux qui entraient dans la prestigieuse administration impériale ! Le Qiè-Yùn est un instrument précieux pour établir la prononciation du chinois ancien. Pour remonter encore le temps et revenir au chinois dit archaïque, la langue de Confucius parlée au Ier millénaire avant notre ère, là encore nous nous appuyons sur la poésie : il existe tout un corpus de poèmes rimés de cette époque. Et puis, dans les caractères chinois, il y a des éléments phonétiques que les Chinois d’aujourd’hui ne déchiffrent que partiellement mais qui nous renseignent sur la prononciation des mots vers le milieu du Ier millénaire avant notre ère. Contrairement à une idée répandue, l’écriture chinoise est au départ phonétique, même si elle n’est pas alphabétique. C’est une écriture qui se rapproche d’un syllabaire, avec un symbole pour chaque syllabe.

Fish and foot

— Et pour remonter au-delà, avant l’écriture ?

— Il s’agit souvent de reconstruire une langue morte non attestée, une langue dont on a perdu toute trace mais dont on a de bonnes raisons de supposer l’existence : le protoindo-européen sur lequel on travaille depuis William Jones, le proto-austronésien, le proto-bantou… Évidemment les résultats sont très variables, en fonction de la profondeur temporelle de la langue en question et de la qualité des données dont nous disposons : les langues actuelles sont-elles bien décrites ? Sont-elles suffisamment nombreuses et divergentes pour établir des comparaisons et des recoupements ? Toutes les branches sont-elles bien représentées ? En effet, si, pour reconstruire le proto-indo-européen, vous n’aviez à votre disposition que les langues romanes et les langues germaniques, vous auriez une vision très différente de celle que nous avons aujourd’hui, une vision pleine de trous ! Bref, on parvient à reconstruire des bribes de proto-langues avec des fortunes diverses. C’est un vrai travail de fourmi.

 Pouvez-vous donner quelques exemples ?

— Regardons des langues européennes, ce sera plus facile. Il y a deux méthodes classiques pour retrouver les mots ancestraux : la méthode comparative (qui consiste à comparer des formes issues de plusieurs langues) et la reconstruction interne (qui utilise des données internes à une seule langue). En latin, vous trouvez plusieurs formes apparentées pour neige, neiger : nix pour le cas sujet, nivis pour le cas complément de nom, ninguit pour dire il neige, etc. Cela correspond phonétiquement aux formes « nik-s », « niw-is » et « ni(n)gw-it ». Je vous passe la démonstration, mais la reconstruction interne nous amène à postuler une forme prélatine nigw. Évidemment, cette méthode à elle seule n’est pas suffisante. On utilise donc aussi – surtout – la méthode comparative, et on tente de repérer des changements de sons – de phonèmes – réguliers dans différentes langues filles. Prenons l’anglais et le français, des langues apparentées puisqu’elles sont toutes deux indo-européennes, mais tout de même assez lointaines, le français appartenant au groupe des langues romanes et l’anglais au groupe des langues germaniques. On s’aperçoit qu’aux mots français poisson, pied, père, plein, pour correspondent en anglais les mots fish, foot, father, full, for. Le « p » français devient donc un « f » en anglais et vice versa. Idem : les mots français tonnerre, tu, toit et dix, deux, dent se disent en anglais thunder, thou (ancien anglais), thatch et ten, two, tooth. Ce qui signifie qu’il y a une correspondance entre le « t » français et le « th » anglais et entre le « d » français et le « t » anglais… Les linguistes traquent ce type de changements réguliers en comparant des centaines de mots, parfois dans des dizaines de langues. Ensuite ils élaborent des tableaux de correspondance pour déterminer les phonèmes ancestraux de façon que les évolutions phonétiques soient plausibles et que le système de sons reconstruit soit naturel.

— On reconstruit ainsi un système de phonèmes, mais comment reconstruire les mots eux-mêmes ?

— Tout simplement en assemblant, pour chaque mot, les phonèmes de la proto-langue dans l’ordre où ils apparaissent dans les langues filles. Par exemple, nous avons vu que le mot dent du français correspond à tooth en anglais, et que les première et dernière consonnes de ces deux mots illustrent les correspondances bien connues « d »-« t » et « t »-« th ». Pour la première, les indo-européanistes ont reconstruit le protophonème « *d » (l’astérisque marque une forme reconstruite, non directement observée), et pour la seconde ils ont reconstruit « *t ». Le mot dent en proto-indo-européen se prononçait donc « *d…t ». Les spécialistes reconstruisent aussi les deux sons du milieu sur la base de correspondances que je n’ai pas évoquées, ce qui donne la forme « *dont ».

Vocabulaires ressuscités

— Avec ces méthodes, vous obtenez donc une liste de vocabulaire. Mais pouvez-vous reconstruire également la grammaire ? Pourriez-vous, si vous n’aviez pas de textes latins, retrouver les déclinaisons latines alors qu’aucune langue romane actuelle ne comporte de déclinaisons ?

— Non, bien sûr ! Votre question illustre parfaitement les difficultés auxquelles nous nous heurtons et montre que la réalité n’est jamais aussi simple que la théorie. On pourrait penser que les langues romanes descendent du latin de Cicéron. En réalité, l’italien, le français ou le castillan ne descendent pas directement du latin classique que l’on apprend aujourd’hui à l’école, mais du latin tardif parlé au moment de la désintégration de l’Empire et dans lequel les déclinaisons avaient déjà tendance à disparaître – c’est d’ailleurs probablement pour cette raison qu’aucune langue romane actuelle ne les a conservées. La reconstruction d’une protolangue est toujours incomplète : on reconstruit une partie plus ou moins grande du vocabulaire, éventuellement une partie de la grammaire, les règles de formation des mots comme les pluriels, les conjugaisons ou les déclinaisons justement. Mais on ne reconstruit pas tout, loin de là. Certains éléments sont perdus à jamais : parce qu’ils ne sont représentés dans aucune langue fille ou parce qu’ils n’ont été préservés que dans une seule langue, et que l’on n’a alors aucun moyen de savoir s’il s’agit d’un élément ancestral. Il n’existe pas aujourd’hui de proto-langue reconstruite avec un détail suffisant pour qu’on puisse la parler.

— Mais, dans les cas où vous avez reconstruit beaucoup de vocabulaire, on ne pourrait même pas dire quelques phrases ? On trouve sur Internet une fable en proto-indo-européen : « Le mouton et les chevaux »…

— Oui, la fable d’August Schleicher, un linguiste allemand du XIXe siècle, parfois revue et corrigée par les modernes. L’exercice n’est pas inintéressant, ne serait-ce que parce qu’il nous permet de mieux nous rendre compte des lacunes. Mais il faut bien comprendre que pour écrire des textes de ce type, on doit prendre beaucoup de décisions arbitraires, des décisions sur des problèmes en suspens, par exemple sur l’ordre des mots, qui est très volatil et difficile à reconstruire en détail. Tout à l’heure, quand je vous ai proposé un café, j’ai ajouté : « Vous le prenez comment ? » ; il y a cent ans, j’aurais demandé : « Comment le prenez-vous ? » Vous voyez, ce type de changement est si rapide et si subtil qu’il est illusoire de penser le retrouver.

— Mais si tous ces travaux ne permettent pas de ressusciter ces langues disparues, que nous apprennent-ils sur les gens qui les parlaient, ces hommes du néolithique qui ont profondément marqué la planète ?

— Pas mal de choses finalement. Le vocabulaire que nous parvenons à reconstruire nous donne de précieux renseignements sur leur culture. Leur culture matérielle d’abord : les plantes cultivées, les animaux domestiques, les outils utilisés, les activités de chasse ou de pêche, la construction des maisons… Parfois ils nous donnent aussi des indices sur leur système de parenté, leurs croyances religieuses… Prenons le proto-austronésien, que je connais bien. Le vocabulaire reconstruit nous indique que cette population qui habitait Taïwan vers 3 500 avant notre ère cultivait le millet et le riz. Eh bien, nous pouvons reconstruire un mot pour le riz en tant que plante, un mot pour le riz en tant que nourriture, et un autre pour les grains décortiqués… Un mot pour cochon domestique, un mot pour chien… Ils péchaient : il existe un mot pour bateau, un autre pour filet… Ils avaient des maisons, des champs. Voilà pour la culture matérielle. Pour le monde des idées, nous savons que les Proto-Austronésiens enterraient leurs morts – il y a un mot pour enterrer – et qu’ils vénéraient peut-être un être surnaturel nommé *qaniCu… Comme le terme *aki (« grand-père », « ancêtre ») a évolué dans certaines langues vers le sens de « divinité », cela suggère l’existence d’un culte rendu aux ancêtres. Nous n’en savons pas beaucoup plus. Juste un indice sur le système de parenté : le même mot désignant le beau-père pour une femme et l’oncle maternel pour un homme, on peut imaginer un mariage préférentiel avec la fille de l’oncle maternel.

Le berceau indo-européen

— Étonnant ! Ces hypothèses sont très séduisantes, mais comment éprouver leur solidité ? Comment vérifier que les Proto-Austronésiens tels que vous les décrivez ne sont pas… une invention de linguistes ?

— Parce que l’archéologie a confirmé ces hypothèses sur les Proto-Austronésiens, au moins sur le plan matériel ! En 2002, on a découvert un site archéologique vieux de 5 000 ans, sur la côte ouest de Taïwan. Et sous huit mètres d’alluvions on a retrouvé des grains de riz et de millet carbonisés, des ossements de chiens, des pierres pour lester les filets de pêche… Nous étions très fiers que nos hypothèses s’incarnent dans des vestiges archéologiques. C’est la situation idéale : lorsque nos travaux convergent avec ceux des archéologues, historiens… Souvent, comme je vous l’ai dit, nous avons besoin les uns des autres. Par exemple, nous savons, par l’archéologie, que la métallurgie du cuivre est apparue en Chine dans le courant du IIIe millénaire avant notre ère et celle du bronze un peu plus tard. Puis les Chinois ont transmis la technique du bronze à leurs voisins du Sud. En chinois archaïque, le mot pour bronze a été formé sur le verbe mettre ensemble (pour le fabriquer, on met ensemble du cuivre et de l’étain) et se prononçait « long » ; nous savons par ailleurs que le « l- » a changé pour le « d- » vers l’an 100 de notre ère. Cela nous aide à dater les contacts entre les Chinois et les populations du Sud : si, dans leur langue, bronze se dit long, cela suggère que ces populations avaient rencontré les Chinois avant l’an 100.

— J’ai évidemment envie de revenir à notre famille, l’indo-européen : que savons-nous aujourd’hui de ces mythiques ancêtres linguistiques ?

— Mythique est le bon mot, car les travaux sur le proto-indo-européen ont parfois été récupérés par des courants d’extrême droite et ont alimenté le mythe de la supposée supériorité aryenne… Sans aucun fondement scientifique, bien entendu. Reste que la question de l’indo-européen est à la fois très étudiée et très complexe. Les cartes pour les linguistes sont assez brouillées parce qu’il s’agit d’une famille de langues restées en contact étroit, ne cessant de s’influencer, de s’emprunter du vocabulaire… Ce qui ne facilite pas leur classification. L’autre problème est l’âge et la région d’origine du proto-indo-européen. Nous savons que le proto-austronésien vient de Taïwan, mais pour le proto-indo-européen nous avons encore des doutes. D’ailleurs, presque toutes les régions d’Eurasie ont été candidates au titre de « berceau de l’indo-européen ». Aujourd’hui, il reste deux hypothèses sérieuses : celle de l’Anglais Colin Renfrew selon laquelle le proto-indo-européen aurait été parlé en Anatolie par des populations issues de celles ayant domestiqué le blé, il y a 11 000 ou 12 000 ans ; les agriculteurs porteurs de cette langue se seraient ensuite graduellement répandus sur l’Europe, l’Iran et l’Inde. L’autre scénario est celui de Marija Gimbutas : les Proto-Indo-Européens n’auraient pas été au début des agriculteurs mais des cavaliers des steppes du nord-est de la mer Noire, dans la région des Kourganes ; vers 6 000 avant notre ère, ce peuple de guerriers porteurs de valeurs martiales aurait mené des raids sur des populations de pacifiques agriculteurs vénérant une déesse mère, les aurait dominées et leur aurait imposé sa langue. Celle-ci se serait ensuite répandue avec les techniques de l’agriculture.

L’autre généalogie

— Ne peut-on trancher entre l’hypothèse « paysans d’Anatolie » et l’hypothèse « cavalier des steppes » ? Le vocabulaire reconstruit ne nous donne-t-il pas des indications sur la culture des Proto-Indo-Européens ?

— Pour l’instant, nous ne possédons pas d’éléments indiscutables et décisifs. On a bien essayé de retrouver le berceau de l’indo-européen grâce au vocabulaire de la nature (les plantes, les animaux), dans l’espoir de cerner le paysage d’origine, mais ces recherches n’ont pas encore abouti. Il y a trop d’ambiguïtés dans le sens des mots : le même terme peut signifier « chêne », « hêtre » ou « châtaigner »… Vous avouerez que ce n’est pas très précis. De même, on a longtemps cru que le proto-indo-européen ne pouvait être très ancien, car il existait un mot pour roue : *kwekwlo- ; or les plus vieilles roues jamais retrouvées en Eurasie ne dépassent pas 5 500 ans. Mais l’argument est douteux : on peut très bien imaginer que les langues filles n’aient pas hérité du mot roue mais du mot *kwei qui signifie « tourner », et que chacune ait ensuite dérivé un mot pour roue à partir de cette même racine. Ou, autre hypothèse valable, que le mot roue ait été emprunté par le hittite avec l’objet lui-même, quand cette invention s’est répandue en Europe et au Proche-Orient. On peut faire les mêmes raisonnements avec les mots chariot et cheval, qui ont longtemps servi à appuyer l’hypothèse des guerriers déferlant sur l’Europe avec chevaux et chariots.

— Cette quête des origines semble un peu désespérée. En fait, on ne saura jamais !

— Je ne dirais pas cela. Petit à petit, les choses avancent, les hypothèses se resserrent. Récemment par exemple, le Néo-Zélandais Russell Gray a présenté des résultats très intéressants : il a appliqué à la famille des langues indo-européennes les méthodes utilisées par les biologistes pour dessiner l’arbre phylogénétique des gènes ou des espèces animales, méthodes qui font appel à des algorithmes nécessitant des batteries d’ordinateurs moulinant pendant des semaines. L’idée est de générer des millions d’arbres généalogiques possibles, et de trouver celui (ou ceux) qui permet le mieux d’expliquer comment les racines qui expriment les deux cents notions du vocabulaire de base se remplacent et se succèdent pour chaque notion dans une famille de langues donnée. Prenons encore un exemple : le mot pour demain en latin était eras, mais la plupart des langues romanes ont pour demain un mot provenant d’une forme du latin tardif de mane. Sauf le sarde, qui garde eras. Cela suggère que le sarde s’est séparé du latin avant le latin tardif, avant que de mane ne remplace eras. Dans la méthodologie de Gray, cela favorise les arbres ayant une branche romane-mais-non-sarde. Une fois qu’il a trouvé le meilleur arbre, Gray donne des dates à ses branches et à sa racine. Il le fait en injectant dans son modèle les dates données par l’histoire, comme celle de la naissance du latin ; ce qui lui permet d’extrapoler les dates les plus anciennes (sans d’ailleurs supposer une vitesse d’évolution constante). D’après lui, le proto-indo-européen date d’environ -9 000 ans. De là à penser que les premiers Indo-Européens étaient bien de paisibles fermiers d’Anatolie…