Extrait, pages 13-18 :
Le calcul, qui rend possible l’attribution à Corneille de 16 à 18 des comédies signées par Molière, consiste à superposer les textes, pris deux à deux et à observer leur degré de ressemblante ou de dissemblance. C’est la raison pour laquelle nous avons baptisé ce calcul : « distance intertextuelle ». L’indice de cette distance varie uniformément entre 0 et 1. Un écart nul serait obtenu si les deux textes considérés étaient composés avec les mêmes vocables, employés avec la même fréquence, ce qui est évidemment très théorique. Un indice égal à 1 signifie que les deux textes n’ont aucun mot en commun. Cette situation est aussi théorique que la précédente : le français contient certains mots outils que l’on retrouve dans tout texte en cette langue. Si l’indice a une valeur de 0,5 : la moitié des vocables sont communs, etc.
Cette distance est la résultante de quatre facteurs : l’auteur, le vocabulaire de l’époque, le thème traité, le genre. L’influence de ces facteurs se cumule de telle sorte que la neutralisation de certains d’entre eux permet de connaître avec précision l’influence des autres. Ainsi, deux textes contemporains, écrits dans le même genre et sur des thèmes proches – par exemple deux tragédies utilisant la mythologie grecque ou romaine, une fiction romanesque sur le monde contemporain... – seront toujours séparés par une distance significativement plus grande s’ils ont été écrits par deux auteurs différents que lorsque la plume est la même. Pour rechercher la paternité d’un texte anonyme ou dont l’auteur est contesté, il faut donc le comparer à d’autres dont la signature n’est pas contestée, ayant été écrits à la même époque et traitant de thèmes voisins, dans un même genre (poésie, roman, théâtre...). Autrement dit, si Corneille n’avait signé, sous son nom, aucune œuvre théâtrale, il aurait été impossible de découvrir la part prépondérante qu’il a prise dans certaines des pièces jusqu’ici attribuées à Molière.
Ce calcul a été appliqué à plusieurs milliers de textes de toutes origines (romans, théâtre, articles de presse, discours politiques, entretiens...). Nous raconterons certaines de ces expériences dans cet essai. Elles ont permis de confirmer la validité du raisonnement, d’étalonner une échelle de la distance et de révéler l’existence de quelques seuils caractéristiques.
Une distance inférieure ou égale à 0,20 désigne avec certitude un auteur unique. Même quand un écrivain en "pastiche" un autre, la distance entre le pastiche et les originaux est toujours supérieure à ce seuil.
Entre 0,20 et 0, 25, il est pratiquement certain que l’auteur est le même. Sinon, les deux textes ont été écrits à la même époque, dans le même genre, sur le même sujet et avec des arguments identiques. Ce cas se rencontre parfois dans les textes techniques, ou encore dans les articles de presse, à propos d’un même événement, parce que les journalistes travaillent à partir des mêmes sources et citent les mêmes noms de lieux et de personnes. Dans le cas d’œuvres littéraires appartenant à deux auteurs différents, une distance inférieure ou égale à 0,25 indique soit une collaboration étroite, soit un plagiat certain du second sur le premier (quand il est possible de dire avec certitude qui est le premier !)
Au-dessus de 0,25, on entre dans une zone "grise" où deux hypothèses sont envisageables : un même auteur traitant de thèmes différents ou deux auteurs contemporains traitant un sujet identique avec leur style propre... De telle sorte que, plus on s’élève au-dessus de ce seuil de 0,25, plus il sera difficile d’attribuer la paternité d’un texte anonyme à l’auteur considéré sans que, pour autant, cette paternité puisse être rejetée. Il faut utiliser d’autres moyens, qui n’ont pas la puissance de calcul de la distance, mais qui seront mentionnés au passage.
Au-dessus de 0,40 les auteurs sont certainement différents ou bien, pour un même auteur, les textes sont de genres éloignés, par exemple : oral et écrit.
Cette échelle apporte une simplification supplémentaire au problème de l’attribution d’auteur : pour trouver l’auteur d’un texte douteux ou anonyme, il n’est pas nécessaire de rechercher tous les écrivains susceptibles de l’avoir écrit, il suffit d’en trouver un pour lequel la distance, entre une partie de son œuvre et le texte analysé, sera inférieure aux seuils indiqués ci-dessus.
Le programme a donc comparé chacune des 34 pièces de Corneille avec les 32 attribuées à Molière (la liste de ces pièces, avec leur genre et leur date de création, est placée en annexe I). Il est intéressant de considérer d’abord les distances internes aux deux œuvres, avant de les superposer pour juger de leur éventuelle parenté. A titre d’exemple, le tableau ci-dessous donne les valeurs obtenues sur les plus célèbres pièces de Molière.
|
Tartuffe
|
Dom Juan
|
Misanthrope
|
Avare
|
Bourgeois gentil.
|
Femmes savantes
|
Malade imaginaire
|
| Ecole des Femmes |
0,183
|
0,205
|
0,194
|
0,200
|
0,231
|
0,199
|
0,223
|
| Tartuffe |
0
|
0,199
|
0,167
|
0,199
|
0,230
|
0,170
|
0,219
|
| Dom Juan |
|
0
|
0,204
|
0,170
|
0, 207
|
0,219
|
0,205
|
| Misanthrope |
|
|
0
|
0,210
|
0,239
|
0,173
|
0,239
|
| Avare |
|
|
|
0
|
0,194
|
0,214
|
0,187
|
| Bourgeois gentil. |
|
|
|
|
0
|
0,234
|
0,196
|
| Femmes savantes |
|
|
|
|
|
0
|
0,226
|
Une quinzaine de pièces de Molière se regroupent ainsi, à des distances si faibles les unes des autres que l’hypothèse d’un auteur unique est bien confirmée. Il faut même aller plus loin et souligner la très grande unité existant entre toutes ces œuvres. Au passage, ce tableau met à mal la légende selon laquelle vers et prose engendrent des différences considérables : L’Ecole des Femmes, Tartuffe, Le Misanthrope et Les Femmes savantes sont en vers alors que les autres sont en prose. En revanche, le faux turc du Bourgeois gentilhomme ou le latin de cuisine du Malade imaginaire élèvent notablement la distance, sans effacer la paternité unique pour ces chefs-d’œuvre.
A l’inverse, toujours au sein de l’œuvre attribuée à Molière, quelques pièces figurent à l’écart. Leur distance, par rapport aux chefs-d’œuvre qui viennent d’être évoqués, suggère que l’auteur n’est probablement pas le même : La Jalousie du barbouillé, Le Médecin volant, Les Précieuses ridicules, La Critique de L’Ecole des Femmes, L’Impromptu de Versailles, Le Mariage forcé, L’Amour médecin, Le Médecin malgré lui et La Comtesse d’Escarbagnas. Certains rapprochements sont éclairants. Ainsi L’Ecole des Femmes et La Critique de l’Ecole des Femmes sont séparées par une distance de 0,276 alors que ces deux pièces ont été rédigées seulement à quelques mois d’intervalle et sur des sujets qui ne sont pas étrangers ! Enfin quelques comédies en prose comme Georges Dandin ou M. de Pourceaugnac figurent dans la zone grise qui interdit de conclure... Au total, la distance moyenne dans l’ensemble de l’œuvre de Molière est relativement élevée (0,286), mais cette diversité provient essentiellement de ces quelques pièces en prose atypiques. En considérant les seules pièces en vers, cette moyenne descend à 0,260.
L’œuvre de Corneille ne connaît pas de variations aussi importantes bien que son écriture s’étende sur plus de 40 ans (moyenne entre toutes les pièces : 0,268). La majorité des distances entre ses pièces sont inférieures au seuil de 0,25, sauf pour les comédies du début (de Mélite à L’Illusion comique) qui sont très proches entre elles, mais sont souvent séparées des tragédies qui les suivent par des distances supérieures à ce seuil. Naturellement, cet écart peut être attribué à la différence de genre (comédie/tragédie) et à l’effet "chronologique". Sur une vie aussi longue, l’écriture peut varier de manière importante, surtout que les comédies de jeunesse sont antérieures à la "découverte" de la tragédie par Corneille. Cependant, trois autres comédies s’écartent plus notablement du reste de l’œuvre : le troisième acte de La Comédie des Tuileries, que Corneille écrivit en 1635 pour Richelieu, Le Menteur et La Suite du Menteur, crées en 1642 et 1643. Voici à titre d’exemple, les distances séparant ces deux dernières pièces des tragédies de Corneille qui les précèdent et les suivent immédiatement (afin de neutraliser l’effet de Chronologie).
|
Le Cid |
Cinna |
Horace |
Polyeucte |
Pompée |
Rodogune |
Théodore |
| Menteur |
0,267 |
0,270 |
0,283 |
0,239 |
0,281 |
0,265 |
0,243 |
| Suite du Menteur |
0,276 |
0,274 |
0,282 |
0,240 |
0,280 |
0,258 |
0,233 |
Si ces deux pièces n’étaient pas attribuées avec certitude à Corneille, l’existence de quelques distances inférieures au seuil de 0,25 laisserait supposer cette paternité, mais l’attribution resterait discutable, étant donné la valeur élevée de l’indice obtenu avec les autres pièces, même contemporaines, et surtout... du fait de la grande proximité des deux Menteurs avec pratiquement toutes les comédies en vers de Molière ! (voir le tableau récapitulatif placé en annexe II)
En laissant de côté Dom Garcie et Psyché, la distance, qui sépare les deux Menteurs des comédies en vers signées par Molière, va de 0,205 (L’Etourdi) à 0,240 (Sgnanarelle ou Le Cocu imaginaire et Amphitryon). En moyenne, la distance avec l’ensemble des pièces en vers de Molière est de 0,240 pour le premier Menteur et de 0,234 pour le second. Il ne fait donc pratiquement aucun doute que toutes ces pièces sont de la même main. Naturellement si nous ignorions qui avait écrit les deux Menteurs, leur proximité avec le reste de l’œuvre signée Molière étant plus grande que celle existant avec les pièces de Corneille (y compris les comédies), nous aurions pu affirmer avoir découvert les deux premiers chefs-d’œuvre de Molière (écrits 15 ans avant les autres) ! Ce point est important. Il permet de comprendre certaines réticences envers l’idée que Corneille ait pu écrire la majorité des comédies de Molière, tant celles-ci tranchent avec les tragédies auxquelles on l’identifie spontanément. Mais il n’en va pas de même pour les deux Menteurs, sans doute injustement oubliés, qui sont la matrice d’où sont sortis : L’Etourdi, Le Dépit amoureux, L’Ecole des Maris, Les Fâcheux, L’Ecole des Femmes, La Princesse d’Elide, Tartuffe, Dom Juan, Le Misanthrope, Mélicerte, L’Avare et Les Femmes savantes.
Ce premier examen laisse cependant quelques points dans l’ombre, notamment la position particulière de Dom Garcie et de Psyché. Elles sont très proches l’une de l’autre (0,232) : on peut donc leur supposer le même auteur. En revanche, elles sont assez éloignées des deux Menteurs, comme de tout le reste de l’œuvre officielle de Molière. Le tableau ci-dessous indique, pour ces deux comédies, les distances les plus faibles relevées au cours de l’expérience :
|
Andromède
|
Don Sanche
|
Toison d’or
|
Attila
|
Pulchérie
|
Suréna
|
| Dom Garcie |
0,241
|
0,224
|
0,221
|
0,235
|
0,230
|
0,224
|
| Psyché |
0,218
|
0,251
|
0,220
|
0,225
|
0,223
|
0,216
|
Dom Garcie et Psyché ont donc des sœurs, mais toutes sont des pièces de Corneille, contemporaines de leur création. A vrai dire, le résultat concernant Psyché n’est pas vraiment une surprise puisque, comme nous allons le voir, la paternité de Corneille sur cette pièce a été reconnue du vivant des deux hommes. En revanche, les spécialistes de Molière ont toujours regardé Dom Garcie comme assez étrange. Ils considèrent généralement que cette comédie "sérieuse" détonne dans le reste de l’œuvre. Le tableau ci-dessus montre que Corneille a conçu et réalisé Dom Garcie dans la lignée de ses dernières tragédies. L’aurait-il abandonnée à Molière parce qu’il la jugeait indigne de celles-ci ?