Bonjour et bienvenue dans le podcast Parole d'Histoire pendant la campagne des, la recherche et les débats en histoire continuent et on en parle ici. C'est l'avant dernier épisode de la saison, il est consacré à une démarche fascinante mais pas encore assez répandue en histoire la lexicométrie. La semaine prochaine autour du quatorze juillet on finira en beauté l'année en parlant de la révolution française avec l'un de ses grands historiens Colin Jones nous parlera de la chute de Robert Pierre. Vous retrouvez tout l'été chaque vendredi les émissions avec Alexandre Jublin dans le fil de l'épée via le podcast le collimateur. Retrouvez tous les paroles histoires sur parole histoire point f r sur la chaîne YouTube du podcast. Bon courage, merci et très bonne écoute. Pour cet épisode de parole d'histoire consacré à l'histoire des mots et la façon de les compter en histoire, j'ai le plaisir d'être avec Marie Dejou, bonjour. Bonjour. L'enseigné de l'histoire médiévale à Paris un, également à Paris un en histoire contemporaine, Léo Dumont, bonjour. Bonjour. Et Nicolas Perrot chercheur au CNRS bonjour. Bonjour. Alors vous êtes là tous les trois pour parler de deux livres, un livre que Marie Dejou a dirigé aux éditions de la Sorbonne, Réformatio, les mots pour dire la réforme à la fin du moyen-âge et puis un livre que Léo Dumont a codirigé avec Octave Julien Stéphane Lamassé et Nicolas Perrot signe des textes dans les deux livres, ce livre s'intitule histoire de mots saisir le passé grâce aux données textuelles toujours aux éditions de la Sorbonne, ces deux livres mettent en leur coeur la démarche lexicométrique, textométrique qui consiste à compter des mots, Alors les hauts du mot vous avez la la tâche peu enviable d'essayer de présenter ça de façon simple pour les gens qui nous écoutent, qui ne connaissent pas forcément ces cette méthode, ces démarches en en histoire, c'est quoi la lexicométrie en histoire Alors pour essayer de donner une première approche assez assez rapide, on pourrait donc dire qu'il s'agit d'un ensemble de méthodes informatiques et quantitatives qui visent à étudier le vocabulaire d'un d'un ensemble de textes rassemblés encore plus. Alors une fois qu'on a donné ces quelques éléments, c'est là que les les problèmes commencent parce que bien il faut rentrer dans le détail de ces méthodes bien sûr et puis s'interroger sur ce qu'on appelle le vocabulaire, le vocabulaire d'un ensemble de textes, qu'est-ce qu'un corpus, comment on le constitue, ce genre de choses dont on va sans doute discuter ensemble. Et puis évidemment les, ce qu'on peut en tirer pour l'analyse historique en croisant avec d'autres d'autres méthodes, d'autres approches parce que c'est assez singulier, il n'y a pas tellement de gens qui le font. Alors du coup ça m'amène à vous demander Nicolas Perrot par exemple, qu'est-ce qui vous a amené à ce type de démarche et pas à une recherche plus classique portant sur des sources manuscrites, comment vous êtes affrontés à ces corpus numériques Merci en fait c'est un double intérêt, tout d'abord depuis l'enfance en fait je programme et je m'intéresse au numérique en général et puis évidemment l'histoire médiévale que j'ai rencontrée à l'université, ça a commencé vers deux-mille-sept quand j'ai rencontré Eliana Magnani, je voulais réaliser un master et elle m'a dit on a un corpus précisément pour travailler au croisement de l'histoire environnementale du moyen-âge et des corpus et puis elle m'a orienté vers Alain Guéraud qui m'a suivi tout au long du master et de la thèse avec Eliana Magnani et Daniel Rousseau. Et du coup ça n'a pas quelque chose d'un peu, alors je pose des questions voilà de de personnes un peu naïve qui ne connaît pas ces méthodes de l'intérieur, ça chose d'un peu écrasant quand on débute une recherche en histoire de se dire je vais aller vers des corpus de de millions de mots plutôt que voilà quelques chartes que je sais lire avec la paléographie, ce n'est pas déstabilisant un petit peu. Si effectivement pour être franc, c'est assez terrible. Le problème c'est qu'avec ces méthodes, avec ces ces ces moteurs de recherche chez corpus, on obtient très vite des listes extrêmement longues de dizaines de milliers d'occurrences. Alors qu'est-ce qu'on en fait, c'est un véritable problème. Alors je je vais prendre un exemple que je prends souvent, celui des des moulins, ça traîne dans l'historiographie, c'est assez amusant. Si vous avez cinq moulins, qu'est-ce que vous faites, vous faites un article. Les moulins de l'abbaye de je ne sais pas quoi. Si vous en avez cinquante, vous faites un un master et là c'est très bien, vous étudiez les conflits entre les seigneurs et l'abbaye, vous allez plus loin. Si vous en avez cinq-cent, vous pouvez faire une thèse impeccable, vous creusez toute une région européenne sur les questions des moulins, la chronologie, et caetera. Et si vous en avez cinquante-mille, qu'est-ce que vous faites, La méthode historique est totalement muette sur ces questions parce qu'elle traite des dossiers très précis souvent, on doit distinguer le vrai du faux, on doit analyser et quand on a des dizaines de milliers d'occurrence, on ne sait pas quoi en faire, on n'a pas d'heuristique, on n'a pas de méthode, donc c'est un vrai problème et c'est pour ça la plupart du temps que les collègues reculent et il faut essayer d'avancer justement. Alors vous dites on n'en a pas, mais on en a quand même un petit peu par bonheur et ces livres le prouvent et alors comment vous vous avancez et comment vous êtes confrontés à ça Léo Dumont, vous-même en histoire contemporaine, qu'est-ce qui vous a amené à ce type de de questionnement Alors mon parcours, enfin ce qui est dans mon parcours m'a amené à la lexicométrie, c'est ces deux deux aspects principaux, je pense, c'est d'une part un contexte pédagogique, les enseignements que j'ai reçus en tant qu'étudiant à l'université Paris un qui pour pour le cursus en histoire, bien propose des enseignements en méthode informatique quantitative à l'image de la lexicométrie assez tôt dans le cursus dès la dès la troisième année de licence, donc c'est c'est comme ça que j'ai été initié à ces à ces méthodes, à ces questions. Et puis dans mon parcours de recherche, moi je travaille sur sur la France de mille-huit-cent-quarante-huit et je, bon ce n'est pas très original, mais je travaille notamment sur de de vastes corpus de presse et la presse fait partie des des sources imprimées de l'époque contemporaine qui ont été massivement numérisées par les les institutions patrimoniales. Donc se pose la question de de trouver une approche qui se qui soit adaptée à à l'existence de tel corpus numérisé. La lexicométrie est une possibilité. Marie Dejou, on a eu l'occasion de discuter il n'y a pas longtemps de la justice de Saint-Louis pour une enquête entre guillemets classique, mais vous vous avez aussi plus tardivement au cours de vos recherches, ce n'est pas la base de votre thèse, rencontré cet enjeu de la lexicométrie au point de de diriger le livre collectif donc Réformation. Alors pour ma part, je ne suis, je ne maîtrise pas les les techniques de la lexicométrie, de la lexicographie, c'est important à le dire, mais ça n'empêche pas que j'ai toujours eu un intérêt pour les mots en tant que médiéviste. Alors la grande référence en la matière a été citée, c'est Alain Guéraud où quand on est un apprenti médiéviste et qu'on dit, on lit l'article sur la vigne où il explique quand on dit vigne, on a l'impression que c'est transparent sauf que les vignes médiévales ne ressemblent pas du tout aux vignes actuelles, c'est des d'énormes buissons ultra touffus dans lesquels on ne peut pas rentrer par exemple et puis pour les médiévaux qui dit vignes dit nécessairement le sang du Christ, il y a des dimensions qui sont des dimensions spirituelles et religieuses qu'on ne peut pas évacuer. Je me rappelle je me permets de dire que c'est moi-même par la couverture du livre d'Alain Guéraud, l'avenir d'un passe incertain avec cette image sous-titrée ceci n'est pas une vigne que mon propre intérêt pour ces questions de béotien est né donc effectivement il a un rôle je pense assez central ça a été dit. Centrale et et ma thèse pour ma part était constituée aux enquêtes que j'ai intitulé de réparation de Saint-Louis parce qu'il s'agissait de restituer des biens mal acquis et dans l'historiographie on lisait partout que c'était des enquêtes de réformation, Mais pour l'apprenti doctorante que j'étais, je ne comprenais pas pourquoi je ne trouvais jamais ce terme de réformare, réformation pour en parler, il y avait les Mendatio, il y avait la restitution, il n'y avait jamais ce terme-là. Et ça a été aussi le début d'une d'une quête parce que quand on est doctorant, si les plus grands avant nous ont dit qu'il s'agissait d'enquête de réformation, on est paralysé. Et il faut oser en fait revenir au lexique des médiévaux pour essayer de comprendre véritablement quelles étaient leurs intentionnalités. Donc les mots c'est totalement central pour comme point de départ et même comme point parfois d'arrivée des recherches. Doux, journée d'études, programme de recherche collectif, ce livre est le fruit finalement non seulement d'un intérêt pour les mots, mais aussi d'un travail. Exactement et un travail que je ne pouvais pas mener seule puisque justement j'avais fait la culbute de la réformation à la restitution, la la réparation dans la thèse et je me demandais, mais alors pourquoi ce terme pour qui sature le récit de l'histoire médiévale, dès qu'on parle d'histoire politique, on voit des réformes partout, des réformateurs partout et j'étais incapable de mener cela toute seule, d'autant que l'idée c'était de mener un programme à une échelle européenne en mêlant des chercheurs qui venaient de du champ de l'histoire religieuse, le champ de l'histoire politique. Et ce qui est intéressant d'ailleurs dans ce volume et c'est pour ça que quand Nicolas disait que c'était des des méthodes qui pouvaient paraître un peu terrorisantes à à nos collègues, chacun est venu avec ce qu'il savait faire. Donc on a des gens qui comme Nicolas sont capables de de maîtriser des corpus de millions de mots et, mais on a aussi des gens qui ont pris simplement un tout petit dossier, qui ont essayé de de de calculer plus manuellement. Donc pour moi l'essentiel c'est véritablement de partir des des mots pour réussir à à à comprendre les représentations des médiévaux. Alors c'est intéressant parce que ces deux livres sont des livres collectifs, on a parlé d'enquête collective, il y a il y a une dimension collective presque consubstantielle à ce type de travail parce qu'un un corpus ça ne se fait pas tout seul, ça ne s'interroge pas tout seul, du coup si on revient un petit peu sur la manière dont ça s'est développé depuis particulier les années mille-neuf-cent-soixante-dix, je ne sais pas si le haut du monde voulait peut-être donner un un éclairage, il y en a un dans le livre que vous que vous co dirigez sur en particulier les années mille-neuf-cent-soixante-dix, le rôle de Jean-Philippe Genet notamment chez les médiévistes qui a qui a été important, comment est-ce que c'est né cette idée de de compter les mots et de se donner des outils informatiques à une époque évidemment on était très loin des puissances de calcul actuelles donc est-ce qu'on peut faire un peu la la préhistoire ou la la genèse de ces démarches On peut essayer. Alors oui, effectivement, il va y avoir notamment dans dans le champ de l'histoire pour le coup avec les années mille-neuf-cent-soixante-dix un un véritable démarrage et le et les premières publications mille-neuf-cent-soixante-treize, l'ouvrage de Régine Robin histoire et linguistique qui est un ouvrage collectif aussi où il y a toute une réflexion et des études de cas, c'est un livre un peu hybride, des études de cas qui présentent sur différents objets d'études d'histoire et d'historienne la mise en oeuvre de ces méthodes. L'année suivante en mille-neuf-cent-soixante-quatorze, il y a le livre, alors qui est signé par Antoine Praudet, c'est un travail collectif sur le vocabulaire des proclamations électorales de la troisième République. Le le fameux barreau. Alors voilà, c'est à partir du du corpus, du fameux, le fameux corpus du barreau Days qui existe toujours. Et donc là on est, on on cite en général ces deux ces deux ouvrages pour pour montrer le le démarrage en quelque short, en quelque sorte pardon chez les historiens et les historiennes de de l'emploi de ces méthodes. On peut remonter un peu avant en fait, c'est le, c'est dans les années mille-neuf-cent-soixante où il y a dans avec le développement en fait de de ce qu'on va appeler la nouvelle histoire, un un fort intérêt pour pour les rapports avec la linguistique, un un nouveau regard qui se pose sur le texte aussi. Duby dans ces années-là, publie des articles où il appelle à la coopération avec avec les linguistes par exemple. Et il y a la la fondation notamment donc à l'école normale supérieure de Fontenay-saint-clou à l'époque d'un centre de recherche qui va s'appeler alors échange de nom au fur et à mesure mais qui se, on va qu'on va appeler le le centre de lexicométrie politique de de l'ENS Fontenay-inclu, qui va être fondé par Robert Léon Wagner et puis ensuite dirigé par Maurice Tournier pendant longtemps, où vont être développés de manière collective beaucoup beaucoup de méthodes qu'on emploie encore aujourd'hui en en lexicométrie Ils publient eux une sorte d'ouvrage manifeste en mille-neuf-cent-soixante-quinze sur les tracts de mai soixante-huit, qui est un petit peu la la démonstration en fait scientifique des travaux qu'ils ont entamé depuis une dizaine d'années. Voilà quelques repères peut-être pour pour commencer à poser des, un peu de chronologie. Alors cette chronologie, il me semble qu'il y a une accélération dans les années quatre-vingt-dix deux-mille, puisque d'une certaine manière on a construit les outils presque avant d'avoir les corpus, parce que dans un deuxième temps, il y a la la constitution de de gigantesques corpus numérisés en particulier chez les anti-quisans, chez les, chez les contemporainsistes, il y a les grandes institutions patrimoniales comme la BnF qui se mettent à numériser massivement donc on a des outils d'analyse pour bien comprendre la lischiométrie à la fois des corpus, c'est-à-dire des quantités de textes numérisés puis des outils, des logiciels en particulier d'analyse et donc ces corpus, il a fallu du temps malgré tout pour qu'ils soient constitués, opérationnels, Nicolas Perrot a chapeau à la tête alors peut-être expliquez-nous. Mais en fait c'est un peu délicat parce que la chronologie très juste que vient de présenter Léo, elle est effectivement elle est effectivement très complexe en fait, ça s'inscrit dans un temps très long. Cette idée de traiter les mots pour accéder aux représentations et aux structures sociales, elle est ancienne, on la retrouve chez Homboldt, chez Erder. Donc il y a cette idée que par le lexique, on va accéder à des pans de la société. Et la constitution de corpus en fait, elle remonte tout simplement à la philologie et à l'histoire, alors certes ce n'est pas le même type de corpus, ce n'est pas des corpus numériques, mais il y a déjà ces corpus, ces grandes collections. Oui la démographie aussi. Voilà bien sûr et puis dès dix-neuf-cent-quarante-neuf Roberto Buza envisage le corpus tomysticom en en partenariat avec IBM et c'est pour faire de la sémantique computationnelle. C'est-à-dire le les oeuvres de Thomas d'Aquin numérisent, en tout cas interrogeables. Par carte et donc interrogeable. Et donc finalement ça traîne depuis quasiment toujours cette idée qu'on va pouvoir compter les mots, mais ça a toujours été fait par une minorité de chercheurs parce qu'on se heurtait à des problèmes à la fois technique et heuristique. Dans les années effectivement soixante soixante-dix, une partie de ces problèmes techniques ont été résolus, alors certes on n'avait pas la puissance de calcul, mais on pouvait déjà faire beaucoup et ça a été un peu fait puis ça a été abandonné pour des raisons à mon sens heuristiques parce que le principal problème c'est celui de la méthode historique, qu'est-ce qu'on va pouvoir tirer de la langue et comment on peut reconstituer des systèmes de représentation des systèmes sociaux à partir des mots. Ce qui fait que dans les années à la fin des années quatre-vingt et surtout les années quatre-vingt-dix en fait les choses se sont totalement bloquées. Au moment où les ordinateurs personnels sont arrivés donc les PC en masse, et bien en fait on a arrêté quasiment de faire ces méthodes et c'est revenu plutôt à partir des années deux-mille et surtout deux-mille-dix. Et là je crois que la numérisation de la société et les smartphones jouent un rôle central. Parce que ça change complètement notre rapport au texte, on est envahi de ces méthodes partout parce que n'importe qui utilise télécharge des choses aujourd'hui en permanence et donc même les médiévistes et les historiens se disent on pourrait faire peut-être ça aussi avec nos corpus. C'est une histoire finalement qui est très sociale au sens le plus large, il y a eu des freins, il y a eu des des des accélérations, mais ce n'est pas ce n'est pas du tout linéaire et finalement ça s'inscrit vraiment sur le temps long. Sur le temps même très long parce qu'on pourrait presque dire que la place qu'ont les médiévistes dans le développement de ces interrogations renvoie aussi à des techniques du savoir médiéval lorsque les médiévaux produisaient des concordances et s'interrogeaient sur la la fréquence des textes dans les écritures d'une certaine manière vous prolonger des réflexions qui étaient celles d'Isidore de Séville et d'autres. Alors moi je je suis toujours dans l'idée qu'il y a une rupture profonde entre les les les médiévaux et nous néanmoins effectivement l'idée c'est comment on met en forme le savoir, comment on on extrait du sens des des des discours et des mots. Et effectivement c'est une histoire très ancienne, pluriséculaire et bon ça s'accélère autour de nous, on le voit bien puisque un tas d'entreprises fonctionnent comme ça, en extrayant du sens de corpus pour pouvoir vendre les infos qu'ils produisent ainsi et donc l'enjeu aujourd'hui c'est de transformer ces méthodes utilisées par les grands groupes pour que nous-mêmes nous en tirions quelque chose et d'ailleurs ça permet de montrer que ces méthodes appliquées au capitalisme, et bien elles peuvent aussi servir à la production de savoir. Pour revenir à ma question des corpus, concrètement à partir de quand la base par exemple des chartes latines et opérationnelles entre guillemets complète, interrogeable, c'est c'est à quel moment que ça devient un outil on va dire d'usage courant. Alors pour merci de la question effectivement je pense que tu parles peut-être des des CEMA les cartes à Europeain et Médiévy que que j'ai développé, en fait dès le début de de de mes travaux, j'ai commencé à glutiner toutes les bases de charte qui existaient pour tout réunir dans un seul corpus, donc autour de deux-mille-neuf, deux-mille-dix, j'avais cent-vingt-mille chars quelque chose comme ça. Aujourd'hui il y en a trois-cent-vingt-mille dans le corpus, au départ c'était interrogeable pour moi en fait, mais beaucoup de collègues m'ont dit il faudrait que tu diffuses, il faudrait que tu mettes ça, je n'ai jamais pensé à à ça comme ça, je n'ai jamais demandé de d'argent pour le faire, je n'ai jamais déposé de projet et et donc aujourd'hui c'est accessible effectivement mais ça fait une dizaine d'années que je fais circuler des copies et caetera en me disant c'est pas parfait donc il faut pas diffuser pour le moment, mais ça progresse donc voilà. Non on voit que il n'y a pas que les les l'ABX et européens d'excellence et caetera qui peuvent produire de de la bonne recherche et des outils extrêmement extrêmement importants. Alors sur cette question des outils, on est obligé d'entrer dans certains enjeux un peu techniques, mais importants. Il y en a deux en particulier sur lesquels j'aimerais vous redonner la la tâche pas évidente de les présenter, notamment un enjeu qui est celui de la lématisation parce que chercher des mots, ce n'est pas forcément chercher un mot unique, c'est chercher des mots qui peuvent se retrouver sous plusieurs formes. Alors peut-être expliquez-nous pourquoi c'est important. Oui alors, assez vite c'est lorsqu'on on on envisage de mesurer du vocabulaire, du lexique, des unités lexicales en fait, c'est plutôt en général ce par cette désénation-là qu'on qu'on qu'on parle de ça, se pose la question d'en fait qu'est-ce qu'on va compter. Donc de prime abord on parle de mots, mais derrière cette notion il y a il y a toute une une complexité à à déconstruire et il y a ce fameux problème de de l'alématisation, alors problème qui a fait l'objet de de discussion, l'hématisé pour le dire rapidement pour quand quand on ne connaît pas le terme, c'est ce qu'on fait, alors on fait moins, mais quand on cherche des décisions d'amende dans un dictionnaire par exemple, donc pour le dire, le dire très concrètement, je ne sais pas, on a un verbe conjugué à la troisième personne du pluriel, je ne sais pas quel temps, on va chercher la forme infinitif si on cherche sa définition. Donc c'est ramener en fait des des formes, des formes conjuguées au pluriel, au au au et cetera, à une forme vedette qui serait celle de l'entrée dans un dictionnaire. Donc l'hématisé c'est homogénéiser en fait le vocabulaire derrière des des formes vedettes qui qui vont servir de d'unité de comptage. Peut-être je demande à Marie Dejou si on prend un exemple très concret avec reformatio, c'est dire que pour chercher les mots de la réforme, on ne va pas simplement rechercher réforme arrêt mais je ne sais pas réforme arrêt réforme à tous et caetera et caetera enfin voilà que il faut décliner sinon on ne va pas tout trouver. Exactement, donc du coup c'est pour ça que souvent on procède aussi par racine, réforme pour être sûr de pouvoir ensuite trouver toutes les autres formes qui en dérivent en français et en latin. Oui alors il y a aussi la racinisation par exemple qui consiste à ramener en fait au début des mots les les les unités lexicales qu'on qu'on va mesurer. Ce qu'il faut bien voir aussi c'est que parfois les matises ce n'est pas une option pour les périodes les plus anciennes, là il y a des médiévistes qui en parleront mieux que moi dans dans sur le dans notre studio, mais mais parfois la langue n'est pas n'est pas homogène, un même auteur peut désigner enfin écrire dans le même texte le même mot de avec différentes orthographes, donc si on veut pouvoir comparer, il faut en fait pouvoir avoir pouvoir homogénéiser tout ça, donc l'hématisé parfois c'est c'est tout simplement la condition en fait de mise en oeuvre de de la textométrie. Ensuite d'un point de vue, d'un point de vue des des différences en termes de résultats sur des textes contemporains par exemple, il a été montré que que on n'avait pas des des des très très importantes en fait entre un corpus lématisé et un corpus dit en forme graphique. Ensuite ce qu'il est important de souligner c'est que ça permet de regarder aussi différents aspects d'un texte. On va plutôt parler uniquement de l'hématisation, il faudrait parler d'annotation d'étiquetage en fait du vocabulaire. Ce qu'on fait souvent aussi c'est qu'on on précise pour chaque mot ce qu'on appelle les étiquettes morpho syntaxiques, c'est-à-dire la fonction grammaticale, la nature, ce genre de choses qui permet de travailler sur l'énonciation par exemple, l'utilisation des temps verbaux dans un corpus. Donc ça démultiplie aussi les les possibilités en fait d'interrogation et de construction d'hypothèses sur un sur un corpus qu'on va pouvoir qu'on va pouvoir tester dans un second tour. Avec un problème parallèle qui est celui des de la synonymie puisque si on cherche que réformer, réformation et caetera, on risque de passer à côté de termes qui ont un sens proche, mais qui sont peut-être plus utilisés ou qui justement permettent de de de permettre de déceler des distances ou des convergences et caetera. Il y a un exemple qui est pris dans un des textes qui sont publiés ici qui est ivrognerie alcoolisme, si on cherchait un seul de ces deux mots en histoire contemporaine, on risquerait de passer à côté du sens de beaucoup de discours qui sont produits. Alors là, c'est un problème peut-être plus général encore qui est celui de, ce qu'il faut avoir en tête c'est que la démarche lexicométrique qui consiste à à compter les mots, ça repose sur le principe d'une déliarisation du texte. Donc en fait, on va isoler les mots les uns des autres et perdre le le contexte d'apparition d'un mot qui est pourtant ce qui lui donne son sens. Donc il y a toute une toute une phase du travail lorsqu'on emploie les les méthodes dans les zones textuelles qui consistent à à recontextualiser les mots pour justement pouvoir retravailler sur sur ces questions des des des ce qu'on appelle les cooccurrences, c'est-à-dire la façon dont les mots entretiennent des réseaux entre eux et pourquoi pas du coup pouvoir travailler sur sur ces phénomènes de ou des choses comme celle-ci. Alors que l'occurrence ça m'amène à me tourner vers Nicolas Perrot parce que dans un des textes que vous signez sur la paternité, le vocabulaire de la paternité dans l'occident médiéval, vous montrez très bien que si on regarde quels sont les mots qui figurent à côté de patère à différentes époques, ce n'est pas les mêmes tout le temps. Le Pater romain, il est plus proche de familia, filus, servus, et caetera, le Pater chrétien, il est plus proche de du vocabulaire de la trinité ou du vocabulaire de la domination sociale. Donc regarder les mots qui sont proches les uns des autres, les concurrences, c'est fondamental pour déceler au-delà du nombre du sens. Absolument et ça c'est un enjeu central du croisement entre la linguistique et l'histoire que beaucoup avaient perçu encore une fois là depuis très longtemps, mais qui était impossible à mettre en oeuvre parce que ça demande des calculs assez importants à la fois cette recherche des cooccurrences et cette recherche de la synonyme, c'est des méthodes différentes avec des questions vectorielles ou des questions simplement de calcul d'occurrence. Mais effectivement, c'est un problème central et en particulier pour les sociétés anciennes dont l'altérité ne nous est pas perceptible d'emblée. Alors comment on fait pour comprendre, pour modéliser leur fonctionnement, et bien il s'agit de précisément regarder ce lexique comme l'a dit Marie tout à l'heure pour pouvoir reconstruire leur logique propre. Alors là il y a plein de méthodes qui existent qui sont à développer dans le cas de Pater effectivement c'est c'est assez amusant mais c'est pour l'ensemble du lexique média parce qu'on dispose d'un corpus antique romain entre guillemets païen, latin et on dispose des pères de l'église juste après et donc on peut comparer. Et alors là c'est fabuleux parce qu'à chaque fois qu'on compare les cocurants dans le corpus païen et dans le chez les pères c'est totalement différent. Effectivement Pater dans le système romain renvoie au système sénatorial, à la transmission et caetera et puis évidemment chez Augustin on regarde et c'est tout de suite Pater c'est la trinité et donc c'est lié à Filius et caetera tout un système différent. Donc avec cette modélisation d'une certaine façon de l'environnement des mots, il y a encore une fois il y a plein de méthodes qui ne sont pas opposables et qui sont complémentaires pour le faire, bien on rentre d'une certaine façon dans les systèmes de représentation et dans les structures sociales. Ça change en profondeur le paradigme historien je pense parce que on sait tous que les systèmes anciens sont totalement différents des du nôtre, mais comment on fait en fait On ne peut pas faire de l'ethnologie et aller sur le terrain pour redemander tendre le micro comme tu fais aujourd'hui pour nous pour dire qu'est-ce que vous en pensez et donc bon on est obligé de de regarder ces textes, mais évidemment on les regarde avec nos lunettes, avec nos propres macro concepts que ce soit culture, politique, économie, religion qui déforme fondamentalement cette altérité. Et bien en regardant comment fonctionnent ces mots dans leur contexte comme l'a dit Léo, et bien on restructure des champs de représentation progressivement grâce aux méthodes structurales parce qu'il ne faut pas non plus opposer qualitatif et quantitatif et on arrive à mieux comprendre comment fonctionnaient ces sociétés. Je prolonge juste la question parce qu'il y a dans dans votre article sur Bater, il y a un passage fascinant où vous montrez qu'il y a une invention médiévale de la paternité. Paternitas n'existe pas en latin antique et ce sont les médiévaux qui l'emploient et du coup qui vont lui donner tout un champ sémantique qui est en partie devenu le nôtre, mais en partie seulement, donc là il y a vraiment une rupture fascinante. Absolument merci, c'est c'est assez drôle effectivement ce n'est pas un ce n'est pas un mot antique du tout, paternita, c'est un terme médiéval, fondamentalement médiéval et il désigne la paternité entre guillemets parfaite, c'est-à-dire la paternité spirituelle. C'est d'abord celle du pape puis des évêques, c'est-à-dire ceux qui reproduisent le système, mais qui le reproduisent spirituellement puisque la paternité médiévale c'est d'abord et avant tout comme dans le système de parenté, une parenté spirituelle. C'est cette parenté qui est valorisée comme l'a montré à de nombreuses reprises Anita Guerau Jalabert et qui est placé au-dessus de tout donc c'est pour ça que le pape dit, j'ai la paternitas parce qu'il reproduit le système. Donc c'est une invention médiévale parmi beaucoup d'autres et comme mes collègues sans doute, moi je suis persuadé que c'est le génie de ce système de l'Europe médiévale que d'avoir inventé des concepts pour penser la société et la pensée de manière abstraite. Alors je me tourne vers Marie Dejou pour parler peut-être plus en détail du du volume Réformatio que vous avez dirigé, les mots pour dire la réforme à la fin du moyen-âge parce que autant on va trouver pater paternitas, autant finalement réforme, reformatio, on le trouve assez peu. Et là il y a un paradoxe que vous expliquez dans le livre qui est que c'est un angle de lecture historiographique absolument gigantesque et les candidats candidates à la grecque en savent quelque chose en ce moment. Et pourtant les médiévaux finalement parlent relativement peu avec ces mots-là. Et bien exactement le le le point de départ, c'est comme on il s'agissait de de faire une histoire politique, que le terme réforme est vraiment un terme qui est structurant dans notre champ politique actuel, à tel point que je rappelle qu'il y a Emmanuel Macron dans Macron un avait essayé de de de zapper ce terme en parlant de de l'État, de ouais, et caetera. C'est c'est un terme qui a un passé, mais qui a aussi un passif pour celui qui se dit le, incarner un changement et une rupture par rapport à ce qui se faisait précédemment. Donc, il y avait cette interrogation citoyenne et puis il y avait aussi cet cet étonnement face à la pratique qu'ont les médiévistes de narrer leurs périodes de réformes en en réformes. Et puis on peut rappeler qu'il y en a beaucoup avant bien avant qu'on s'assouvienne. Avant quinze-cent-dix-sept, non mais c'est pour les non médiévistes peut-être qu'il faut le le redire, le moyen-âge est scandé par les historiens de réformes. Oui surtout les les historiens de de de l'église, mais pas que, en pensant à la réforme carolingienne, les réformes cabochiennes, la réforme grégorienne qui bien entendu est un paradigme encore très fort aujourd'hui. Et la question c'était, mais pourquoi est-ce qu'on a besoin de voir des papes réformateurs partout, pourquoi est-ce qu'on a besoin de voir des rois réformateurs partout, est-ce que derrière c'est encore une manière de revaloriser notre période qui a mauvaise presse, dans les, il y aurait de temps en temps des raies de lumière ou d'un seul coup les changes, les choses changent et se réforment, d'autant que les historiens du du religieux avaient commencé à nettoyer un petit peu leurs outils conceptuels notamment Charles de Miramont avait fait un très bel article pour montrer l'invention de la réforme grégorienne à la fin du dix-neuvième siècle comme paradigme dominant. Oui, attention dans un contexte spécifique franco-allemand, de rapport compliqué avec l'église du dix-neuvième et donc du coup projection sur le moyen âge d'affrontement contemporain pour le dire vite. Exactement plus plus le le l'église catholique qui ne voulait pas être en reste face à la réforme luthérienne et qui s'est saisie du paradigme en disant, mais nous aussi on est capable de réformer. Donc il y avait, il y avait tout ce toute cette ce ce point de départ qui était l'omniprésence de ce lexique dans notre société politique et dans l'historiographie médiévale et de l'autre côté la rareté extrême de ce terme qui déjà n'existe pas puisque la forme courte de réforme, elle arrive à l'époque moderne avec un autre grand concept qui est le progrès, donc à partir de ce moment-là le le le terme a changé. Avant on avait justement Réforme Aré qui est un terme qu'on trouve chez à à l'époque antique. Les médiévaux comme le disait Nicolas Perrot avec Padernita, c'est ce qu'il montre dans son article, inventent le concept, pour justement parler de de cela, mais quand il parle de réformation, il parle de de quelque chose qui est totalement différent puisqu'en fait il s'agit de, ce n'est pas la réforme, c'est la reforme du monde qui a été déformée nécessairement par le temps qui passe depuis la chute. Donc d'une certaine manière, on fait des réformateurs, des progressistes aujourd'hui, alors que les réformateurs médiévaux, enfin ce que l'historiographie considère être comme des réformateurs, eux se disent des conceruatores, c'est-à-dire qu'ils ont la charge de conserver cette forme qui était idéale parce que justement comme le montre bien Nicolas Perrot dans son article, elle est hors temps. Justement comme le montre bien Nicolas Perrot dans son article, elle est hors temps. Il s'agit de s'extraire du temps, le siècle avançant, on se charnalise, c'est-à-dire qu'il y a la reproduction charnelle qui fait qu'on est de plus en plus loin de cette forme idéale qui était la forme de de Adam et Eve, donc forcément reformer c'est la tentation de de de réparer le monde, de le rénover, mais parce qu'il a été abîmé. Donc on est dans un contresens total vis-à-vis de ce que les médiévaux entendaient faire. Alors Nicolas Perrot, Marie Dejou a résumé votre votre propos, mais cette idée très forte selon laquelle pour les médiévaux réformés n'est pas réformés mais reformés, comment on la prouve, comment on la mesure dans les textes Et bien par les concurrences en particulier et par les fréquences tout simplement du lexique déjà voir effectivement comme Marie vient de le dire que certains des termes qui sont dominants dans l'historiographie sont en fait rares, à dire que parfois il y a même des formes latines qui apparaissent, on dit c'est la reformatio pour appuyer comme si c'était dans les textes, mais souvent c'est un terme relativement rare et par les concurrences et on voit qu'en fait l'obsession des médiévaux, mais qui est aussi relative au baptême et à la question de la spiritualisation, la spiritualisation pardon c'est de nettoyer. Il faut effectivement nettoyer les choses parce que depuis la chute tout se déforme en permanence et ça on le voit, c'est toujours cette référence à la dégradation du siècle, donc le le champ sémantique c'est le temps, enfin les temps, le siècle, tout ce qui fait que l'équilibre entre le spirituel et charnel est sans cesse penche du côté charnel et ça dégrade les choses et ça on le voit bien dans le lexique, encore une fois, c'est des termes rares et c'est des termes qui renvoient à à toute autre chose. Et cette rareté elle est vraiment intéressante dans le cas de de l'enquête dirigée par Marie parce que ça montre qu'il y a une totale inadéquation entre un un une lecture historiographique, paradigmatique et le système médiéval et c'est là justement que c'est intéressant, on en parlait tout à l'heure, c'est que je trouve que ça permet de de rentrer dans le système de représentation et de dire, mais ça marche pas du tout de la même manière. En fait finalement cette obsession réformatrice, c'est parce que nous nous pensons la dynamique de nos sociétés de cette manière. Donc on estime que toutes les sociétés ont fonctionné comme ça. Et là ce que vient nous dire cette enquête collective, c'est, non les sociétés elles ont une dynamique, mais totalement différente, elles se sont pensées différemment et ce n'est pas du tout la même orientation, ce n'est pas par les réformes qu'elles évoluaient, c'est par autre chose. Et donc ça pose aussi la question en creux, ah mais comment elles évoluaient Pourquoi Qu'est-ce qui les motivait et quelles étaient leurs leurs dynamiques finalement Donc là ça change véritablement même l'orientation historienne, se dire comment ça fonctionne une société ancienne en fait. Alors si je voulais vous pousser un petit peu dans dans les retranchements historiographiques, est-ce qu'on ne pourrait pas dire que forcer sur une société ancienne d'autres schèmes de fonctionnement, est-ce que ce n'est pas ce qu'ont toujours fait les grands savants, les Max Weber, Marx pour dire voilà on va employer des vocabulaires comme bourgeoisie domination qui n'étaient pas le vocabulaire indigène des gens qu'on étudiait mais qui nous permettent nous d'avoir une lecture plus pertinente parce que nous avons conscience de processus qui échappaient aux acteurs eux-mêmes donc est-ce que est-ce qu'il faut entièrement se débarrasser de cette idée de réforme sous prétexte qu'on n'utilisait pas Réformatio Bien sûr que non et d'ailleurs c'est la conclusion à laquelle arrive l'ouvrage, il ne s'agit pas d'interdire aux médiévistes de l'emploi de de ce terme-là, mais simplement de leur faire comprendre qu'il y a là un concept. Et pour que ça ne devienne pas un concept écran, mais un paradigme heuristique, je pense par exemple à l'espace public arbermatien qui avait été analysé par Patrick Boucheron et Nicolas Offenstadt dans un volume collectif, s'était dit tiens, est-ce que ce concept s'applique à la société médiévale Ça avait donné un bouquin qui était extraordinaire. Donc ça serait simplement dire réfléchissez quand vous avez envie de qualifier une action politique de réforme, ça peut être en effet très fort heuristiquement, ça peut être un concept utile, si, mais si vous avez conscience que c'est un concept que les médiévaux eux-mêmes n'avaient pas. Alors du point de vue de la méthode, le livre collectif issu donc d'une enquête collective que vous avez dirigée, il confronte plusieurs éléments et plusieurs échelles aussi. L'idée c'est à la fois d'avoir cette pesée globale dont Nicolas Perrot a parlé du vocabulaire, du mot et formation finalement très peu présent par rapport au paradigme historique, mais aussi de montrer que sur tel ou tel terrain en Castille, en Angleterre dans les villes italiennes, voilà les mots n'ont pas forcément le même sens, les poids respectifs des vocabulaires ne sont pas les mêmes, donc comment vous avez articulé les échelles locales et puis un peu la la pesée globale. Alors tout d'abord je je tiens à remercier chacun et chacune des collègues qui ont participé à ce volume, parce que chercher un mot qu'on ne trouve pas dans des corpus parfois longs et larges pour justement faire la démonstration, parce qu'il fallait bien la faire vis-à-vis notamment des collègues, regardez le problème c'est que ça ça n'existe pas ou alors ça existe rarement parce qu'on a toujours des collègues qui se disent, mais si moi je l'ai dans mes sources, oui, tu l'as dans, tu l'as dans tes sources, mais tu l'as une fois sur un corpus de de dix-mille est-ce que du coup tu penses que c'est un terme dominant Alors ça c'est très très important parce que ça renvoie aussi à la à des questions de preuves, c'est-à-dire comment est-ce qu'on prouve que quelque chose est opérant, la question des ordres de grandeur, de la représentativité, du du poids significatif ou non d'un mot, mais on pourra aussi bien prendre un phénomène social, on pourrait dire voilà le cerf qui devient libre et qui va en justice, est-ce qu'il est représentatif de tous les ser ou est-ce que c'est une exception statistique, ça ça renvoie des questions fondamentales du métier. Exactement et c'est c'était un petit peu l'idée et c'est je remercie les collègues parce que c'est, ce n'est pas facile de travailler sur quelque chose qu'on ne trouve pas. Il y a un bel article d'Aude Merret qui justement essaye de se poser des questions, qu'est-ce qu'on fait quand on ne trouve pas le mot, est-ce qu'on ne le trouve pas et qui justement utilise des des méthodes purement de lexicométrie, de lexicographie pour essayer de de répondre à la question. Et l'idée en effet c'était d'essayer d'avoir encore plus de documentaires sur dans l'idéal l'Europe, avec des des types documentaires très différents, des corpus législatifs, des chartes et caetera et caetera. Donc bien entendu, il fallait qu'on qu'on le fasse à à plusieurs Et puis il y avait la difficulté, Nicolas Perrot fait un article qui tient de prologue parce que justement il a constitué ces bases qui sont gigantesques en agglutinant comme il disait d'autres corpus et en saisissant aussi beaucoup de choses parce qu'il est modeste. Bien pour la la fin du moyen-âge, comme on a une une documentation qui accroît de manière exponentielle, nous n'avons pas les bases et les corpus. Donc il fallait aussi, on on a on a aussi beaucoup bidouillé. Mais c'était un petit peu l'idée aussi, c'était un programme qui visait à à n'exclure personne et à faire aussi comprendre aux collègues que même si comme moi, ils ne sont pas des lexicographes et des lexicomètres achevé, On peut quand même travailler avec des gens qui maîtrisent ces méthodes-là, on peut essayer de comprendre ces méthodes-là parce que du coup on ne on n'apporte plus les corpus de la même manière. Pour aller de dans le sens de ce que vous venez de dire, je citerai justement un passage d'Alain Guéroud dans un de ces textes qui dit qu'il ne faut pas confondre imprécision et approximation. L'approximation, c'est normal en science et le but des sciences, c'est de réduire l'amplitude des approximations, même de façon parfois artisanale, bricoler, mais évidemment, c'est c'est c'est ce que vous faites peut-être, peut-être un autre point que soulève votre livre, c'est de montrer qu'il y a des poids des historiographies nationales. Je pense à l'article de François For Honda qui montre que finalement en Espagne, l'obsession de la réforme qui est présente dans l'historiographie française, elle est beaucoup moins, beaucoup moins présente, en tout cas ce n'est pas un un paradigme aussi dominant du coup, c'était plus évident pour lui de relire les sources espagnoles en disant je ne le trouve pas, mais finalement je ne m'attendais pas à le trouver parce que ce n'est pas surdéterminé par le poids de la réforme en historiographie francophone. C'est en effet extrêmement intéressant de voir que par exemple le le l'Espagne et l'historiographie espagnole est une historiographie qui a fonctionné sans la réforme grégorienne. C'est-à-dire que la première fois que la réforme grégorienne apparaît, c'est en mille-neuf-cent-quatre-vingt-huit dans un titre et c'est un collègue espagnol qui travaille avec des français, alors que que nous ça devient quand même, c'est si on prend la la nouvelle histoire du moyen-âge de Florian Mazel, c'est la flexion désormais centrale du moyen-âge. Alors bien entendu, ce n'est pas la réforme grégorienne telle que Flich l'avait défini. Ici c'est une réforme qui se déroule entre les onzième, treizième siècles et qui est une une refonte plus générale de toute la société. Mais c'est c'est c'est assez amusant de penser que des historiographies ont fonctionné sans la réforme, mais parce que aussi ça correspond à des des des parties de l'Europe où la révolution industrielle qui a véritablement imposé aussi ce ce terme de progrès d'une société qui par l'industrie progresse est moins marquée dans des sociétés méditerranéennes comme en en Espagne, donc on on mesure aussi le le poids de la la révolution industrielle dans ce type de de de choses-là. Nicolas Perrot. Merci et et effectivement pour rebondir sur ce que vous avez dit tous deux autour de la question des concepts en histoire, Je crois qu'il faut bien distinguer l'usage des concepts, c'est-à-dire quelque chose qu'on va travailler comme le précise Marie qu'on va tenter de définir dont on va avoir la portée heuristique, les implications méthodologiques et l'usage des notions. Parce que le problème, ce n'est pas l'usage de concept à la rigueur, on a dit tout à l'heure le le nom de Marx, Marx alors certes sur le moyen âge il a aussi employé des notions, mais il tente de forger des concepts abstraits, c'est-à-dire des outils dont il va pouvoir se servir pour analyser les sociétés. Tandis que précisément la réforme, c'est une notion, c'est quelque chose de vague en fait qu'on prend et puis qu'on plaque et ça, c'est vraiment ce qu'il faut éviter. Donc le problème, ce n'est pas trop l'usage finalement de de termes, encore que certains macro concepts sont à mon sens inutilisables pour les sociétés anciennes, mais c'est plutôt le fait de les prendre et puis de les plaquer sans les travailler. Oui ce qui correspond aussi finalement à toutes les propositions un peu sérieuses qu'on travaille autour de l'interdisciplinarité, c'est le l'emprunt l'empreinte invoquable puisé chez un sociologue, un ethnologue et caetera et plaqué en histoire, bon ça renvoie un petit peu au même problème. Alors Léo Dumont si je me tourne maintenant vers vous après une parenthèse médiévale, j'espère que qu'il ne vous a pas fait souffrir mais qui vous a intéressé. Si je me tourne vers vous pour évoquer le volume collectif histoire de mots où il y a également un texte de médiéval de Nicolas Perrot, quel était le le l'idée derrière ce volume, comment comment il est né, c'est là aussi une démarche collective, c'est là aussi des des rencontres, des croisements entre différentes méthodologies, en tout cas ce n'est pas ce n'est pas un manifeste d'une façon de faire. Alors non, ce sont en fait les actes d'un colloque qui s'est tenu en deux-mille-dix-neuf, il y a quelques années maintenant, l'objectif de de cette rencontre scientifique, enfin les objectifs, c'était bon d'une part de faire un un état des lieux un petit peu de de la recherche puisque les les précédentes manifestations scientifiques en histoire sur sur cette question étaient un peu un petit peu anciennes. Et puis c'était aussi d'être attentif et attentif à et bien des évolutions dans l'emploi de ces méthodes, ne pas seulement envisager l'analyse des textes à l'aide des méthodes textométriques dans une seule une seule voix. En fait, c'est un aspect dont on peut reparler, mais au-delà de la seule mesure peut-être du vocabulaire, de nombreuses méthodes maintenant informatiques se sont développées, qu'on qualifie parfois plutôt de fouilles de textes, de textes mining depuis depuis une histoire très ancienne aussi, mais qui sont peut-être accélérées depuis une vingtaine d'années disons, avec notamment tout ce qui est l'apprentissage machine et les algorithmes de machine learning, ce ce genre de choses. Et c'était de se demander aussi comment ces méthodes pouvaient être intéressantes et intéresser les historiens et les historiennes. Un autre aspect aussi qui intéressantes et intéresser les historiens et les historiennes. Un autre aspect aussi qui nous intéressait beaucoup, c'était des enjeux qui font écho à la discussion qu'il a eu précédemment, il me semble à propos de la construction d'un corpus en fait, car c'est sans doute un des enjeux forts aussi de l'emploi des texométriques en histoire, c'est la dimension expérimentale en fait qui en découle. Sans doute un des atouts de ces méthodes et ce qu'on avait, ce a essayé de montrer aussi à travers les contributions de cet ouvrage collectif, c'est de devoir bâtir un protocole méthodologique qui vise d'une part à expliciter des critères de composition d'un corpus en vue de de contrôler les observations qu'on va pouvoir réaliser à partir des résultats obtenus. Et ces résultats obtenus conduisent à bâtir des parcours interprétatifs, mais qui sont contrôlés, qui sont contrôlés à la fois par des résultats quantitatifs et par un retour au contexte d'apparition, que ce soit à travers des concordances classiques, c'est-à-dire tout simplement revenir à au contexte gauche et droit autour d'un mot ou bien des méthodes davantage davantage quantitatives comme les concurrences dont on parlait et ce qui ce qui ce qui amène à à dépasser l'opposition dont dont parlait tout à l'heure Nicolas qui est celle de de l'opposition entre qualitatif et et quantitatif dans dans dans le cadre de de l'emploi de la texométrie en histoire, on est vraiment sur une démarche qui est à la fois distante, en cela qu'elle s'appuie sur une lecture outillée, mesurée du vocabulaire d'un d'un ensemble de textes, mais qui en même temps pour pouvoir bâtir une interprétation implique de revenir à une lecture cursive traditionnelle. Et c'est cet aller-retour constant entre une lecture lointaine, distante, le distant reading de Franco Moretti là auquel je pense pour reprendre cette notion-là et une approche plus close reading, plus classique traditionnelle qui va permettre derrière la la mise en mots d'un récit d'interprétation là, historique, transclassique. Donc ça, c'est ce type de questions qu'on a essayé d'aborder à travers les les études de cas qui sont réunies dans dans l'ouvrage. Oui, alors avec une dimension, vous y avez fait allusion, mais peut-être qu'on peut le le creuser un petit peu qui est cette importance de la constitution de corpus cohérent puisque ça n'aurait pas beaucoup de sens d'interroger la présence d'un mot dans mettons la presse départementale de la Nièvre, plus les proclamations à l'assemblée constituante un siècle plus tôt plus les petites annonces dans le chasseur français vingtième siècle. Donc enfin peut-être que ça en aurait un, mais en tout cas il faudrait que faudrait établir des hypothèses quand même assez assez solides assez armées alors que si on délimite des corpus cohérent comme le fait par exemple Anne-Sophie Anglaret, on l'a l'a version à ce micro pour son livre vraiment génial sur la légion des combattants sous Vichy qui analyse la presse combattante entre deux guerres et période vichyste pour montrer des continuités sémantiques et qu'en fait beaucoup de thèmes vichistes étaient déjà présents en filigrane mais explicitement dans la la presse combattant de l'entre-deux-guerres, mais là la cohérence du corpus du coup donne une consistance aux hypothèses de recherche beaucoup plus grande. La question du corpus elle est elle est elle est profondément déterminante sur sur ce qu'on va pouvoir faire avec méthode testométrique parce que alors je vais reprendre le titre d'un article que j'aime bien de de Patrick Charaudeau, dis-moi quel est ton corpus, je dirais quelle est ta problématique. Donc en fait il y a autant évidemment de de corpus qu'il y a qu'il y a de questions de recherche, tout l'enjeu va être de de bâtir un dispositif heuristique pour le coup qui va permettre de construire sous la forme de textes rassemblés selon un certain nombre de critères, à l'image de ce qu'a pu faire Anne-Sophie Anglaret là-dedans dans l'article que que tu évoques, en vue de de de de bâtir un terrain d'observation pour pour tester des hypothèses et et répondre donc on a on a la conscience d'une démarche hypothético-déductive qui va qui là va va se mettre en place. C'est des choses aussi qui ont été bien mises en avant par par Dhamon Mayafre par exemple qui a beaucoup réfléchi à à ces questions. On parlait tout à l'heure dans la dans la des repères chronologiques là dans dans l'histoire de la texométrie, il y a un texte de d'Antoine Praud qui publie en mille-neuf-cent-quatre-vingt-huit, donc ce moment un peu charnière dont on parlait tout à l'heure entre une phase d'abord de de développement et puis peut-être un petit reflux dans les années mille-neuf-cent-quatre-vingt-dix de de l'emploi de ces méthodes chez les historiens et les historiennes. C'est un texte un petit peu bilan d'Antoine Praud qui s'intitule Les mots, qui est publié dans dans un ouvrage collectif dirigé par René Raymond et donc il fait il fait un bilan un petit peu de de l'emploi de de ces méthodes chez les historiens et les historiennes et puis il essaye de mettre en avant des critères qui selon lui permettraient de construire des des corpus pertinents pour les historiens et les historiennes. Donc il y a bien cet enjeu effectivement qui qui est qui est fondamental et qui est traité depuis depuis depuis longtemps. Du point de vue du renouvellement des méthodes, j'étais très intéressé notamment parce que la période veut ça, on enregistre le le quatre juillet trois jours avant le second tour des législatives par l'article de Magali Magali Orezi sur les proclamations électorales de deux-mille-dix-sept pour les législatives donc de deux mandatures précédentes et alors c'est un texte assez fascinant parce qu'il utilise l'apprentissage machine pour apprendre un algorithme, un logiciel à repérer des vocabulaires de gauche, de droite et ce qui est fascinant notamment c'est que parfois la machine non pas se trompe, mais identifie à droite des proclamations de gauche parce qu'en fait il y a des il y a des jeux sur l'énonciation, c'est-à-dire qu'il y a parfois des candidats aux candidates de gauche qui disent beaucoup je et qui ont un discours très volontariste qui en fait la machine avait appris à reconnaître comme étant à droite. Donc ça ça parfois ça dit des choses en fait. L'intérêt de cet exemple à mon sens c'est que ça prouve à quel point il y a des choses invisibles à l'oeil nu, mais que certaines méthodes textométriques vont être capables de déceler et de nous mettre en évidence. Bien sûr ça ça va être un sans doute un des autres intérêts de de l'emploi de texométrie pour l'histoire et l'histoire, c'est qu'une lecture traditionnelle du texte bien est toujours est toujours influencée en quelque sorte par un certain un certain horizon d'attente qu'on qu'on s'est construit à travers ses lectures, sa compréhension de son objet d'étude, de de ce que l'on a envie de de trouver. Alors non pas que la la textométrie permette une approche purement objective, bien sûr ça n'existe pas là, c'est c'est pas du tout ce que je suis en train de dire, mais ça va peut-être permettre de de reculer ce moment effectivement où où la subjectivité du du chercheur, de la chercheuse va va intervenir et éventuellement donner l'occasion de mettre le doigt sur des phénomènes qu'on aurait qu'on n'aurait pas perçu à travers une lecture plus plus classique quoi. En vous écoutant, on voit à quel point ce sont des choses qui mériteraient d'être présentées sous des formats peut-être plus accessibles, plus clairs, il y a un il y a un repère déjà un peu célèbre chez les historiens et les historiens qui est celui de Claire Zac, Claire Lemercier sur le mythe de quantitative en histoire, ce qui ne serait pas temps d'avoir un repère sur la texométrie en histoire, Chiche. Ah oui oui, bon, bon allez alors il y a un projet de manuel chez chez chez certains collègues qui devraient qui devraient voir le jour assez prochainement, Stéphane Lamassé notamment est est en train de terminer normalement un manuscrit sur ce point. Mais oui oui alors ça renvoie en fait à la question ça de d'un d'un repère d'un outil de travail en fait. Et et plus largement du fait que c'est des méthodes qui sont pas si visibles que ça dans les cursus, il y a des gens qui les ont rencontrés ici et là je pense à Paris, à la place Calle Lamop et Paris dans le développement de ces techniques, mais il y a plein plein de gens qui nous écoutent, qui font des études d'histoire, qui ne l'ont pas forcément rencontré. Non non effectivement le le le problème c'est c'est généralement associé et dont au sein du système académique c'est plutôt péjoratif à l'ingénierie. Et ça c'est un gros frein, c'est c'est un vrai réel problème parce que les étudiants veulent se former, ils n'ont pas de lieu où peu évidemment il y a il y a le Pirée à Paris un ou il y a les cursus de l'école des Chartes, mais ça reste limité et comme c'est considéré comme une technique, mais une technique au sens péjoratif, c'est souvent en dehors des corpus de formation historien. On va considérer qu'il existe des techniques positives, c'est des techniques érudite, si vous faites de l'héraldique, de la numismatique ou de la prototographie, c'est de la technique, mais c'est de la technique bien vue d'un point de vue académique, c'est une technique en dehors du social dirait Bourdieu. Donc ça amène un gros capital. Par contre toutes ces méthodes qui sont liées directement à la société, on a parlé des smartphones tout à l'heure, bien elles sont vues comme quelque chose qui relève d'une certaine façon du secrétariat ou de l'informatique. Or il faut précisément dire non, ce qui compte c'est de non seulement appliquer ces méthodes, mais ensuite savoir comment les interpréter et ça c'est un geste purement historien, il faut apprendre aux historiens à le faire et il faut des des formations et des cursus développés, il faut à mon sens intégrer dans les formations d'historien dès la L un du numérique et des méthodes. Si je me retrouve par Marie Le Joux qui si j'ai bien compris comme moi au départ était loin de ça et puis s'il est progressivement intéressé, est-ce qu'il n'y a pas quand on est en dehors un coût d'entrée en tout cas ou l'impression d'avoir un coût d'entrée encore élevé pour se familiariser avec des choses qui sont parfois très complexes quand on regarde les livres, il y a des tableaux sont d'une très grande complexité et avant de de parvenir à les déchiffrer, il faut vraiment passer un petit peu de temps, comment on peut comment on pourrait faire pour voilà abaisser ce coup d'entrée ou en tout cas faire en sorte que ça se diffuse peut-être plus largement C'est évident qu'il y a quand même un coup d'entrée comme n'importe méthode auquel il convient de de se former. Ensuite le, tu as cité tout à l'heure le le ZALQ Lemercier, qui est aussi justement un plaidoyer pour la possibilité d'utiliser des techniques peut être moins élaborées, moins complexes pour pouvoir entrer dedans. Donc en fait je pense qu'on on a aussi le droit de continuer à bricoler et puis on a aussi le droit de demander à des collègues qui maîtrisent les ces techniques-là de comme on l'a fait dans d'entrer dans le programme et de nous montrer un petit peu ce que ce que ce que ça peut donner. Oui, je pense qu'on collaborative est incontournable. Exactement, on ne peut pas être de toute façon, on ne pourra pas faire des historiens qui qui sont formés surtout parce que toutes les disciplines dont parlait Nicolas, elles prennent elles prennent du temps. Par contre ce qui est évident c'est que notre monde désormais est numérique et informatique et que la survie de nos disciplines elle n'est pas dans le le le repli vers le passé, elle est nécessairement dans l'utilisation de ces de ces méthodes, de ces outils, donc il y en a aussi un un enjeu qui est, quand on parle d'humanité numérique, c'est la survie de des humanités passe par le numérique, mais un numérique qui est bien compris, bien utilisé et puis si on ne sait pas faire, moi je n'ai aucun problème, je ne suis pas lexicomètre, je ne suis pas lexicographe, je ne vais pas commencer à prétendre que je sais l'hématite un texte, je ne sais pas le faire. Bien je demande de l'aide aux aux collègues et on le fait collectivement, c'est ça qui est formidable et puis les collègues qui ont besoin que je les aide sur du latin, et bien les aide sur du latin, c'est ça qui est qui est génial. Mais mais le problème de toute façon il n'est pas fondamentalement technique même s'il faut introduire ça dans les cursus parce que apprendre à programmer en python aujourd'hui, apprendre à l'hématisé un texte, c'est quelques semaines. Apprendre la paléographie, apprendre le latin médiéval, ça c'est une affaire d'année. Donc en définitive, il n'y a pas véritablement une question technique centrale bien que de fait il faut le faire. Souvent on parle de la difficulté technique pour ne pas le faire, mais c'est assez facilement dépassable, non je pour moi le vrai problème c'est qu'une fois qu'on a ces tableaux, une fois qu'on a ces graphiques, une fois qu'on a ces listes, comment on fait de l'histoire avec Et donc le problème encore une fois il est heuristique, dans un tas de programmes dans lesquels j'ai j'ai eu la chance de de d'être, il n'y avait pas de problème finalement technique, on obtenait très vite des listes de mots et ou des graphiques et la question c'est que les collègues ensuite ils disent, mais qu'est-ce que je peux faire de ça J'ai un tas de graphiques sémantique, j'ai un tas de trucs, je ne comprends rien du tout, ça correspond pas à l'historiographie typiquement et il n'y a pas de réforme, qu'est-ce que je fais avec ça Et donc l'enjeu il est véritablement historien, c'est pour ça que ces méthodes finalement c'est pas de la technique, c'est pas du tout de l'informatique, c'est de l'histoire et la question c'est comment on fait de l'histoire avec ces nouvelles modélisations, ces nouvelles méthodes. Oui, alors ce qu'il faut peut-être souligner aussi, c'est que le coût d'entrée Nicolas l'a souligné, alors tu parlais de de l'apprentissage d'un langage de programmation, oui bien sûr, pourquoi pas, mais sans même s'investir forcément dans cet apprentissage cet apprentissage-là, il n'est aujourd'hui pas si difficile en fait de mener quelques expériences de type textométrique sur un un ensemble de textes, un certain nombre de logiciels peuvent s'installer sans sans grande difficulté sur un sur un ordinateur personnel assez lambda et puis de plus en plus des solutions sont disponibles en ligne à travers un navigateur web par exemple Hyperbas qui est un des logiciels historiques de de de lexicométrie est maintenant accessible en ligne, tout ce qu'il faut c'est une connexion internet par exemple. Oui et moi je soulignerais le l'importance pour les contemporains de Gallica Graham. Gallica Graham fait par Benoît de Courson, Benjamin Azoulay, moi je m'en sers très régulièrement pour chercher des mots, chercher des concurrents, chercher des évolutions de mots. Là, on a un programme sur étrangers, réfugiés, exilés. Bon, voilà, on peut très facilement taper trois mots, voir les courbes dans les corpus de presse et voir à quel moment ça apparaît réfugié après les guerres, bon c'est c'est des choses souvent ça confirme des choses qu'on sait, mais c'est très très intéressant de pouvoir faire même des petits bricolages expérimentaux comme ça sans sans prétention, mais de savoir que c'est un outil parmi d'autres qui peut rentrer même par la bande dans l'instrumentarium conceptuel et mythologique des historiens. Oui tout à fait. Alors après peut-être qu'il faut souligner simplement quelque chose à propos de Gallica Graham par exemple, c'est que si on, pour bien le comprendre, ça va être différent par exemple de ce que va permettre un logiciel comme Hyper base en ligne dans le sens où Gallica gramme va permettre de travailler sur un corpus, alors un un max, ce n'est pas un corpus en fait, c'est un ensemble de texte qui est celui de des volumes numérisés par par Gallica. Donc on a, on peut bien sûr réduire chronologiquement ou à travers ce nombre de critères, mais Oui, on peut interroger un journal spécifique. Voilà, oui tout à fait, mais on va être sur uniquement ce qui est disponible à travers les les les les données mises en ligne sur sur Gallica. D'autres logiciels vont permettre de créer là complètement n'importe quel corpus en fait en en envoyant des textes là qui auraient été récupérés au monde de différentes manières, soit à travers une retranscription manuelle, soit à travers d'autres bases d'autres bases bibliothèques virtuelles et et caetera. Une question peut-être plus générale, ces textes sont écrits par des gens qui savaient écrire et donc est-ce que c'est encore de l'histoire sociale si on s'intéresse à des textes produits pour les époques anciennes par des dominants et même jusqu'à des époques relativement récentes par des dominants donc est-ce qu'on fait de l'histoire sociale ou est-ce qu'on peut faire l'histoire sociale à partir de ces corpus Je veux bien essayer de de de de lancer la des pistes de réponse parce qu'on ne peut pas être tout seul à répondre à une question comme ça. Alors évidemment ça c'est un problème, c'est en fait souvent, enfin je crois que quand on on évoque la textométrie, on a parfois une crainte ou en tout cas ça fait partie des choses qu'on qu'on qu'on entend, c'est qu'on va être enfermé dans une analyse du discours en fait, dans une histoire uniquement du vocabulaire. Or, d'une part rien n'empêche de croiser ça avec d'autres méthodes plus classiques, d'autres corpus de sources plus plus traditionnelles en histoire, voilà, pour pour pour croiser les résultats d'une texométrie avec tout à fait d'autres choses. C'est par exemple le, il me semble que le le le le la contribution de Margaux Ferrand dans dans l'ouvrage qu'on qu'on a publié, l'illustre bien, elle travaille sur l'histoire de la ville d'Avignon au bas moyen-âge et elle travaille à partir de sources fiscales en fait, donc une source qui a priori se prêterait davantage à un traitement céréales plus plus traditionnel et elle va détecter en fait automatiquement à l'aide logiciel qu'elle a développé en en collaboration avec d'autres chercheurs, ce qu'on appelle des entités nommés, c'est-à-dire des noms de personnes, des noms de lieux, des titres éventuellement et analyser la manière dont du vocabulaire va être employé à proximité de ces entités nommées pour comprendre la façon dont ils sont qualifiés dans sa documentation. Donc c'est un exemple qui illustre je pense la manière dont on peut combiner justement une une approche du lexique à travers la texométrie et des questions davantage peut-être d'histoire sociale comme on les évoquait. Si je prends moi par exemple ce ce champ lexical de la la réforme, réforme arrêt reformatio, c'est clair que c'est un vocabulaire qui naît dans la sphère ecclésiale, qui bientôt est reprise par les pouvoirs laïques parce qu'ils n'entendent pas laisser le privilège à la théocratie pontificale de pouvoir reformer le monde avant la chute. C'est un lexique qui a beaucoup plus de mal par contre et c'est ce que montre Gaëtan Bono quand il regarde les les, il fait une superbe étude des des États généraux, ça a beaucoup plus de mal à infuser vers des catégories plus basses de la la société parce que les les gens de l'époque c'est quoi, enfin ils ne connaissent pas ce ce terme-là et j'aurais presque envie de dire, mais alors là c'est au doigt mouillé parce qu'il faudrait mettre, il faudrait faire l'analyse, je n'ai pas l'impression que les mieux sociaux les plus populaires à à l'heure actuelle demandent la réforme et souhaitent la réforme. Ils veulent du changement éventuellement, ils veulent une amélioration de leur vie, mais la réforme ça reste quand même un terme qui est bon là encore c'est du doigt mouillé, mais qui reste un terme qui est très surplombant et qui est entre les mains de ceux qui, de cette toute petite minorité de la population en en, qui est en en position de domination sociale et qui dit aux autres, oui il va falloir accepter que l'hôpital, vous ne m'y pensez qu'il faut le réformer, il faut réformer le collège et on a bien compris que la réforme souvent c'était coupée des fonds pour ceux qui en auraient véritablement besoin. Donc je pense qu'il y a quand même, c'est c'est quand même intéressant cette cette question de, c'est aussi la la question de la réception des termes, du réemploi des termes par d'autres catégories de la société. On ne peut pas le faire pour l'époque médiévale malheureusement, je, Gaëtan Bono peut vous dire, vous voyez ce ce terme-là, je ne l'ai pas. Voilà, il peut faire, il peut dire ça, il peut chercher les autres, mais il il il il c'est ça ça qui serait extrêmement intéressant à faire par exemple aujourd'hui, c'est voir là ça serait, ça c'est une vraie étude de de de de de la géométrie et de la psychographie qui serait faisable dans les les discours des catégories sociales les plus défavorisées, est-ce qu'on parle de réforme, comment est-ce qu'on en parle, est-ce qu'on demande la réforme, moi je n'ai pas l'impression. Moi je dirais qu'en fait c'est c'est c'est un malentendu parce qu'on confond discours et représentation. Fondamentalement, je ne crois pas qu'il y a des différences centrales de représentation entre les couches dominantes et les couches dominées dans une société. Simplement il y a différentes manières d'exprimer et un champ de tension entre les groupes sociaux. Si je je prends un exemple, c'est la question des échelles en sémantique qui a été évoquée tout à l'heure. Si vous prenez un corpus le Figaro, puis le monde, puis le canard enchaîné, puis un autre corpus tout à fait différent. Ils vont tous exprimer dans leurs concurrents, par exemple si on prend le terme liberté, on va avoir des concurrents totalement différents. Est-ce que c'est les les rédacteurs de ces journaux partagent des systèmes de représentation fondamentalement différents, non parce qu'ils sont tous dans le capitalisme, évidemment ils ont des points de vue différents, mais ils ont une même structure de représentation. C'est que le texte exprime quelque chose, mais qui n'est pas le système de représentation, il y a toujours un décalage, c'est ce qu'avait montré Altusser à partir du contrat social. Ce décalage, bien c'est à l'historien précisément de le reconstituer à partir de différents corpus. Donc on n'a pas on n'a pas une unité en fait et donc il faut prendre tous ces éléments et tenter de reconstituer d'aller voir derrière ce qui se situe dans les représentations. Et c'est là qu'on qu'on fait de l'histoire sociale pour répondre à ta question. C'est-à-dire que si on en on se maintient à dire bon là on a un mot qui évolue et puis les concurrences c'est ça. Si on s'en tient là, on fait une sorte d'histoire culturelle, une histoire des discours. Par contre si on essaye de comprendre comment ça fonctionnait au niveau social en remportant au système de représentation globale, là on en vient à faire l'histoire sociale, pourquoi dans un moment donné, dans un champ donné, un acteur s'exprime de cette manière. Qu'est-ce que lui veut faire et qu'est-ce qu'il y a à l'arrière-plan que lui-même ne comprend pas, c'est-à-dire que évidemment personne n'a conscient de son système de représentation comme pour paraphraser Marx, si les discours sur les choses se confondaient avec les choses elles-mêmes, il n'y aurait pas besoin de sciences sociales, c'est parce qu'il y a un décalage entre les choses et comment on les exprime et comment on les perçoit qu'il y a besoin des sciences sociales. Et donc c'est ce décalage qu'il faut essayer de travailler en composant les corpus qui vont amener différentes visions sur les discours et les représentations se situent quelque part au mieux. Tout ça finalement c'est du structuralisme, c'est la méthode de Lévi-Strauss dans les mythologies, c'est-à-dire prendre un tas de mythologies différentes pour voir les décalages et c'est dans les décalages qu'on trouve la structure. Merci beaucoup à tous les trois, est-ce que si on devait conseiller un texte, par exemple un article relativement accessible sur ces enjeux pour prolonger la discussion, est-ce qu'il y a quelque chose qui vous qui vous vient à l'esprit Souvent l'expérience pédagogique puisque j'enseigne quand même pas mal ces questions-là, ça va me faire répondre les choses suivantes, c'est que alors on propose souvent aux étudiants qui sont désireux de de d'approfondir un petit peu ce qu'on leur présente, le texte d'Antoine Praud que j'évoquais tout à l'heure, mais il a une difficulté, c'est qu'il a une quarantaine d'années maintenant. Donc évidemment depuis quarante ans, les les choses ont bougé, ça rejoint la question de tout à l'heure de celle d'une synthèse en fait, c'est-à-dire qu'il manque peut-être, c'est vrai, mais ça ne, ça ne va sans doute être comblé dans les années à venir, un un texte qui soit un petit peu accessible et qui permet de de s'initier à cela de de de façon de façon efficace. Je citerai des revues en fait peut-être plutôt. Allez voir par exemple Histoire et mesure qui publie régulièrement de de la textométrie menée par des historiens et des historiennes. Donc c'est une façon de d'avoir des exemples concrets. Il n'y a pas longtemps, il y a eu un numéro thématique consacré à à la temporalité en en textométrie par exemple qui qui intéresse au au premier plan les historiens. Donc d'une certaine manière en fait il faut il faut se former en mettant les mains en mettant les mains dedans, ce qui souvent l'histoire la meilleure manière de se de se former, ce n'est pas de lire des des manifestes hébraïques, mais d'aller voir comment ça fonctionne, de décortiquer des choses et puis de de voir ce qu'on peut en faire. Oui, après il y a quand même pas mal d'aussi, alors ce ce que j'allais dire dans un second temps, on on on peut-être pour pour compléter, c'est c'est qu'il y a aussi des manuels qui existent, mais qui ne sont pas destinés directement à des historiens. Du côté de des collègues en linguistique par exemple, les spécialistes des analyses de corpus, et caetera, il y a des choses qui existent aussi, qui sont plutôt destinés à des étudiants de master du premier cycle, et caetera qui peuvent tout à fait aussi constituer des des introductions. Moi je je pourrais un article je dirais alors c'est aussi un article ancien puisqu'il date de la fin des années quatre-vingt-dix et les comptages sont manuels, mais il n'empêche qu'à mon sens c'est un article excellent en matière de de passage entre le texte et les structures sociales, c'est l'article d'Alain Guéraud, le champ sémantique de l'espace dans la vita de Saint-Mayol de Cluny paru dans le journal des savants qui est un exemple vraiment éblouissant d'analyse des représentations médiévales. Et puis le l'ouvrage de d'Alain Guéraud encore lui qu'on qu'on suggérait tout à l'heure avec le fameux ceci n'est pas une vigne parce que ça marche toujours avec les étudiants, c'est vrai, c'est c'est la première porte d'entrée, c'est la curiosité, c'est dire ah tiens mais alors si ça n'est pas une mine qu'est-ce que c'est Bon peut-être celui-ci aussi. Merci beaucoup. Merci. Merci d'avoir écouté l'émission, rendez-vous sur le site parole histoire point f r pour retrouver l'intégralité des épisodes et des séries thématiques. Rendez-vous également une semaine sur deux le vendredi avec Alexandre Jublin sur le fil du collimateur pour le podcast l'histoire de la guerre des conflits armés, le fil de l'épée. N'hésitez pas à laisser une note ou un commentaire sur le podcast notamment sur iTunes ou Spotify et à bientôt pour un nouvel épisode.