The Values of French

The Values of French Language and Literature in the European Middle Ages. ERC Advanced Grant (no. 670726) at King's College London

Perspectives philologiques communes et divergences numériques au sein de l’édition numérique

Marta Materni est historienne médiéviste et philologue romane. Actuellement elle vient de terminer un projet d'édition numérique du Roman de Florimont, financé par une IF Marie Curie. Ses recherches, aussi bien au niveau strictement historique que littéraire, s'articulent autour de quatre thématiques : la transmission des savoirs scolastiques et la figure du « savant » ; la production textuelle liée à la figure d'Alexandre le Grand ; la production littéraire en franco-italien ; et enfin, l'application des outils numériques à la recherche philologique et historique.

Le 13-14 décembre 2018, a eu lieu à Grenoble un colloque, Autour de Florimont. Textualité médiévale et textualité numérique, se proposant de créer un moment de réflexion pluridisciplinaire « autour » de cet objet complexe et pluriel qu’est le texte médiéval, à partir d’une conversation à plusieurs voix « autour » d’une œuvre spécifique qui nous a servi de tremplin : le Roman de Florimont d’Aymon de Varennes (1188).

Ce texte a été au centre d’un projet d’édition numérique financé par une Marie Curie IF (2017-2019) et il a aussi représenté l’occasion d’entamer une réflexion critique « autour » des méthodologies et des outils philo-numériques les plus répandus, afin de dresser un état de l’art par rapport à leur efficacité. Après au moins un quart de siècle d’activité intense, ce qui frappe est en effet la grande faiblesse de la production numérique d’éditions savantes (digital scholarly editions) comparée à celle imprimée. Récemment, une initiative de catalogage menée par Greta Franzini nous a révélé un panorama qui n’est pas très exaltant : on a identifié à peu près 300 objets numériques (couvrant tous les domaines chronologiques et linguistiques), dont 244 scholarly editions, sur lesquelles seulement 152 scholarly editions étaient encodées en TEI. Ces chiffres sont malheureusement très éloquents et nous obligent à une réflexion.

Marta colloque photo.jpg

Colloque, « Autour de Florimont. Textualité médiévale et textualité numérique », a eu lieu à Grenoble le 13-14 décembre 2018.

Un des enjeux de ce colloque a donc été de mettre l’un en face de l’autre plusieurs projets d’application du numérique aux textes du Moyen Âge afin de découvrir notre terrain commun théorique mais aussi nos divergences pratiques (il ne s’agissait pas seulement d’éditions mais aussi de corpora – le RIALFrI (Francesca Gambino) et le Laboratorio della Lirica Romanza (Paolo Canettieri); d’environnements de travail – celui conçu pour l’édition de la Chanson d’Aspremont (Anna Constantinidis); et de projets lexicométriques – l’outil PALM (Aude Mairey) et le Laboratoire de l’Ancien Français (Pierre Kunstmann). Et tout cela dans un contexte homogène aussi bien pour la langue que pour l’époque : le français du XIIe-XIIIe s. avec un focus ultérieur sur les très complexes traditions manuscrites franco-italiennes.

Autour de florimont poster.png

Affiche du colloque

Mais l’objectif du colloque était aussi de plonger le discours « autour » du numérique dans un contexte plus ample de discours « autour » du texte, afin de montrer que le numérique ne doit pas représenter un élément perturbateur au sein de la communauté philologique, créant une sorte de barrière générationnelle du haut de laquelle on voit se confronter l’enthousiasme d’un côté et la méfiance de l’autre, mais il doit plutôt être conçu, accepté et exploité comme une méthodologie de plus au service de l’interprétation du texte. C’est pour cette raison que le colloque s’est ouvert avec un panorama d’interventions qui faisaient appel aux perspectives les plus classiques : l’analyse codicologique (Keith Busby), la contextualisation historique-culturelle (Martin Aurell), l’analyse narratologique (Nathalie Leclercq), l’analyse strictement philologique (Chiara Concina), la perspective alternative de l’histoire de l’art (Francesca Fabbri). Et c’est pour cela qu’avant d’aborder (le lendemain !) le volet numérique de leurs projets, les intervenants ont été invités d’abord à décrire les traditions manuscrites avec les schémas et le vocabulaire de la philologie.

Pour ce qui en est de l’édition d’un texte, nous avons exploré en particulier quatre projets : Huon d'Auvergne (Leslie Zarker Morgan et Stephan McCormick), la Chanson d’Aspremont (Anna Constantinidis), l’Histoire ancienne (Henry Ravenhall), et enfin mon édition du Roman de Florimont.

Du point de vue philologique, il est évident qu’une idée commune traverse la communauté des médiévistes : l’idée qu’il n’y aurait pas de manuscrits sans le texte mais aussi qu’il n’y a pas de texte sans les manuscrits. La pratique de l’édition numérique fait ressortir clairement cette tendance. Nous disposons de beaucoup d’éditions critiques, quel que soit leur cadre théorique ; ce qui semble nous intéresser est alors d’interroger de façon plus pointue les manuscrits. Sur le plan pratique cela signifie laisser libre cours à la production d’éditions diplomatiques. La « diplomatique » ne tue pas la « critique » : il ne s’agit pas de renoncer à la noblesse de l’art ecdotique mais plutôt d’accroître notre patrimoine philologique, rendant public et transparent le travail privé qui mène à l’établissement de l’édition critique, révisant les données acquises, regardant les textes d’un autre point de vue, en nous concentrant aussi sur le processus (la tradition) au-delà des épiphénomènes (les manuscrits). En conclusion, ce que nous essayons de faire est d’interroger l’individualité historique des textes manuscrits.

Ce n’est pas donc par hasard que, du point de vue de la philologie, « éditions diplomatiques », « études codicologiques », « comparaison entre les textes », « intérêt pour la tradition », se sont révélés les mots-d’ordre et les traits communs de nos travaux respectifs. Le numérique, qui signifie « dépassement des limites du format page », « affichage multiple du texte », « hypertextualité », « analyses quantitatives », « représentations graphiques », est le deuxième fil rouge qui nous relie l’un à l’autre et qui nous permet concrètement de faire ce que nous voulons faire en tant que philologues.

Banner for Digiflorimont

Page d'accueil du site DigiFlorimont (digiflorimont.huma-num.fr)

Pour ce qui concerne mon projet DigiFlorimont, l’objectif a été de produire, pour chaque manuscrit, une édition à afficher en modalité diplomatique et en modalité interprétative. L’édition diplomatique essaie de respecter fidèlement la scriptio du manuscrit : graphies, ponctuation, segmentation de l’écriture, corrections, abréviations etc. L’édition interprétative, naturellement, superpose à cette transcription une couche orthographique modernisante (ponctuation, majuscules, séparation des mots etc.). Mais, de plus, j’ai essayé de créer un modèle d’encodage qui permettait ensuite d’appliquer un étiquetage morphosyntaxique, de lemmatiser, d’utiliser un texte comme base d’une édition critique et d’appliquer aisément un stand-off markup sans rien modifier au niveau du code XML.

Visualisation synoptique: édition vs. facsimile

Visualisation synoptique : édition vs. facsimile

Du point de vue théorique, mon approche de la question « modélisation de l’encodage » a été de formaliser au maximum le texte en le concevant comme une base de données d’éléments minimaux, les mots, chacun identifié de façon univoque et donc manipulable. En termes XML-TEI, ce modèle théorique a donné lieu à un encodage fondé sur la balise <w> accompagnée par un @xml:id, deux éléments qui permettront de réaliser aisément toutes les opérations dont on a parlé. L’emploi de cette balise m’a permis de résoudre la question de la segmentation irrégulière de l’écriture manuscrite, avec ses agglutinations, déglutinations etc., gérant les espaces blancs de façon automatique à travers une série d’attributs associés à la balise <w> et manipulés par le CSS. L’autre principe-guide numérique a été en fait celui de créer un seul fichier encodé, correspondant à l’édition diplomatique, qui est transformé automatiquement en version interprétative en s’appuyant sur la sémantique des balises et des attributs.

Voilà un aperçu de mon code :

<l n="ms1">
<w xml:id="msl1w1">Cil</w>
<w xml:id="msl1w2" ana="#aggl">qui</w>
<w xml:id="msl1w3">a</w>
<w xml:id="msl1w4" ana="#degl">cu<space type="#degl">er</w>
<w xml:id="msl1w5">de</w>
<w xml:id="msl1w6"><c ana="lram-c">u</c>aselage</w>
</l>

Dipl. : Cil quia cu er de uaselage – Int. : Cil qui a cuer de vaselage

Visualisation synoptique: édition diplomatique vs. édition interpretative

Visualisation synoptique : édition diplomatique vs. édition interpretative

Mais citer le code signifie citer l’élément de criticité potentielle dans notre discours. L’édition numérique se fonde en effet sur une « distance » à laquelle nous ne sommes pas habitués, et que l’utilisation des éditeurs textuels WYSIWYG a complètement effacée de notre perspective mentale : la distance entre la donnée telle qu’elle est visualisée et la donnée telle qu’elle est structurée au niveau de code informatique. Nous voyons sur l’écran un mot en cursif, mais ce cursif peut être généré par une multiplicité de codes sous-jacents. C’est exactement ce que nous avons pu constater en comparant les codes XML-TEI de nos projets, très éloignés l’un de l’autre, bien que les résultats graphiques soient assez semblables et, surtout, bien que nos intentions soient exactement les mêmes. Se confronter en matière d’édition numérique signifie alors, surtout, accepter de se confronter sur le plan du modèle d’encodage parce que, à défaut d’un « standard très standardisé » (comme par ex. celui épigraphique proposé par la communauté EpiDoc) et au-delà des similitudes graphiques, nous risquons d’isoler numériquement nos textes-fichiers et de faillir donc par rapport au principe de l’interchangeabilité des données.

Heureusement, l'esprit de l'Open Access semble désormais influencer tous les aspects des projets, et par conséquence l'attitude face à la documentation liée aux projets : le résultat graphique représente seulement la manifestation visuelle d'une édition numérique, mais la sémantique profonde de cette manifestation est enracinée dans le code-source et dans son architecture. La décision, très récente, de mettre à disposition les fichiers XML d'un projet qui est considéré un modèle sous le point de vue de l'architecture d'une édition numérique, Vincent van Gogh. The Letters, est significative et encourageante. Je dirais que la plupart du travail est déjà fait : on a un standard et une méthode d'approche au problème, la TEI ; on a des exemples concrets, aussi très complexes, qui nous permettent de discuter et d'analyser les faiblesses mais aussi les points de force de ce qui a été déjà produit et qui a subi l'épreuve du temps ; on a beaucoup d'outils à disposition, on a beaucoup d'outils « utiles » qui sont restés cachés dans les couloirs des projets abandonnés ou interrompus. Je crois que ce qui nous reste à faire est seulement une opération concertée de mise en partage des expériences afin de passer définitivement de la phase d’expérimentation à la phase de « production industrielle », et faire de l'édition numérique une pratique courante de l'activité académique au même titre que l'édition papier.


Marta Materni
(LUHCIE – Université Grenoble Alpes)