Chambly : l’intelligence artificielle au service de la généalogie
Un mouvement citoyen participe à une étude universitaire visant à transcrire plus de dix millions de documents de la Nouvelle-France grâce à l’intelligence artificielle. Le but est de diffuser les données au grand public pour retracer l’histoire de chaque famille québécoise.
À Chambly, l’histoire de la Nouvelle-France est un thème régulièrement abordé par la Société d’histoire de la seigneurie de Chambly. « Les premiers documents datent de Jacques de Chambly, rappelle Raymond Ostiguy, chercheur à l’association. L’intelligence artificielle pourrait accélérer la lecture de documents anciens. Certains écrits anciens n’ont pas encore été étudiés, car personne n’a eu d’intérêt à se pencher dessus. Cela peut être des dons de terrains. »
« Grâce à tout ce travail, le grand public pourra retrouver des traces de ses ancêtres. » – Pierre Dubois
De son coin de Montérégie, Pierre Dubois, bénévole à la retraite, participe à une démarche de grande ampleur concernant l’histoire du Québec. « Je participe à un projet de transcription de documents officiels de la Nouvelle-France initié par l’Université du Québec à Rimouski. L’objectif est de transcrire plus de 10 millions de documents afin de raconter l’Histoire. Pas celle des grands noms, mais celle du peuple. »
Dans ce périple, Pierre Dubois n’est pas seul. Une quarantaine d’autres bénévoles ont rejoint la mission.
« Ce projet, baptisé » Nouvelle-France numérique « , est financé par le Conseil de recherche des sciences humaines en partenariat avec Bibliothèque et Archives nationales du Québec (BAnQ). L’Université du Québec à Rimouski gère le projet mais ne connaît pas de spécialistes en langues anciennes, soit des paléographes. Nous avons donc rejoint le projet bénévolement, à la condition que les recherches soient partagées avec le grand public et non limitées aux chercheurs. Les bénévoles viennent de partout au Québec, même d’Ontario! On est devenus la branche citoyenne du projet un peu par la force des choses. »
Des anecdotes
Le travail de ces bénévoles est de transcrire des documents vieux de plusieurs années. Pour cela, ils ont recours à l’intelligence artificielle. « Nous avons été formés au logiciel Transkribus dans le cadre de nos échanges avec l’université, poursuit Pierre Dubois. On se regroupe sur Internet pour partager entre nous les documents notariés. On balise des noms de personnes, de lieux ou tout autre renseignement et l’intelligence artificielle permet d’identifier le même nom tout au long du texte, qui peut compter des dizaines de pages. Avec un taux d’erreur situé entre 5 et 7 %, n’importe qui pourrait comprendre un document. L’intérêt est énorme et nos recherches, grandement facilitées! Grâce à tout ce travail, le grand public pourra retrouver des traces de ses ancêtres. » D’ailleurs, le paléographe a récemment trouvé un fait intéressant concernant sa famille. « Un de mes ancêtres a fait fortune aux États-Unis. Au point qu’un comté dans l’Indiana porte son nom! Il s’agit de Dubois County. » André Morel, aussi de la Montérégie, participe au projet tout comme Pierre Dubois. Lui aussi a découvert un fait le concernant. « Cinq générations avant la mienne, un de mes ancêtres a refusé à plusieurs reprises la terre léguée par son père. Peut-être est-ce dû à des conditions d’engagement trop difficiles? Nous n’avons pas encore le fin mot de l’histoire, mais j’ai encore des cousins qui vivent là. La famille a donc conservé le terrain. »
Pierre Dubois insiste sur sa principale motivation, qui est l’intérêt public. « La généalogie fait partie des recherches ayant le plus de succès sur Internet. Lorsqu’on fait notre propre généalogie, on peut déterminer sa condition sociale et refaire sa petite histoire. On parle davantage du peuple et lorsque tout se regroupe, cela devient intéressant. »
Hors du Québec
Cette histoire, d’ailleurs, ne se limite pas au Québec. « Nos sources principales sont la BAnQ et le site familysearch, élaboré par les mormons aux États-Unis, assure Pierre Dubois. Tout est numérisé, mais cela ne résout pas les problèmes de compréhension. On retrouve des documents de la Nouvelle-France lorsqu’elle est devenue anglaise, de la Louisiane ou encore d’outre-mer! »
Selon André Morel, le travail régulier des bénévoles permettra, dans quelques mois, de proposer des données à la population.
« Si l’on continue sur notre rythme, un site bêta sera présenté cet automne et une version en ligne sera offerte pour l’année 2026. Tout n’est pas encore numérisé et le rayon d’action est énorme! Nous avons aussi une section autochtone qui, même si ce n’est pas le même langage, permet de comprendre des échanges entre les communautés. On est en train de développer des outils de travail que nous ne connaissions pas. »