Avis de Soutenance
Monsieur John Benson LOUIS
Spécialité : Informatique et Applications
Soutiendra publiquement ses travaux de thèse intitulés
« Extraction d’éléments textuels complexes, Application à la détection et à la reconnaissance des onomatopées dans les bandes dessinées. »
dirigés par Monsieur Jean-Christophe BURIE
Soutenance prévue le mercredi 09 avril 2025 à 09h00
Lieu : La Rochelle Université
MSI - Amphithéâtre 100
Avenue Henri Becquerel
17000 LA ROCHELLE
Composition du jury :
M. Jean Christophe BURIE , Université de La Rochelle, Directeur de thèse
M. Arnaud REVEL, SERLI , Examinateur
Mme Karell BERTET, La Rochelle Université , Examinatrice
M. Olivier AUGEREAU, ENIB, Examinateur
Mme Sylvie TREUILLET, Université d'Orléans, Rapporteure
Mme Véronique EGLIN, Université de Lyon, Rapporteure
M. Samuel PETIT, Directeur COMIX AI, Invité
Résumé :
Dans le domaine en constante évolution de la vision par ordinateur, la détection de texte de scène est devenue un domaine de recherche essentiel, en raison de ses applications étendues dans un large éventail de domaines. De la traduction instantanée à la récupération d'images, en passant par l'analyse de scènes et l'analyse complète de divers documents tels que des journaux, des textes historiques et notamment des bandes dessinées, la portée de la détection et de la reconnaissance de texte s'est considérablement élargie. Les bandes dessinées, un mélange unique d'art et de littérature, présentent une riche tapisserie de styles de texte entrecoupés d'images vibrantes et de bulles dynamiques. Si les dialogues enfermés dans ces ballons sont relativement simples à détecter et à extraire en raison de leur uniformité, les onomatopées contrastent fortement. Ces interprétations artistiques du son, avec leurs formes, orientations et conceptions complexes variées, se fondent dans les éléments graphiques des panneaux, remettant en question les méthodes de détection traditionnelles. Leurs représentations variées soulignent encore la complexité de la conception de techniques de détection efficaces. Avec une inclination académique croissante pour l'analyse des bandes dessinées, en particulier des genres comme la bande dessinée franco-belge, les mangas ou les bandes dessinées américaines, il existe un besoin accru d'algorithmes robustes. Ces algorithmes doivent répondre efficacement aux complexités naturels de ces documents. Cette thèse approfondit le monde de la détection de texte, en tirant parti de la puissance de l'intelligence artificielle, avec un accent particulier sur la detection et la reconnaissance de textes complexes, tels que les onomatopées, dans les bandes dessinées. Dans le cadre de cette étude, une analyse exhaustive de la littérature a été effectuée concernant les techniques actuelles de détection et de reconnaissance du texte. Cette revue avait pour objectif d'identifier les défis majeurs rencontrés par les chercheurs. Parmi ces défis figurent les variations textuelles dues aux différences d'alignement, de style, de taille, et d'orientation. Ces variations, couplées à un faible contraste d'image et un arrière-plan alambiqué, rendent l'extraction automatique de texte particulièrement ardue. Les méthodes actuelles présentent, de ce fait, des taux de détection et de reconnaissance relativement faibles, souvent en dessous de 80% et 60% respectivement. Un nouvel ensemble de données a été proposé afin de pallier les lacunes en matière d'annotation de caractères et la présence de textes complexes avec des proportions variés de distorsions, d'alignement ou dans diverses orientations, y compris le texte courbé. La conception de cet ensemble vise spécifiquement à servir les méthodologies d'apprentissage profond requérant un large éventail de données d'entraînement diversifiées. Il englobe 2 030 images, soigneusement annotéesen caracyères et en mots, ainsi que la classe d'appartenance des mots d'onomatopées en fonction de la provenance ou la source du son emis. Il est à noter que ces images proviennent du site web ComicsbookFX, une plateforme dédiée exclusivement aux images de bandes dessinées découpées en cases. Ces images ont été extraites de divers albums de comics publiés entre 1936 et 1963 par les maisons d'édition renommées Marvel et DC Comics. Une bonne partie de la base d'iage manga 109 a été annotée aussi pour la detection des comics manga. La dernière partie de la thèse présente une analyse des meilleurs approches a adopter et la proposition d'une nouvelle approche de detection et de reconaissance d'onomatopées incluants des cas d'exemple de comics franco-belge et de manga.
https://www.univ-larochelle.fr/recherche/doctorat-et-hdr/soutenances-de-theses/soutenances-de-theses