Équipe Images et Contenus (IC) : HAMDI Ahmed

Enseignant chercheur

Mots clés : NLP, Information Extraction, Digital Humanities

Publié le

Thématiques de recherche : My research focuses on leveraging Natural Language Processing (NLP) techniques to extract relevant information from digitized documents. This involves subtasks such as text classification, named entity recognition and linking, stance detection and information retrieval to process and analyze large collections of digital texts.

Points forts des activités de recherche :
- Participation aux montage du projet LABCOM ANR RESILIENCE (2025-2028) en collaboration avec l'entreprise Oodrive sur la sécurisation des clouds : axes protection de données et protection des accès. Porteur du projet : Yacine Ghamri Doudane
- Participation aux montage du projet LABCOM ANR IDEAS (2018-2021) sur la classification et l'extraction d'information des documents adminitratifs. Porteur : Mickaël Coustaty
- Codirection de thèse (25%) Mouhamet Ndiaye, déc 2024 - nov 2027 : ""Classification et iIdentification de Données Sensibles"" avec Yacine Ghamri Doudane
- Encadrement de stage M2 - Alexandre Jaud : ""Au-delà des CER et de WER, Développement de Métriques Alternatives pour une Évaluation Plus Précise des Systèmes OCR""
- Responsable de deux livrables dans le projet européen H2020-NewsEye (2018-2021) : Named Entity Recognition and Linking in Historical Journals and Stance Detection towards Named Entities
- Membre du Comité de Programme : SIGIR-25, DAS-22, CHR-22
- Conférencier invité au séminaire ""Digital Humanities Research Seminar"" à Université de Wolverhampton le 19 Mai 2022. Information Extraction from Digitized Documents : Challenges and Solutions
- Co-organisation du shared task DocILE’23 sur l’extraction et la localisation d’information à partir des documents commerciaux à ICDAR 2023 and CLEF 2023