création et intégration de ressources linguistiques à des moteurs de recherche (web sémantique)
réalisation d'outils d'extraction d'information et de classification automatique de documents
création de patrons linguistiques pour la détection automatique d'entités nommées (noms de lieu, de personne, d'organisation, noms de fonctions), de groupes nominaux simples et complexes
étude des genres textuels
résolution de la référence (anaphores, chaînes de référence)
membre du comité de pilotage du projet IdEx (initiative d'excellence) "formation professionnelle" de l'Université de Strasbourg : "La thèse en mode projet : conception, gestion, valorisation"
En tant que chargée de mission, j’ai participé à l’organisation et à la mise en place d’un cycle de formations et de conférences dédiées à des doctorants en sciences humaines et sociales, j’ai assuré la communication et notamment la conception de la page Web du projet. J’ai aussi été en charge de la gestion financière, de la gestion logistique (réservations, achats, préparation du matériel et des salles), de l'encadrement des bénévoles de DoXtra, de l'accueil et de l'accompagnement des formateurs externes ainsi que des participants aux activités. J’ai assuré la conception de supports documentaires et j’ai été chargée de l'évaluation et de la rédaction du rapport d'évaluation ainsi que du suivi des activités du projet.
Développement d’un outil de détection automatique de thèmes pour améliorer la classification des documents dans le moteur de recherche interne de l’entreprise.
Veille et consultations en moteurs de recherche sémantiques
Rédaction du blog interne « Référencement et moteurs de recherche »
Correction de manuels d’installation (RBS Agileo DMS Explorer, …)
Encadrement de stages (niveau master en linguistique et informatique)
Participation à la campagne d’évaluation SemEval’07 sur la désambiguïsation de la métonymie dans les Entités Nommées pour l’anglais et le français : écriture de règles, constitution de lexiques.
La thèse a été financée pendant 3 ans par l'ANRT (Association Nationale de la Recherche et de la Technologie) dans le cadre d'une convention CIFRE (Convention Industrielle de Formation par la REcherche) avec l'entreprise RBS à Strasbourg. L'objectif est d'améliorer le moteur de recherche interne de l'entreprise. Pour ce faire, une méthode hybride linguistique-statistique a été mise en place pour détecter automatiquement les thèmes contenus dans les documents; permettant une meilleure description du contenu des documents. Le système de détection automatique des thèmes a permis d'améliorer la pertinence des résultats du moteur de recherche, facilitant ainsi la recherche de documents par les utilisateurs.