Please use this identifier to cite or link to this item: http://archives.univ-biskra.dz/handle/123456789/24142
Title: Sélection des concepts et calcul de proximité sémantique pour réduire le silence dans la recherche d'images par le texte : vers des moteurs qui se configurent automatiquement
Authors: Debbagh, Farah
Keywords: Recherche d’images par le texte, annotation, silence, TF_ICTF, similarité cosinus, proximité sémantique, articles Wikipedia, coefficient de corrélation de Pearson, WordSimilarity-353
Issue Date: 2017
Abstract: Dans la recherche d’images par le texte, la comparaison binaire est une technique qui retrouve pour une requête basée-concept , les images annotées avec . Par conséquent, la performance du système de recherche est très influencée par la qualité d’annotation. Comme il est extrêmement difficile d'avoir une base d’images bien annotée, la recherche ignore de nombreuses images pertinentes parce que tout simplement elles ne sont pas annotées avec les concepts de la requête. Ce problème est communément appelé le silence. Il dégrade considérablement les performances de TBIR. L’objectif principal de cette thèse est de minimiser un tel problème, et par conséquent obtenir une performance supérieure dans les systèmes TBIR. Nous proposons un système TBIR qui intègre la proximité sémantique entre les concepts au sein de la recherche. Pour calculer la proximité sémantique entre les concepts, nous avons utilisé un ensemble d’articles Wikipedia comme source de connaissances externes, le schéma de pondération statistique TF_ICTF (Term Frequency_ Inverse Collection Term Frequency en anglais) et la mesure de similarité cosinus. Par la suite, les résultats de proximité sémantique sont intégrés au sein du mécanisme de recherche. Autrement dit, nous avons calculé la pertinence de chaque image en fonction des valeurs de proximité sémantique entre ses concepts d’annotation et la requête utilisateur. La méthode proposée présente de nombreux avantages. Elle est entièrement automatique, car aucune intervention humaine n'est requise. En outre, elle peut être appliquée soit dans la phase de recherche pour détecter plus d’images pertinentes, ou bien dans la phase d’annotation pour détecter et compléter des concepts pertinents manquants. De plus, la méthode statistique que nous avons adoptée pour calculer la proximité sémantique entre les concepts se caractérise par sa simplicité et sa performance. Elle est plus simple par rapport aux méthodes graphiques probabilistes, et plus performante que d’autres méthodes statistiques. Les résultats expérimentaux ont montré que la méthode proposée a atteint une grande précision dans la détection d’images pertinentes. En outre, la méthode proposée a montré sa performance par rapport à la comparaison binaire et d’autres travaux existants.
URI: http://archives.univ-biskra.dz/handle/123456789/24142
Appears in Collections:Informatique



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.