Controle final correction 2011 2012

Université de Batna Faculté des sciences Département d ? informatique Durée h Module Recherche d ? information textuelle Contrôle ?nal Master II - SRI Le Questions de cours pts Dans le processus d ? indexation le ?chier inverse est une structure très utilisée Quel est l ? inconvénient majeur de cette structure pt Quelle dé ?nition a proposé Tefko Saracevic pour la pertinence pt Un terme qui appara? t dans tous les documents d ? un corpus est-il discriminant ou pas pt Un modèle de recherche d ? information est vu comme un quadruplet Dé ?nissez ce quadruplet en expliquant les quatre éléments pt Quel est l ? inconvénient du modèle LSI pt Exercice pts Soit la requête booléenne suivante R t ? -AND t ? -OR t -AND t et soit les poids des termes dans les documents comme suit t t t t D D D D Trouvez les documents pertinents à R Exercice pts Le serveur vGlOSS fait deux suppositions dans le scénario avec grandecorrélation Soit une collection de documents hébergée sur un serveur si et une question q contenant termes t t t Le nombre de documents de la collection contenants les termes de q est dé ?ni comme suit ? ? et ? Les poids des termes de q dans la collection sont wi wi wi En se basant sur les suppositions du scénario avec grande- corrélation calculez la similarité Estimate q si et dites si le serveur si sera sélectionné comme pertinent Bonne chance ? NB Le corrigé type vous le trouverez sur le site http www larbiguezouli com - - CCorrection du contrôle ?nal Master II - SRI Questions de cours pts Dans le processus d ? indexation le ?chier inverse est une structure très utilisée Quel est l ? inconvénient majeur de cette structure pt Le ?chier inverse exige un espace de stockage important de à de la taille de la collection de documents selon la complexité de l'indexation Quelle dé ?nition à proposé Tefko Saracevic pour la pertinence pt La pertinence est la A d'un B existant entre un C et un D jugé par un E Tel que A intervalle de la mesure B aspect de la pertinence C un document D besoin d'information requête E l'utilisateur Un terme qui appara? t dans tous les documents d ? un corpus est-il discriminant ou pas pt Un terme qui appara? t dans tous les documents n'est pas discriminant Un modèle de recherche d ? information est vu comme un quadruplet Dé ?nissez ce quadruplet en expliquant les quatre éléments pt D Q F R qi dj tel que D est l ? ensemble des représentations des documents du corpus Q est l ? ensemble des représentations des requêtes de l ? utilisateur F est le Framework de modélisation des représentations des documents ensembles des opérations sur les représentations des documents R qi dj est la fonction de classement qui associe au couple qi dj un réel représentant le degré de rapprochement

Documents similaires
  • 51
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Jul 31, 2022
  • Catégorie Administration
  • Langue French
  • Taille du fichier 54.1kB