TOUS / A / B / C / D / E / F / G / H / I / J / K / L / M / N / O / P / Q / R / S / T / U / V / W / X / Y / Z / Personnalités /
Recherchez les définitions ci-dessus
Décomposition en Valeurs Singulières. Processus consistant à décomposer une grande base de données pour en trouver le document vecteur (pertinence) pour divers sujets en les comparant à d'autres objets et documents. Les principales étapes de ce processus sont:
Steeming: prise en compte les différentes formes d'un mot sur une page
Local Weighting Pondération locale: accroître la pertinence d'un document donné en fonction de la fréquence d'un terme
Global Weighting Pondération globale: accroître la pertinence des termes qui apparaissent dans un petit nombre de pages car elles sont plus susceptibles d'être sur le sujet que les mots qui apparaissent dans la plupart des tous les documents.
Normalisation: pénaliser les copies longues et gratifier les textes courts pour permettre une répartition équitable des résultats.
Le Multi dimensional scaling est plus efficace que la décomposition en valeurs singulières, car elle nécessite moins de calculs lourds. Combiné avec d'autres facteurs de ranking, une approximation de la pertinence est souvent suffisante.