|
Ces mots sont fréquemment utilisés dans des domaines faisant appel à des techniques proches de la statistique. En particulier, on les rencontre en permanence en traitement automatique de la langue, aussi bien en analyse ou en compréhension de texte qu'en fouille de documents, par exemple. J'ai mis beaucoup de temps à me faire une idée intuitive de la signification de ces termes, notamment parce que je n'arrivais pas vraiment à mettre la souris sur une définition claire — je ne cherchais pas vraiment, en fait. Une petite recherche sur le ouèbe et une discussion fructueuse avec mon collègue Pierre Boullier qui, lui, savait, m'ont convaincu qu'il n'était pas inutile de clarifier la question pour d'autres que moi.
Et voici le résultat.
Ainsi, si l'on note S l'ensemble des documents qu'un système automatique considère comme ayant une propriété recherchée, V l'ensemble des documents qui possèdent effectivement cette propriété, P et R respectivement la précision et le rappel du système :
| S ^ V | | S ^ V | P = ----------- R = ----------- | S | | V |
Intuitivement, je dirais que la précision représente la pertinence du système et le rappel sa couverture.
Le contenu de ces pages relève de la seule responsabilité de leurs auteurs, et ne représente pas nécessairement le point de vue officiel de l'INRIA ni de toute autre partie. Les informations sont présentées de bonne foi, mais leur exactitude ne saurait être garantie.