|
L’une des plaintes les plus fréquentes que l’on entend concernant le Web est la difficulté de trouver de l’information ciblée. Par où faut‑il commencer? La recherche sur Internet est constituée d’une partie d’habiletés, d’une partie de chance et d’un peu de sens artistique. Heureusement, un certain nombre de ressources en ligne gratuites vous aident à partir à la chasse à l’information. Vous avez probablement entendu parler de Yahoo!, Google, AltaVista et des MOTEURS DE RECHERCHE. Il existe en fait des douzaines d’outils de ce type qui vous aident à repérer l’information que vous cherchez. Le truc est de comprendre la façon dont ils fonctionnent afin d’utiliser le bon outil pour le travail à accomplir. Les moteurs de recherche se divisent en deux catégories -- ANNUAIRES et INDEX. Les moteurs de recherche d’annuaires, tel Yahoo!, sont idéals pour repérer de l’information générale. Tel un catalogue de bibliothèque, ils classent les sites Web en catégories similaires, par exemple organismes d’aide aux déficientes, universités anglaises et musées d’histoire naturelle. Les résultats d’une recherche avec ce type de moteur permettent d’obtenir la liste des sites Web associés à votre terme de recherche. Par exemple, si vous désirez accéder au site Web du musée du Louvre, utilisez un annuaire. Mais que faire si vous désirez de l’information spécifique, par exemple une bibliographie de Léonard de Vinci? Dans ce cas, vous devez utiliser les moteurs de recherche d’index puisqu’ils effectuent leur recherche dans tout le contenu d’un site. Ces moteurs utilisent des programmes logiciels appelés robots qui scrutent Internet, analysant des millions de pages Web et d’affichages de groupes de discussion, en plus d’indexer tous les mots. Des moteurs de recherche basés sur les index tel AltaVista (http://www.altavista.com) et Google (http://www.google.com) (mon préféré) permettent de repérer des pages individuelles d’un site qui répondent à votre critère de recherche même si le site lui‑même n’a rien à voir avec l’information recherchée. Vous pouvez parfois trouver des perles d’information inattendues de cette façon; toutefois, préparez‑vous également à devoir composer avec beaucoup d’information non pertinente. Les résultats de recherche peuvent être classés en ordre de pertinence : nombre de fois qu’un terme de recherche figure dans un document -- ou de proximité, c’est‑à‑dire la mesure dans laquelle le document s’approche ou non du concept que vous avez précisé. Cette approche offre une méthode beaucoup plus complète pour repérer ce que vous désirez.
Le défi est le suivant : vous prévoyez visiter San Francisco et vous avez toujours désiré monter à bord d’un « cable car ». Ces tramways fonctionnent‑ils en janvier? Comment vous y prendre pour le savoir? Dans un premier temps, nous allons utiliser Yahoo! (http://www.yahoo.com). Un truc que vous devez connaître lorsque vous effectuez une recherche est de la cibler. Si vous tapez « San Francisco » dans la case de recherche, vous obtiendrez plus de 2 000 sites qui incluent le nom de la ville. Si vous tapez « cable cars », vous obtenez 74 sites dont la plupart n’ont rien à voir avec la ville de San Francisco. En combinant les deux termes (« San Francisco cable cars »), vous obtenez 13 sites, chacun accompagné d’une brève description. Vous devez ensuite visiter chaque site pour voir s’il y a de l’information sur les horaires de « cable car ». Maintenant, essayons Google (http://www.google.com), moteur de recherche axé sur les index. Ici encore, tapez « San Francisco cable cars » dans la case de recherche. Le moteur trouve plus de 60 000 documents qui correspondent à vos termes de recherche! La vie est trop courte pour vous permettre de les examiner tous individuellement. La raison de cette liste énorme de résultats est que le moteur Google repère chaque document qui contienne les mots « San », « Francisco », « cable » et « cars ». Pour effectuer une recherche des documents qui contiennent la phrase exacte, utilisez des guillemets au début et à la fin du groupe de termes (« San Francisco cable cars »). Vous obtiendrez alors environ 2 000 documents. Heureusement, Google est intelligent et classe les sites en ordre de pertinence; il est donc fort probable que les premières entrées contiennent de l’information que vous recherchez concernant les horaires. Le moteur Ask Jeeves (http://www.ask.com) utilise une technologie appelée interrogation en langage naturel, façon un petit peu pédante de dire que vous pouvez poser votre question en anglais normal. Lorsque vous tapez une question du genre « What is the San Francisco cable car schedule? » (Quel est l’horaire des cable cars de San Francisco?), vous obtenez une liste de choix connexes, par exemple « Where can I find a city guide for San Francisco? » (Où puis‑je trouver un guide de la ville de San Francisco?) et « Where can I find tourist information for San Francisco? » (Où puis‑je trouver de l’information touristique sur San Francisco?). En cliquant sur une question, vous accédez à un site Web qui contient la réponse recherchée. N’oubliez pas que les sites Web changent fréquemment. Ces changements ne sont pas toujours reflétés dans la base de données du moteur de recherche, plus particulièrement dans ceux qui utilisent des annuaires. Normalement, les responsables de sites Web inscrivent ces derniers dans les moteurs de recherche lors de leur ouverture initiale. Par la suite, tout changement n’est, de manière générale, pas signalé. Pour trouver l’information la plus récente, la meilleure solution est d’utiliser des moteurs de recherche qui utilisent des robots d’indexation du Web, logiciels qui effectuent une recherche constante d’Internet pour y repérer les ajouts et les changements.
Quel que soit le moteur que vous utilisez, il est vraiment utile d’en connaître les particularités de fonctionnement. Prenez le temps de lire les conseils de recherche offerts sur chaque site. Par exemple, de quelle façon le moteur traite‑t‑il les recherches qui incluent plus d’un mot? La majorité, mais non tous, produisent des résultats qui incluent n’importe lequel des mots. Étant donné l’immense volume d’information en ligne, vous voudrez normalement restreindre la portée de vos recherches. Comment vous y prendre? Il est opportun, à ce stade‑ci, de digresser et de parler un peu des opérateurs booléens. Le mathématicien anglais, George Boole, a mis au point un algèbre logique qui est devenu la base des recherches de base de données informatiques. La logique booléenne utilise des mots appelés opérateurs pour déterminer si un énoncé est vrai ou faux. Les opérateurs les plus courants sont AND, OR et NOT. Ces trois petits mots peuvent être très utiles lorsque vous effectuez des recherches en ligne. Voici quelques exemples :
Recherche de… cable OR car permet d’obtenir la liste des documents qui contiennent l’un ou l’autre mot, de loin la liste la plus volumineuse d’équivalences. Recherche de… cable NOT car permet d’obtenir la liste des documents qui contiennent le mot cable mais non le mot car, ce qui est une bonne façon de restreindre la recherche. La syntaxe exacte que chaque moteur utilise est différente; vous devez donc vous familiariser avec les propriétés uniques de chaque moteur.
Plutôt que d’effectuer une recherche de chaque annuaire ou index individuellement, vous pouvez présenter votre interrogation simultanément à plusieurs moteurs de recherche en effectuant une métarecherche.
Que vous recherchiez de l’information sur les « cable cars », sur des investissements ou tout autre sujet, vous pouvez utiliser les cinq moteurs de recherche les plus populaires ci‑dessous. N’oubliez pas que chacun est différent. La méthodologie varie légèrement de l’un à l’autre et les résultats obtenus varieront également. Il est possible que vous ne trouviez pas toujours ce que vous cherchez la première fois. AltaVista HotBot Ask Jeeves Google Yahoo!
retour à l’index de contenu de la technologie
|
|
|