Merci a Philippe, membre de la
liste d entraide SoSWindows
pour sa participation.
La recherche linguistique : Molière, Shakespeare ou Goethe ? Lorsque l'on recherche des informations sur le Web, il peut s'avérer intéressant, voire indispensable, de ne rechercher dans un premier temps que des sites ou des pages dans une seule langue, comme le français. Si, éventuellement, votre première investigation dans ce langage ne vous a pas donné satisfaction, il sera toujours temps d'élargir vos requêtes au niveau linguistique dans un second temps. En ce qui concerne les annuaires, la situation est simple : un outil comme Yahoo!, par exemple, dispose d'une version anglophone (http://www.yahoo.com/) et d'une version francophone (http://www.yahoo.fr/), entre autres, de son outil de recherche. Attention : les deux sites, s'ils appartiennent à la même société, n'ont rien à voir l'un avec l'autre : le premier recense des sites en langue anglaise, le second des sites en langue française. Les deux bases de données utilisées sont totalement distinctes. N'essayez donc pas de chercher un site en Français sur yahoo.com, vous seriez vite décu. Et si vous recherchez un site en Italien, allez plutôt faire un tour sur Yahoo! Italie (http://www.yahoo.it/). Si vous désirez connaître la "gamme" des versions linguistiques de yahoo!, vous la trouverez ici (http://fr.docs.yahoo.com/info/etc.html). La plupart de moteurs majeurs proposent, quant à eux, un filtre linguistique. Altavista (http://www.altavista.com/) propose, sur sa page d'accueil, un menu déroulant qui permet de choisir parmi 25 langues celle dans laquelle la recherche sera effectuée. Comment cela fonctionne-t-il ? Hé bien, lorsque le robot du moteur vient "aspirer" les pages de votre site, il en lit le contenu et, à l'aide, grosso modo, de dictionnaires annexes, il tente de déceler la langue dans laquelle cette page a été écrite. Il l'"estampille" alors de l'information adéquate ("in french" par exemple). Pour cela, il a besoin d'un certain nombre de mots dans le document afin que cette détection soit significative. C'est notamment pour cela qu'une page trop graphique (ne contenant pas assez de texte) est mal prise en compte par les moteurs. Il en est de même d'une page bilingue ou trilingue. Le robot détecte des mots, par exemple, en français et en allemand et ne peut définir une langue unique pour la page. Du coup... il n'en indique aucune ! Sur Altavista, cette page sera trouvée avec l'option "any language", mais pas avec l'option "in french" du menu déroulant. Dans la mesure du possible, si vous mettez en place un site web, évitez donc de créer des pages multilingues si vous désirez que les internautes français la trouvent. Dernier point : si vous désirez faire une recherche simultanément dans plusieurs langues (par exemple et français, espagnol et italien), le moteur Altavista vous le permet : allez dans l'interface de configuration, intitulée "Customize settings" puis "Language options" (http://www.altavista.com/cgi-bin/query?pref=lang&pg=&stype=stext&Translate=on&sc=on) et cochez les cases correspondantes aux langues qui vous intéressent. Cliquez ensuite, en bas de page, sur le bouton "Submit". Vous obtenez alors un nouvel Altavista, configuré pour vos langues préférées. Regardez le menu déroulant à gauche du bouton "Search" : il s'intitule maintenant "my langages". Vos recherche s'effectueront maintenant dans les langues spécifiées auparavant, ce qui vous évite de faire plusieurs recherches à la suite. Si vous revenez plus tard sur Altavista, vous reviendrez cependant à la version "classique" du moteur. Si vous désirez ré-utiliser ce service "customisé" pour plusieurs langues, placez-le dans vos favoris (en effet, l'adresse de la page d'accueil ainsi configurée est un peu complexe à ressaisir...) et revenez la chercher lorsque vous en avez à nouveau besoin. Dernier point : Bien entendu, si vous recherchez de l'information français, tapez des mots clés en français. Cela va sans dire, mais tellement mieux en le disant&...; |