index des volumes et numéros courriel de la bibliothèque Site Web de la bibliothèque Page d'accueil Portail Poly
  Numéro 45 , février 2007
 
sommaire
Mot du directeur
Des ingénieurs humanistes, ça existe!
La Bibliothèque au fil du temps
Une entrevue avec Thomas Desseaux
Qui est-il?
Colombo cuisiné
La face cachée de Google Scholar
Perdus dans l'espace!
L'icône qu'on clique
On sonde le terrain
Attirés par la lumière?
chroniques
Nouvelles
Échos de la boîte à suggestions
La Bibliothèque c'est aussi...
La face cachée de Google Scholar

Démystifiez l'application et l'utilisation de l'interface de recherche « Google Scholar ».

Google Scholar (bêta) est un moteur de recherche spécialisé qui cible les publications pouvant intéresser le monde universitaire, qu'il s'agisse d'articles de revues savantes, de thèses, de brevets, de rapports techniques ou de travaux universitaires disponibles ou signalés dans le Web. Lancé en novembre 2004, cet outil porte encore la mention « bêta », c'est-à-dire qu'il est encore en développement.

Comment fonctionne Google Scholar? À première vue, l'interface simple de Google Scholar reflète l'approche de la « maison-mère », Google. Les robots de Google Scholar ont la capacité d'indexer les premiers 100 à 120K du texte intégral des documents, s'il est disponible sur le Web. C'est une avancée dans la découverte d'information, surtout que la stratégie de recherche est relativement peu élaborée. Il suffit d'entrer un ou quelques mots-clés dans la boîte de recherche pour générer une liste de références triée par ordre de pertinence selon un algorithme développé par Google.

De plus, ce moteur semble faire preuve « d'intelligence » en regroupant les différentes versions d'une même référence : prépublication, conférence, article, etc. un Ce signalement est accompagné d'extraits de textes et d'hyperliens qui permettent de relancer la recherche soit vers les publications ayant cité cette référence deux, soit vers des documents reliés au sujet de la référence trois. Fait à noter, la Bibliothèque de Polytechnique a une entente avec Google Scholar pour faire apparaître l'hyperlien « Document@PolyMtl » quatre quand le document se trouve dans notre collection.

Google scholar

Mais au juste, que contient Google Scholar? Le site ne fournit aucune liste systématique des sources. Il faut donc se fier aux écrits de chercheurs indépendants, à des tests ou à des communiqués de presse de tierces parties pour en apprendre davantage. Nous savons par exemple que l'Institut national de l'information scientifique et technique de France y a versé les 12,5 millions de notices de sa banque bibliographique. Par contre, au cours d'une des rares présentations du produit à l'automne 2005, un responsable du développement (Acharya 2005, cité dans Ford 2006) a signalé que les pages de l'éditeur Elsevier n'étaient pas visitées directement par les robots de Google Scholar. Cela semble toujours être le cas : un test réalisé en novembre 2006 dans Science Direct (Elsevier) avec le mot clé « chitosan » et limité à la publication Journal of colloid and interface science donne 45 références. La même recherche dans Google Scholar n'en rapporte que 19.

Par ailleurs, à cette même présentation, on a fourni une estimation de la répartition de la couverture par discipline : médecine, 22 %; génie, 14 %; biologie, 13 %; sociologie et psychologie, 13 %; chimie et physique, 12 %; lettres et sciences humaines, droit et gestion, 26 %.

Google Scholar refuse de divulguer la fréquence de ses mises à jour. De plus, un expert indépendant (Jacsò 2005) a constaté des erreurs dans la saisie des données (un numéro de page confondu avec une année, des duplications dans le décompte des citations) et des problèmes avec des opérateurs de base tels que le OR. Par exemple, l'expression « quebec OR quebecois » génère MOINS de références que le seul mot « quebec ».

En comparaison, d'autres moteurs de recherche spécialisés sont plus transparents : Scirus d'Elsevier, tout comme Windows Live Academic Search (qui sera le sujet d'un article dans le prochain Infotech), publient la liste de leurs sources. Toutefois ces outils n'ont pas bénéficié de la renommée de Google et ils n'offrent pas de recherche par citations, atout majeur pour attirer les chercheurs.

Les «inconnues» dans l'équation Google Scholar minent sa crédibilité. Les recommandations du milieu des bibliothèques ne sont donc pas enthousiastes. Bien que certaines bibliothèques universitaires l'aient intégré à leur page Web de départ en se disant qu'au moins le contenu était meilleur que Google-tout-court, ce moteur de recherche n'est pas encore l'outil qu'il souhaite devenir. Avec tout le capital dont dispose la « maison-mère », on se serait attendu à des progrès plus rapides de cette bonne idée lancée, rappelons-le, en 2004!

Nos recommandations vont dans le même sens : il importe de l'utiliser avec discernement. Pour une recherche exhaustive, il faudra s'assurer de compléter avec des ressources plus dignes de confiance, telles que Web of Science pour qui veut étudier les citations, ou encore différentes banques de données spécialisées disponibles sur le site de la Bibliothèque dans « Sélection par sujets ».

Marie-Hélène Dupuis

Acharya, A. (2005). « Searching Scholarly Literature: a Google Scholar Perspective », 9th World Congress on Health Information and Libraries, Brazil, September 2005, cité dans Ford, Lyle, (2006).Google Scholar and the UML. Reference Community Forum, April 2006. Consulté le 20 novembre 2006, tiré de http://www.umanitoba.ca/libraries/media/latestgsdraft.ppt

Jacsò, P. (2005). « Comparison and Analysis of the Citedness Scores in Web of Science and Google Scholar », Proceedings of Digital Libraries: Implementing Strategies and Sharing Experiences: 8th International Conference on Asian Digital Libraries, ICADL, Bangkok, Thailand, December 12-15, 2005. Springer Berlin / Heidelberg, p. 360-369. Consulté le 22 novembre 2006, tiré de
http://projects.ics.hawaii.edu/~jacso/PDFs/jacso-comparison-analysis-of-citedness.pdf

Issn

Droits d'auteur : cet article est mis à disposition sous un contrat Creative Commons.

Valid XHTML 1.0!



© École Polytechnique de Montréal              Modifié le: 09-02-2011