Aucun domaine n’échappe au géant américain. Google veut désormais s’attaquer au Big Data avec son nouveau moteur de recherche “Dataset Search”. Google Dataset Search est un moteur de recherche qui s’attaque aux bases de données open source des universités ou des institutions gouvernementales.

Destinées au préalable pour les journalistes de données, les scientifiques ou toute autre personne dans le besoin, Dataset Search a pour objectif de faciliter au maximum l’accès à des données ouvertes et conservées en général sur les sites des structures gouvernementales.

Le nouvel outil de Google entre plus en détails en diffusant les données. Il ne s’agit pas d’afficher les sites qui répondent à la pertinence du mot-clé entrée. Google Dataset Search permet d’avoir l’accès aux données directement dans sa page de résultat. Ainsi, si vous êtes à la recherche de site de paris en ligne, ce nouveau moteur de recherche n’est pas approprié.

Le géant du web nous a habitués pendant longtemps à ces nouveautés, mais Google Dataset Search est un nouveau moteur de recherche en parallèle au moteur de recherche classique. Il s’inscrit dans le même type d’outils tels que Google Book Search pour la consultation en ligne des livres numériques, Google Scholar pour la recherche d’articles scientifiques, Google images pour la recherche d’images et plus encore.

Chaque institution ou structure gouvernementale devant publier des données en ligne vont devoir respecter certaines règles pour Google Dataset Search. Elles devront inclure des balises de métadonnées dans leurs pages web pour faciliter l’indexation. Ces balises vont prendre en compte le nom de la structure, la date de publication, l’auteur et la description des données. Tous ceux qui fournissent les données devront de ce fait se soumettre à ces quelques règles pour faciliter l’indexation de leurs publications.

Il est souvent difficile pour des scientifiques de trouver toutes les informations dont ils ont besoin pour avancer dans leur travail de recherche. En général, ils sont obligés de trouver la source de données, et ce, après plusieurs jours de recherche. Google Dataset Search permet de centraliser ces informations et les trouver en un clic. Pour l’heure, la base de données du nouveau moteur de recherche ne contient pas encore une grande quantité de données.

Google Dataset Search est censé récupérer les données scientifiques de l’environnement et du social ainsi que les données du Gouvernement et des organismes publics. L’arrivée de ce moteur de recherche devrait booster tout un chacun à rendre ces informations scientifiques plus accessibles. Google Dataset Search permet de récupérer des données, quel que soit le type d’hébergement (site web, bibliothèque numérique, etc.).

Plusieurs organismes gouvernementaux se sont prêtés à l’exercice et font désormais partie de la base de données de Google Dataset Search. C’est le cas de la NASA (National Aeronautics and Space Administration) et l’université Harvard University avec son application Dataverse. L’Agence américaine d’observation océanique et atmosphérique (NOAA) fait aussi partie des fournisseurs de données ainsi que le consortium international de bibliothèques et services spécialisés dans les sciences de l’information dénommée DataCite.

Le site référencé ici est disponible à cette adresse :

LAISSER UN COMMENTAIRE

Please enter your comment!
Please enter your name here

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.