Tecnologia

Google lança novo mecanismo de busca para ajudar cientistas a encontrar dados

O Dataset Search pode ser o melhor amigo do cientista

Ilustração de Alex Castro / The Verge

O objetivo do Google sempre foi organizar as informações do mundo e seu primeiro alvo era a Web comercial. Agora, ele quer fazer o mesmo para a comunidade científica com um novo mecanismo de pesquisa para conjuntos de dados.

O serviço, chamado Dataset Search, foi lançado no último dia 7 de setembro e será um complemento do Google Scholar, o popular mecanismo de pesquisa da empresa para estudos e relatórios acadêmicos. Instituições que publicam seus dados on-line, como universidades e governos, precisarão incluir tags de metadados em suas páginas da web que descrevam seus dados, incluindo quem criou, quando foi publicado, como foi coletado e assim por diante. Essas informações serão indexadas pela pesquisa de conjunto de dados e combinadas com a entrada do Gráfico de conhecimento do Google. (Esse é o nome das caixas que aparecem para pesquisas comuns. Portanto, se o dataset X tiver sido publicado pelo CERN, algumas informações sobre o instituto também serão incluídas nos resultados.)

UM MOTOR DE BUSCA PARA UNIR O MUNDO FRAGMENTADO DE DATASETS ONLINE

Em entrevista à The Verge, Natasha Noy, pesquisadora do Google AI que ajudou a criar a Pesquisa de Dados, diz que o objetivo é unificar as dezenas de milhares de repositórios diferentes para conjuntos de dados online. “Queremos tornar esses dados detectáveis, mas mantê-los onde estão”, diz Noy.

No momento, a publicação de conjuntos de dados é extremamente fragmentada. Diferentes domínios científicos têm seus próprios repositórios preferidos, assim como diferentes governos e autoridades locais. “Os cientistas dizem: ‘Eu sei onde preciso encontrar meus conjuntos de dados, mas não é isso que eu sempre quero'”, diz Noy. “Uma vez que eles saem de sua comunidade única, é quando fica difícil.”

Noy dá o exemplo de uma cientista climática com quem ela conversou recentemente, que lhe disse que estava procurando um conjunto de dados específico sobre a temperatura dos oceanos para um próximo estudo, mas não conseguiu encontrá-lo em lugar nenhum. Ela não rastreou até encontrar um colega em uma conferência que reconheceu o conjunto de dados e informou onde estava hospedado. Só então ela poderia continuar com seu trabalho. “E isso nem era um depósito particular de boutiques”, diz Noy. “O conjunto de dados foi bem escrito em um lugar bastante proeminente, mas ainda era difícil de encontrar.

Traduzido do artigo de James Vincent da The Verge

Deixe um Comentário

%d blogueiros gostam disto: