Com o volume de informação a aumentar exponencialmente a tradicional pesquisa e leitura de artigos científicos é cada vez mais uma prática em desuso com os investigadores a recorrerem a computadores que lêem e analisam uma miríade de artigos em muito pouco tempo.
Segundo o biólogo computacional da Boehringer Ingelheim, Jon Hill, esta técnica de análise de um texto científico em busca das suas informações críticas é designada como “mineração de texto” e refere-se ao processo computacional através do qual se estabelecem padrões semânticos e tendências estatísticas de dados com o objetivo de ‘apreender’ o seu conteúdo.
A mineração de dados de centenas de textos e de milhares de artigos de uma só vez permite, por outro lado, descobrir conexões ocultas e é uma ferramenta cada vez mais poderosa na descoberta de medicamentos, de acordo com Jon Hill, uma vez que simples pesquisa humana já não pode por si só assimilar o volume total de informação em circulação.
A Medline, por exemplo, atualmente detém algo como 22 milhões de resumos científicos para análise. “A pesquisa tem melhorado, mas não é suficiente. Há muito material. Não podemos manter o ritmo com a quantidade de dados científicos que são divulgados todos os dias”, disse Hill.
A mineração de textos e dados intensifica as funções de pesquisa tradicionais. “Não só o trabalho de recuperação, mas o trabalho de resumo também – que pode tornar as coisas muito mais rápidas”, declarou o mesmo investigador.
O crawling no computador é usado principalmente para grandes velocidades de leitura, mas as empresas farmacêuticas estão a descobrir novos usos para esta técnica. Por exemplo, para analisar o que a concorrência está a preparar. “Através dos campos de afiliação de artigos, pode saber-se quais as empresas que atuam em diferentes campos. De seguida, pode verificar-se as condutas dessas empresas “, disse Hill
A mineraçãode texto também pode evitar horas desperdiçadas em conferências.
Segundo Hill, os cientistas podem fazer com que os computadores facilitem o seu trabalho, mas é importante compreender os seus limites: o esforço manual tem que continuar a acompanhar a mineração automática do texto.