EL DEBATE: Del trópico, los tomates y la clonación in vitro. Las dificultades de buscar información académica en Internet

 

Por Rodolfo Barrere y Lautaro Matas

Observatorio Iberoamericano de la Ciencia, la Tecnología y la Sociedad

 

¿Qué tienen en común el trópico, los tomates y la clonación in vitro? Al menos una cosa, que son los diferentes temas abordados por los tres primeros documentos científicos que ofrece Google Scholar cuando un usuario introduce el cotidiano término “cultivo”. Parecen cosas muy distintas, y efectivamente lo son, aunque el buscador no puede privilegiar uno sobre el otro porque no tiene forma de saber qué está buscando realmente el usuario. Y es que los usuarios, muchas veces, no sabemos muy bien qué es lo que buscamos. Nuestro ejemplo del agua resulta un poco extremo, pero ¿qué pasa si nuestro hipotético usuario, frustrado por la imprecisa experiencia inicial -y devanándose los sesos en un esfuerzo de precisión- busca ahora bajo los términos “cultivos y agua”? Encontrará una vez más una diversidad importante de temáticas, que van desde la necesidad de agua en la agricultura, la calidad de la misma e información sobre riego tecnificado. La cosa mejora, pero nuestro esforzado investigador aún tiene muchas decisiones que tomar, refinando la búsqueda en un proceso iterativo -y temporalmente indefinido- hasta que dé con lo que buscaba o se canse y dedique su ancho de banda a una tarea menos frustrante, como hacer un Sudoku en Internet o chatear con amigos.

 

Es que el foco de este tipo de herramientas está puesto en la “recuperación de información”, una disciplina que busca resolver el viejo problema de encontrar una aguja en un pajar. El ordenamiento de los resultados según su relevancia medida en citas, por ejemplo, es de gran utilidad, pero sigue partiendo de la base de que sólo nos interesan las agujas y no, por ejemplo, una máquina de coser completa que, oculta en el mismo pajar, solucionaría mucho mejor nuestro problema.

 

En realidad Internet no se parece tanto a un pajar sino, más bien, a un gigantesco cajón de sastre en el que se mezclan desordenadamente un sinnúmero de elementos, agujas incluidas, que unas veces nos pueden ser útiles y otras no. Para colmo, nuestro cajón no para de llenarse: algunas estimaciones afirman que el volumen de información digital se duplica cada veinte meses. En ese desordenado contexto, y recordando la imprecisión que suelen tener nuestras búsquedas a la hora de explorar la información en Internet, un problema adicional reside en restringir demasiado los criterios, en alguno de los pasos del iterativo proceso de búsqueda, dejando afuera algo que nos hubiera interesado mucho, aunque aún no lo sabemos. ¿Cómo puedo buscar algo que no conozco aún?

 

A este nuevo dilema busca dar solución otra disciplina de las ciencias de la información, la del “descubrimiento de conocimiento”. Una de sus ramas, que resulta útil en un terreno vasto como el de la información académica en Internet, intenta ofrecer un mapa de ese terreno desconocido. Para ello se basa, por ejemplo, en la extracción automática de conceptos a partir del análisis del lenguaje natural, su ordenamiento a partir de las relaciones que se pueden establecer entre ellos y su representación gráfica. El portal Intelligo (www.explora-intelligo.info), que presentamos recientemente, está en esa línea.

 

Cuando uno busca bajo el término “cultivo” en Intelligo no obtiene tan sólo una lista de documentos que contienen esa palabra, sino también una representación gráfica de los temas contenidos en ellos y articulados según sus relaciones en esos documentos. Así veremos un mapa en forma de una red, en la que cada una de las ramas agrupa a diferentes temas: por un lado el cultivo de tejidos en laboratorio, por otro los temas agrícolas y más allá el desarrollo sostenible.

 

Esa red de conceptos no emerge de ninguno de los documentos en particular, sino de la totalidad del conjunto que hemos recortado con nuestra expresión de búsqueda. Es el resultado de la producción colectiva de todos los autores cuyos documentos se analizaron. No se trata de una herramienta de búsqueda, en el sentido estricto, sino más bien de una herramienta de exploración y descubrimiento.

 

Este panorama abre las puertas a una serie de discusiones. Por un lado, la necesidad de un abanico de herramientas como las mencionadas, cada una más útil que la otra según la ocasión, para aprovechar la información disponible. Por el otro, las capacidades que exige a los usuarios el análisis de la abundante información académica en Internet y su contra cara: las brechas que se pueden abrir entre investigadores, ya no sólo por el acceso o no a la información, sino también por las capacidades de explorarla y comprenderla para hacer el mejor uso de ella.