La búsqueda de páginas en Internet es una de las maravillas de la modernidad que vivimos. Casi toda persona que tiene acceso a una computadora y un proveedor de Internet, realiza diariamente búsquedas en Internet para buscar desde personas o productos en venta, hasta remedios para los problemas de salud.
Los buscadores de internet existen desde 1993, cuando Matthew Gray, del Instituto Tecnológico de Massachusetts (MIT), desarrolló un buscador llamado Wandex, que hoy ya no existe. El primer buscador de gran éxito fue WebCrawler, que permitía buscar cualquier palabra en cualquier documento de texto, lo cual hoy nos parece evidentemente necesario. Otros buscadores de los 90 fueron Lycos, Altavista, Excite, Infoseek y varios más. En aquellos tiempos los buscadores competían con los “directorios”, que son compendios de páginas web clasificadas en categorías; el directorio más importante fue y sigue siendo Yahoo.
Sin embargo, en el año 2000 cambió el panorama de la búsqueda en la web, la red de redes, con la llegada de Google, desde luego. Google, creado por dos estudiantes de Stanford, Larry Page y Sergey Brin, rápidamente se convirtió en el sistema de búsqueda dominante gracias al sorprendente desempeño del método de ordenamiento llamado PageRank, creado y patentado por los creadores de Google. En unos pocos años, Google desplazó completamente a sus competidores, al grado que en inglés se usa to Google como verbo (en español diríamos “googlear”).
Tras el éxito de Google, varias compañías, como Microsoft, han tratado de alcanzar al líder, sin mucho éxito. Recientemente Microsoft trató de comprar al lejano segundo lugar en búsquedas, Yahoo, pero fracasó en el intento.
Hoy en día, estamos completamente acostumbrados a usar los buscadores todas las veces que usamos internet, aun sin importar que muchos no conozcamos el uso adecuado de los buscadores. Por ejemplo, ¿cuántos saben que para restringir la búsqueda a un sitio web www.misitio.com hay que escribir site: www.misitio.com?
Otro aspecto posiblemente más importante es que nos estamos acostumbrando a las deficiencias de los buscadores.
Pero, ¿tienen deficiencias los buscadores? ¡Sí! Nos traen muchísima información. Sí, muchísima, pero tal vez demasiada. ¿No le ha ocurrido al lector que al buscar en internet, además de páginas relacionadas con el tema que le interesa, vienen miles de otras páginas que no tienen realmente nada que ver? Por ejemplo, si se busca la palabra “chip” se obtienen unos resultados relacionados con papas fritas, otros relacionados con microelectrónica, otros con programas de televisión, y así en adelante.
Lo que ocurre es que los buscadores como Google no se enteran de qué tema se tratan las páginas que se buscan. Simplemente verifican que los sitios contengan las palabras que el usuario incluye. Sin embargo, a menudo las palabras quieren decir cosas distintas, según el tema del que estemos hablando. Esto provoca que el usuario de internet tenga que “espulgar” a mano los resultados de las búsquedas, lo cual consume tiempo y esfuerzo. Ciertamente nos estamos acostumbrando a hacerlo, pero esto no quiere decir que sea deseable.
¿Podría ser de otra manera?
En México, Eduardo Ramírez y el autor de esta contribución desarrollan en el Instituto Tecnológico de Monterrey un proyecto cuyo objetivo es identificar automáticamente los temas que contiene una colección de documentos, y así posteriormente relacionar una búsqueda de información con los temas existentes. La tecnología desarrollada se llama “contextos semánticos”, y puede tener varias aplicaciones importantes en internet. Por ejemplo, puede aplicarse a hacer mejores búsquedas que con Google, permitiendo al usuario refinar la búsqueda con el tema en cuestión.
Pongamos un ejemplo concreto: imaginemos que el usuario hace una búsqueda con la palabra “chip”. Entonces el buscador con contextos semánticos ofrecería al usuario la posibilidad de escoger temas: ¿usted quiere decir chips como en: snacks, potato, fried, o bien como en computers, circuits, silicon? Al elegir el usuario uno de los temas, todos los resultados de la búsqueda se referirán al tema elegido, ahorrando así al usuario el trabajo de “espulgar” a mano los resultados del buscador.
Otras maneras de mejorar los buscadores es tomar en cuenta las costumbres de búsqueda de un usuario en particular. Esto es, los buscadores no producen los mismos resultados cuando son usados por Juan Pérez que por Bruno Díaz. En opinión de Udi Manber, de Google, también será cada vez más importante tomar en cuenta el lugar geográfico desde el cual se realiza la búsqueda; esto ya se hace actualmente en cierta medida. Por ejemplo, si uno busca “Hotels” estando en México, los resultados que trae Google no son los mismos que si la misma búsqueda se hace en Transilvania.
Así, los buscadores de internet continuarán evolucionando, principalmente para hacerse más flexibles y, sobre todo, más útiles.
*ITESM–Campus Monterrey.