Hace casi 35 años nacía el primer buscador, cuando internet todavía daba sus primeros pasos. Desde entonces la evolución de cómo encontramos información en la red de redes ha sido acelerada, y este es un segmento que está todavía en evolución
Aunque ahora los motores de búsqueda, como Google, sean sinónimo de internet, y es casi imposible encontrar información sin acceder a alguno de ellos, esto no siempre fue así en la red de redes.
Dentro de unos días se cumplirán 35 años de la creación del primer motor de búsqueda, y aunque no tenía nada que ver con lo que conocemos hoy, fue el embrión que antecedió a todo lo demás que ha venido después.
El 10 de septiembre de 1990 nacía Archie, creado por Alan Emtage, Bill Heelan y Peter Deutsch, en la Universidad de McGill, en Montreal, Canadá. Su nombre es fruto del término en inglés archive, o archivo, y en sus primeras versiones recogía sitios de transferencia de información a partir del protocolo FTP.
Archie, curiosamente, fue hijo de la necesidad. Era una época en que los costos de acceso a internet eran casi prohibitivos, y tras la negativa de la mencionada universidad de conectarse, se decidió crear una especie de directorio que permitiera acceso a información remota.
Así, los usuarios de este buscador hacían peticiones para encontrar archivos, los cuales tenían que descargar antes de saber qué contenían. A diferencia de lo que hoy ocurre, Archie no analizaba el contenido de los archivos, no entendía lenguaje natural y requería conocer términos precisos.
Su uso fue principalmente académico, facilitando la localización de software y documentos en una red que conectaba, principalmente, a universidades. Hacia 1993, procesaba unas 50 000 consultas diarias y mantenía una base de datos de 2,1 millones de registros replicada en una docena de servidores, según datos citados por el diario español El País.
En 1991 se creó el protocolo Gopher, un servicio de internet consistente en el acceso a la información a través de menús. Esta tecnología, creada en la Universidad de Minnesota, Estados Unidos, permitía organizar la información de una manera más jerarquizada, lo cual derivó en el nacimiento de Jughead y Veronica, buscadores especializados en Gopher. Estos buscadores debieron sus nombres a Archie, pues además del origen citado coincidía con un cómic homónimo, y bajo esta creencia dieron continuidad al patrón.
Aunque tuvieron un éxito relativo, en materia de buscadores lo más relevante hasta 1993 fue la aparición de Wandex, creado por el ingeniero Matthew Gray, del Instituto Tecnológico de Massachussets, el cual rastreó e indexó páginas web. Su objetivo inicial, empero, era medir el tamaño de internet, que no paraba de crecer.
Y así llegamos a 1994, el año de la popularización de la World Wide Web, el abaratamiento de los costos de acceso, y la aparición de productos destinados a tratar de ordenar el incipiente caos.
Aliweb fue el primer buscador web público, basado en descripciones proporcionadas por los administradores de los sitios. Otro hito fue marcado por WebCrawler (1994): el primero en indexar el texto completo de las páginas.
En 1995, Altavista e Infoseek introdujeron búsquedas más rápidas, soporte multimedia y algoritmos más complejos.
Sin embargo, desde 1994 Yahoo!, un directorio de sitios web organizados de forma jerárquica, oficiaba como el «buscador» más empleado en la web. Precisamente a esta empresa, unos años después, unos jóvenes llamados Serguei Brin y Larry Page intentaron venderle su algoritmo para las búsquedas, pero fueron rechazados, aunque no desistieron.
Googol (gúgol) es el número diez elevado a la centésima potencia, es decir, diez elevado a cien. El resultado es un uno seguido de cien ceros. Su expresión matemática más común es 10^100.
En 1997, Yahoo! gozaba de una inmensa popularidad. Brin y Page habían creado un algoritmo que, según ellos, podía mejorar las búsquedas, y trataron de venderlo por un millón de dólares. Yahoo! lo rechazó.
En septiembre de 1998, sin darse por vencidos, Serguei y su amigo Larry lanzaron Google, como referencia al gúgol, pues su algoritmo permitía indexar muchísimas páginas web con una rapidez tremenda.
Lo novedoso de Google fue que introdujo el sistema de page rank, que asignaba (todavía lo hace) relevancia a una página según la cantidad y calidad de enlaces entrantes, ponderando más los enlaces desde páginas con alta autoridad.
Este algoritmo del buscador fue modelado mediante teoría de grafos y cadenas de Markov, calculando un vector de probabilidad estable, y mejoró drásticamente la pertinencia de los resultados. En poco tiempo, desplazó a la mayoría de competidores. Hoy la empresa está valorada en 2 500 billones de dólares.
Según datos de Statista, hasta marzo último Google tiene cerca del 90 por ciento de la cuota de mercado de buscadores, y su más ¿cercano? competidor es Bing, el motor de Microsoft que ni con inteligencia artificial generativa ha podido despegar, tiene un cuatro por ciento.
Con el tiempo Google se fue refinando, y la vez otros buscadores, que incorporaron búsqueda semántica para interpretar la intención del usuario y el contexto, no solo palabras clave. Por eso es que a veces da tanto miedo el autocompletar que nos hace el buscador, ya que «conoce y recuerda» nuestros comportamientos. Además, la integración multimedia en Google es total: resultados con imágenes, vídeos, mapas y compras.
Entretanto, el avance de la tecnología permitió la aparición de asistentes virtuales, con la búsqueda por voz mediante Siri, Alexa o Google
Assistant, y a la vez los resultados de búsqueda ahora son actualizados al instante.
La irrupción de la inteligencia artificial generativa ha cambiado las búsquedas y lo seguirá haciendo. Aunque en Cuba, si usted no usa una VPN, difícilmente pueda notarlo, pues las reglas del bloqueo estadounidense fuerzan a las grandes tecnológicas a privarnos de estos avances.
Para la mayoría de los que hacen una búsqueda hoy en Google, ya no es solo el algoritmo principal el que trabaja. Lo acompaña Gemini, el modelo de IA de la empresa, que brinda respuestas conversacionales con síntesis directa de información, en lugar de solo enlaces.
Asimismo, las búsquedas son ya multimodales: voz, audio o imagen para obtener resultados. Todo es permitido y, al mismo tiempo, ofrece respuestas bastante certeras. Otra cuestión es la predicción de necesidades. Los buscadores hoy sugieren temas antes de que el usuario formule una pregunta de seguimiento.
Los retos; sin embargo, son muchos: la privacidad está en vilo por el acceso a nuestros datos de estos modelos de lenguaje, hay sesgos algorítmicos que eliminan información y crean cajas de resonancia, y también mucha desinformación en resultados inexactos. Los ejemplos sobran.
Lo cierto es que desde el rudimentario Archie hasta los sistemas conversacionales basados en inteligencia artificial, la evolución de los buscadores refleja la propia historia de internet: de un espacio académico y limitado a un ecosistema global, inmediato… como si estuviera a punto de tener, muy pronto, vida propia.
Los resultados de Google ahora incluyen respuestas con inteligencia artificial generativa. Foto: Tomada de Xataka