Las utilidades de búsqueda, y hoy día existe un enorme abanico de ellas, están a nuestra disposición para facilitar el acceso a la información que necesitamos siempre, claro está, que sepamos como utilizarlas y aprovechar en profundidad sus mecanismos. Son muchos los usuarios que emplean habitualmente las utilidades de búsqueda, pero la mayoría de los navegantes desconocen la funcionalidad de algunas de ellos. Como cita Pere Marqués [1]:
Este texto nos ofrece algunas de las claves de las que nos ocuparemos en este curso. Seguramente ya conoces bastantes de los conceptos que trataremos. No obstante, conviene hacer una compilación inicial para fijar algunos conceptos, profundizar o formalizar otros, y establecer un vocabulario común para posterior uso.
1. Buscadores y portales
En el lenguaje informático un buscador es una herramienta que permite al usuario localizar un documento que contiene una determinada palabra u oración o, en general, una determinada información (puede también tratarse de imágenes, objetos multimedia, etc.). Los buscadores son sistemas, que residen normalmente en una página web, tales que cuando les solicitamos información sobre algún tema, la buscan en la red Internet. Muchos de ellos buscan únicamente en la Web, pero otros buscan además en otros servicios de difusión e intercambio de información de Internet, como Noticias, Grupos, etc. La búsqueda se lleva a cabo definiendo de alguna manera la información que deseamos localizar y el resultado de dicha búsqueda consiste normalmente en un listado de direcciones web en las que se encuentran temas relacionados con las palabras clave especificadas. En primera aproximación podemos encontrar buscadores de dos tipos:
Gracias a los buscadores, resulta más fácil moverse a través de la red y encontrar los contenidos que más nos interesen y que por lo tanto nos resulten útiles. ¿Un buscador y un portal, son lo mismo? No exactamente. La filosofía de los llamados portales web consiste en aglutinar en un solo sitio web todos los servicios que el internauta puede necesitar, con el fin de acaparar el máximo de visitas posibles y ser así la "puerta de entrada" a Internet del máximo número de usuarios. Muchos sistemas de búsqueda iniciaron su andadura como simple buscador y han terminado convirtiéndose en portales que incluyen un buscador (incluso en sus dos versiones: directorio y motor) entre sus servicios. Los portales genéricos suelen ofrecer, entre otras cosas: noticias, juegos, cuentas de correo electrónico, foros, chat y, como decimos, un buscador. Los portales especializados, por otra parte, se centran en ofrecer información específica relativa a un determinado determinado tema. Podríamos decir que un portal suele incluir un buscador pero que un buscador no responde necesariamente a la idea de un portal. En esta primera unidad didáctica nos dedicaremos sobre todo al estudio y aprovechamiento de los buscadores, mientras que en las unidades 2 y 3 nos centraremos principalmente en los portales dedicados a Educación y Legislación educativa.
2. Un poco de historiaEs conveniente presentar, al menos, algunos de los hitos esenciales en la evolución de las utilidades de búsqueda en Internet, ya que nos ponen en contacto con algunos de los conceptos básicos relacionados con el tema, así como con la denominación de varios de los principales sistemas de búsqueda de entre la gran variedad que existe actualmente. Ello nos facilitará los términos que manejaremos en los próximos apartados y capítulos. La primera utilidad para buscar en Internet fue Archie. El nombre proviene de la palabra Archive (archivo) sin la "v". Fue creada en 1990 por Alan Emtage, un estudiante de la Universidad McGill de Montreal. Este programa descargaba las listas de carpetas de archivos ubicados en servidores públicos FTP (File Transfer Protocol, se trata de un protocolo de transmisión de archivos entre ordenadores, al igual que HTTP, Hipertext Transfer Protocol, se trata de un protocolo de transmisión de páginas web entre ordenadores) y creaba una base de datos de nombres en la que se podían buscar archivos. Sin embargo, Archie no podía buscar en los contenidos de los archivos. Mientras que Archie indexaba los nombres de archivo (esto es, ordenaba los nombres mediante la elaboración de índices de consulta), Gopher indexaba los contenidos de los documentos de texto plano (aquéllos que incluyen texto puro, sin caracteres especiales ni formato alguno). Gopher fue creado en 1991 por Mark McCahill en la Universidad de Minnesota. Puesto que trataba archivos de texto, la mayor parte de sitios Gopher en Internet se convirtieron en sitios web tras la creación de la World Wide Web (ya que las páginas web son archivos de texto puro, aunque determinadas partes del texto se interpretan como etiquetas que ordenan a los navegadores dar cierto formato al contenido cuando éste se visualiza en ellos). Otros dos programas posteriores, Veronica y Jughead buscaban los archivos almacenados en los sistemas de índice Gopher proporcionando un sistema de búsqueda mediante palabras clave en las listas Gopher. El primer sistema de búsqueda en la Web fue Wandex, ahora extinto, desarrollado en el MIT (Instituto Tecnológico de Massachussets) en 1993. Otro aparecido también en 1993, Aliweb, todavía opera hoy día. El primer rastreador de "texto completo" fue WebCrawler, aparecido en 1994. A diferencia de sus predecesores permitía buscar cualquier palabra en cualquier página web y se convirtió desde ese momento en el estándar para la mayor parte de sistemas de búsqueda y en el más conocido por el público. También en 1994 surgió Lycos, de la Universidad Carnegie Mellon, que constituyó un gran esfuerzo comercial.
Aparición cronológica de algunos de los principales sistemas de búsqueda Poco después aparecieron varias utilidades de búsqueda que ganaron bastante popularidad: Excite, Infoseek, Inktomi, Northern Light y Altavista. De alguna manera competían con directorios populares como Yahoo!. Éste fue creado en 1994 por dos estudiantes graduados de Stanford como una lista de otros sitios web, organizada jerárquicamente, al contrario que los índices de búsqueda de páginas. En un principio la lista no era demasiado extensa pero, cuando fue creciendo, sus autores debieron dividirla en categorías, luego subcategorías y así sucesivamente, dando lugar al concepto de directorio web. Después, los directorios integraron o añadieron la tecnología de los motores de búsqueda para aumentar su funcionalidad (como hizo Yahoo a partir de 2002 tras adquirir otra compañías como Inktomi o AltaVista e integrar sus tecnologías combinadas). A finales de los años 90 los sistemas de búsqueda entraron en la categoría de estrellas de Internet. Varias compañías comerciales entraron de forma espectacular en el mercado, obteniendo record de ganancias en la Bolsa. Algunas de ellas, más tarde, han dejado su sistema de búsqueda para dedicarse sólo a temas de mercadotecnia empresarial. En 1998 se lanza Google y en torno a 2001 alcanza gran relevancia. Su éxito se basó, en parte, en el concepto de popularidad de enlaces y páginas. Tiene en cuenta el número de páginas web y de sitios web que enlazan a una determinada página para determinar la "bondad", la "popularidad" o lo deseable que puede resultar ésta para los usuarios. Así, Google ordena los resultados de una búsqueda en función de cuántos sitios web enlazan con dicha página (aunque también aplica más de 150 criterios para determinar la relevancia de la misma). Por otra parte, la minimalista interfaz de usuario de Google se hizo popular entre los usuarios y fue después adoptada por otros. En la actualidad Google es quizá el más popular sistema de búsqueda. El mercado chino de búsqueda en Internet no experimentó una fuerte expansión hasta la introducción de Baindu en 2000, un sistema que permite el empleo de los caracteres de escritura china (hanzi) en lugar de utilizar el alfabeto occidental. De los grandes sistemas de búsqueda, el de más reciente aparición es MSN Search de Microsoft. En 2004 debutó con su versión de prueba que utilizaba su propio rastreador web, denominado msnbot. Antes, esta compañía utilizaba los sistemas de búsqueda de otros. En 2006 Microsoft migró este sistema a una nueva plataforma de búsqueda: Windows Live Search. Ask.com, antes Ask Jeeves -aparecido en 1996-, fue el primer sistema comercial de búsqueda de respuestas en la web. La idea original de éste fue posibilitar a los usuarios conseguir repuestas a preguntas formuladas en lenguaje natural, es decir, prácticamente en el mismo lenguaje que utilizamos en la comunicación humana. Tras la aparición de Google Ask perdió relevancia hasta que integró también sistemas de búsqueda mediante palabras clave. En 2006 se convirtió en el cuarto mayor sistema de búsqueda del mundo.
3. Modelos de búsqueda
En el apartado Buscadores y Portales hemos visto que, a grandes rasgos, los sistemas de búsqueda se polarizan en uno de dos modelos: el índice temático y el motor de búsqueda. Vamos ahora a establecer una clasificación más general y también más precisa que nos permitirá entonces entender con qué diferentes clases de utilidades contamos cuando pretendemos localizar información en Internet. Podemos clasificar los buscadores desde diversos puntos de vista:
Expondremos sólo ahora las características básicas de estos buscadores y los estudiaremos con más detenimiento en los próximos temas.
Buscadores automáticosTambién denominados motores de búsqueda (search engine), robots de búsqueda (web robot, internet bot o, simplemente, bot) o arañas (spiders), la mayoría de los grandes buscadores internacionales que todos usamos y conocemos son de este tipo. Requieren muchos recursos para su funcionamiento. Recorren automáticamente, sin la intervención de operadores humanos, las páginas web recopilando información sobre los contenidos de las mismas. Cuando buscamos una información en ellos consultan su base de datos, y nos presentan los resultados clasificados normalmente por su relevancia. De los distintos sitios web, los buscadores pueden almacenar desde sólo la página de entrada, a todas las páginas que contienen. Si buscamos una palabra clave, por ejemplo, “legislación”, en los resultados que nos ofrecen aparecerán páginas que contengan esta palabra en alguna parte de su texto. Si consideran que una web es importante para el usuario, tienden a registrarlas todas. Si no la consideran importante, sólo almacenan una o pocas páginas. Cada cierto tiempo, los motores revisan las webs, para actualizar los contenidos de su base de datos, por lo que a veces los resultados de la búsqueda no están totalmente actualizados. Ejemplos de motores de búsqueda son: Google, Altavista, Windows Live Search, Infoseek, etc. Trataremos con mucho más detalle estos buscadores en el Tema 1.2 y en el Tema 1.3.
Buscadores temáticosTambién denominados índices o directorios temáticos. A diferencia de los motores, en los directorios las páginas web son revisadas por operadores humanos y clasificadas según categorías, de forma que es más fácil encontrar sitios del tema de nuestro interés. Más que buscar información sobre los contenidos de un sitio web en función de palabras clave, los resultados se presentan haciendo referencia a la temática de los contenidos de dicho sitio. Los motores de búsqueda, puesto que operan de forma automática, "contienen" normalmente más información que los directorios. En resumen, podemos imaginar a un buscador como una base de datos similar a la que nosotros utilizamos para cualquier propósito, y sobre la que se pueden realizar búsquedas. Lo que diferencia a motores y directorios es la forma de incorporar la información a dicha base de datos y de clasificarla. Ejemplos de directorios son: Yahoo, The Open Directory, Trovator, etc. Trataremos con más detalle estos buscadores en el Tema 1.4.
Buscadores mixtosSon aquéllos que incorporan las capacidades tanto de buscadores automáticos como temáticos. A día de hoy muchos buscadores usan los dos sistemas indistintamente, de hecho, los buenos directorios combinan ambos sistemas. Tanto Google como Yahoo, por ejemplo, lo hacen.
Buscadores genéricosSon aquéllos que permiten buscar información de cualquier tipo, no sólo relacionada con algún tema determinado. Los buscadores automáticos y temáticos que hemos nombrado en los párrafos anteriores son también buscadores genéricos.
Buscadores especializadosLos buscadores especializados o verticales envían sus arañas a un conjunto determinado de sitios y sus bases de datos contienen información depurada acerca de un tema concreto. Como consecuencia, son más valiosos que los genéricos para los usuarios con interés en una determinada materia y, por tanto, tienen una audiencia muy específica. Así, existen buscadores verticales para medicina, ciencia, educación, viajes, compañías comerciales, buscadores de trabajo, etc. Estos buscadores devuelven resultados más precisos, más rápidamente y mediante la realización de consultas más simples que las que se necesitarían en los genéricos. Proporcionan contenidos relevantes y esenciales frente a los amplios y poco definidos que proporcionan los genéricos (de ahí la idea de verticalidad, como sinónimo de refinamiento y definición, contrapuesta a la idea de amplitud y poca definición). Un ejemplo de buscador especializado es Scirus, dedicado a la búsqueda en millones páginas web dedicadas a Ciencia. Y puedes encontrar buscadores especializados en distintas áreas temáticas y en distintas áreas geográficas en el directorio Buscopio.
Otros buscadores: Metabuscadores y AgentesNos referimos ahora a buscadores que proporcionan un valor añadido frente a los mencionados con anterioridad. En el caso de los metabuscadores o multibuscadores, son capaces de consultar simultáneamente varios buscadores automáticos y temáticos compilando en un sólo producto los resultados proporcionados por los distintos buscadores individuales. Ejemplos de metabuscadores son: Biwe, Ipselon, Vivisimo, etc. Trataremos con más detalle estos buscadores en el Tema 1.5. Los agentes, por otro lado, permiten realizar un seguimiento de las actualizaciones que se producen en los sitios web o en los resultados de una búsqueda, e incluso pueden informarnos periódicamente de dichas modificaciones mediante nuestro correo electrónico. Algunos ejemplos de agentes son: Tracerlock, Copernic, etc. Trataremos también con más detalle este tipo de buscadores en el Tema 1.5.
Referencias y fuentes[1] Habilidades necesarias para utilizar Internet. Pere Marqués. Departamento de Pedagogía Aplicada, Facultad de Educación, UAB. Encontrar información en el World Wide Web, Serrano Cinca C., Sistemas Informativos Contables Buscar en Internet, Antonio Vicent Towards a Classification-based Approach to Resource Discovery on the Web, Jon Wallis & Peter Burden School of Computing & Information Technology, University of Wolverhampton, UK Wikipedia, la enciclopedia libre. Uso didáctico de Internet. La WebQuest. Víctor R. González y otros. Curso a distancia en www.formacion.educa.jcyl.es
|