1.1
¿Dónde localizar la información
que necesito?
Buscadores, Portales, ...

Imagen tomada de
www.virtbiz.com


La World Wide Web (Web o WWW), el servicio más famoso que ofrece la red Internet y el método más eficaz, desde cierto punto de vista, para difundir información, es un conglomerado mundial de informaciones copiosas y bastante desorganizadas. Cuando intentamos localizar algo… ¿Por donde empezamos? Por una parte existen los portales web especializados, sitios de la web dedicados cada uno de ellos a un tema en particular (por ejemplo, a Educación), que clasifican la información y acotan el ámbito de búsqueda de forma adecuada al tema específico de que se trate. Por otra, están los habitualmente denominados buscadores o, en general, los sistemas de búsqueda, que nos ayudan cuando necesitamos encontrar algo que no se halla necesariamente en un portal especializado. Gracias a ellos contamos con un salvavidas para no naufragar cuando navegamos por los agitados mares de la información.

Las utilidades de búsqueda, y hoy día existe un enorme abanico de ellas, están a nuestra disposición para facilitar el acceso a la información que necesitamos siempre, claro está, que sepamos como utilizarlas y aprovechar en profundidad sus mecanismos. Son muchos los usuarios que emplean habitualmente las utilidades de búsqueda, pero la mayoría de los navegantes desconocen la funcionalidad de algunas de ellos. Como cita Pere Marqués [1]:

«Para poder aprovechar las posibilidades educativas de Internet, son necesarias unas habilidades básicas, algunas de las cuales requieren un largo período de aprendizaje que conviene empezar en la escuela a edad temprana. Además de una buena predisposición y capacidad para el autoaprendizaje, y de los imprescindibles conocimientos instrumentales sobre el sistema operativo y los editores de textos, destacamos las siguientes habilidades y conocimientos:

- Saber utilizar (y configurar) las principales herramientas de Internet ...

............

- Saber aprovechar las fuentes informativas de Internet

- Diagnosticar cuándo es necesaria una información. Definir lo que se necesita: ¿qué busco?, ¿para qué lo necesito?. Determinar la información que se precisa buscar e identificar los conceptos clave relacionados y el área de conocimiento a la que pertenece. Acotar la búsqueda lo más posible.

- Saber encontrar la información que se busca y recuperarla con agilidad: ¿dónde lo busco?, ¿cómo?

............

- Conocer y saber utilizar los programas buscadores (motores de búsqueda y directorios, generales y temáticos), bibliotecas, bases de datos y webs especializadas.

- Realizar búsquedas por palabras y utilizando operadores booleanos y de proximidad.

............»
 

Este texto nos ofrece algunas de las claves de las que nos ocuparemos en este curso. Seguramente ya conoces bastantes de los conceptos que trataremos. No obstante, conviene hacer una compilación inicial para fijar algunos conceptos, profundizar o formalizar otros, y establecer un vocabulario común para posterior uso.

 

1. Buscadores y portales

Imagen tomada de
www.sbi-secureit.com

En el lenguaje informático un buscador es una herramienta que permite al usuario localizar un documento que contiene una determinada palabra u oración o, en general, una determinada información (puede también tratarse de imágenes, objetos multimedia, etc.). Los buscadores son sistemas, que residen normalmente en una página web, tales que cuando les solicitamos información sobre algún tema, la buscan en la red Internet. Muchos de ellos buscan únicamente en la Web, pero otros buscan además en otros servicios de difusión e intercambio de información de Internet, como Noticias, Grupos, etc. La búsqueda se lleva a cabo definiendo de alguna manera la información que deseamos localizar y el resultado de dicha búsqueda consiste normalmente en un listado de direcciones web en las que se encuentran temas relacionados con las palabras clave especificadas.

En primera aproximación podemos encontrar buscadores de dos tipos:

  • Directorios o Índices temáticos: son sistemas de búsqueda por temas o categorías jerárquicas. Se trata de bases de datos de direcciones Web elaboradas "manualmente", a partir de búsquedas no automatizadas y/o a partir de avisos dados por los creadores de páginas web. Es decir, hay personas que se encargan de clasificar y asignar cada página web a una categoría o tema determinado.
  • Motores de búsqueda: se basan en el uso de palabras clave (o términos de búsqueda), es decir, las palabras o frases que mejor describen los conceptos o ideas que necesitamos localizar. Se trata de grandes bases de datos de páginas web construidas mediante sistemas automáticos de rastreo de la red.

Gracias a los buscadores, resulta más fácil moverse a través de la red y encontrar los contenidos que más nos interesen y que por lo tanto nos resulten útiles.

¿Un buscador y un portal, son lo mismo? No exactamente. La filosofía de los llamados portales web consiste en aglutinar en un solo sitio web todos los servicios que el internauta puede necesitar, con el fin de acaparar el máximo de visitas posibles y ser así la "puerta de entrada" a Internet del máximo número de usuarios. Muchos sistemas de búsqueda iniciaron su andadura como simple buscador y han terminado convirtiéndose en portales que incluyen un buscador (incluso en sus dos versiones: directorio y motor) entre sus servicios. Los portales genéricos suelen ofrecer, entre otras cosas: noticias, juegos, cuentas de correo electrónico, foros, chat y, como decimos, un buscador. Los portales especializados, por otra parte, se centran en ofrecer información específica relativa a un determinado determinado tema. Podríamos decir que un portal suele incluir un buscador pero que un buscador no responde necesariamente a la idea de un portal.

En esta primera unidad didáctica nos dedicaremos sobre todo al estudio y aprovechamiento de los buscadores, mientras que en las unidades 2 y 3 nos centraremos principalmente en los portales dedicados a Educación y Legislación educativa.

 

2. Un poco de historia

Es conveniente presentar, al menos, algunos de los hitos esenciales en la evolución de las utilidades de búsqueda en Internet, ya que nos ponen en contacto con algunos de los conceptos básicos relacionados con el tema, así como con la denominación de varios de los principales sistemas de búsqueda de entre la gran variedad que existe actualmente. Ello nos facilitará los términos que manejaremos en los próximos apartados y capítulos.

La primera utilidad para buscar en Internet fue Archie. El nombre proviene de la palabra Archive (archivo) sin la "v". Fue creada en 1990 por Alan Emtage, un estudiante de la Universidad McGill de Montreal. Este programa descargaba las listas de carpetas de archivos ubicados en servidores públicos FTP (File Transfer Protocol, se trata de un protocolo de transmisión de archivos entre ordenadores, al igual que HTTP, Hipertext Transfer Protocol, se trata de un protocolo de transmisión de páginas web entre ordenadores) y creaba una base de datos de nombres en la que se podían buscar archivos. Sin embargo, Archie no podía buscar en los contenidos de los archivos.

Mientras que Archie indexaba los nombres de archivo (esto es, ordenaba los nombres mediante la elaboración de índices de consulta), Gopher indexaba los contenidos de los documentos de texto plano (aquéllos que incluyen texto puro, sin caracteres especiales ni formato alguno). Gopher fue creado en 1991 por Mark McCahill en la Universidad de Minnesota. Puesto que trataba archivos de texto, la mayor parte de sitios Gopher en Internet se convirtieron en sitios web tras la creación de la World Wide Web (ya que las páginas web son archivos de texto puro, aunque determinadas partes del texto se interpretan como etiquetas que ordenan a los navegadores dar cierto formato al contenido cuando éste se visualiza en ellos). Otros dos programas posteriores, Veronica y Jughead buscaban los archivos almacenados en los sistemas de índice Gopher proporcionando un sistema de búsqueda mediante palabras clave en las listas Gopher.

El primer sistema de búsqueda en la Web fue Wandex, ahora extinto, desarrollado en el MIT (Instituto Tecnológico de Massachussets) en 1993. Otro aparecido también en 1993, Aliweb, todavía opera hoy día. El primer rastreador de "texto completo" fue WebCrawler, aparecido en 1994. A diferencia de sus predecesores permitía buscar cualquier palabra en cualquier página web y se convirtió desde ese momento en el estándar para la mayor parte de sistemas de búsqueda y en el más conocido por el público. También en 1994 surgió Lycos, de la Universidad Carnegie Mellon, que constituyó un gran esfuerzo comercial.

 

Cronología
Año Sistema
1993

Aliweb

1994

WebCrawler

Infoseek

Lycos

Yahoo

1995

AltaVista

Excite

1996

Dogpile

Inktomi

Ask Jeeves

1997

Northern Light

1998

Google

1999

Alltheweb

Teoma

Vivisimo

2000

Baidu

2003

Info.com

2004

Yahoo! Search

2005

MSN Search

Ask.com

2006

Quaero

Windows Live Search

2007

Wikiseek

Aparición cronológica de algunos de los principales sistemas de búsqueda
 

Poco después aparecieron varias utilidades de búsqueda que ganaron bastante popularidad: Excite, Infoseek, Inktomi, Northern Light y Altavista. De alguna manera competían con directorios populares como Yahoo!. Éste fue creado en 1994 por dos estudiantes graduados de Stanford como una lista de otros sitios web, organizada jerárquicamente, al contrario que los índices de búsqueda de páginas. En un principio la lista no era demasiado extensa pero, cuando fue creciendo, sus autores debieron dividirla en categorías, luego subcategorías y así sucesivamente, dando lugar al concepto de directorio web. Después, los directorios integraron o añadieron la tecnología de los motores de búsqueda para aumentar su funcionalidad (como hizo Yahoo a partir de 2002 tras adquirir otra compañías como Inktomi o AltaVista e integrar sus tecnologías combinadas).

A finales de los años 90 los sistemas de búsqueda entraron en la categoría de estrellas de Internet. Varias compañías comerciales entraron de forma espectacular en el mercado, obteniendo record de ganancias en la Bolsa. Algunas de ellas, más tarde, han dejado su sistema de búsqueda para dedicarse sólo a temas de mercadotecnia empresarial.

En 1998 se lanza Google y en torno a 2001 alcanza gran relevancia. Su éxito se basó, en parte, en el concepto de popularidad de enlaces y páginas. Tiene en cuenta el número de páginas web y de sitios web que enlazan a una determinada página para determinar la "bondad", la "popularidad" o lo deseable que puede resultar ésta para los usuarios. Así, Google ordena los resultados de una búsqueda en función de cuántos sitios web enlazan con dicha página (aunque también aplica más de 150 criterios para determinar la relevancia de la misma). Por otra parte, la minimalista interfaz de usuario de Google se hizo popular entre los usuarios y fue después adoptada por otros. En la actualidad Google es quizá el más popular sistema de búsqueda.

El mercado chino de búsqueda en Internet no experimentó una fuerte expansión hasta la introducción de Baindu en 2000, un sistema que permite el empleo de los caracteres de escritura china (hanzi) en lugar de utilizar el alfabeto occidental.

De los grandes sistemas de búsqueda, el de más reciente aparición es MSN Search de Microsoft. En 2004 debutó con su versión de prueba que utilizaba su propio rastreador web, denominado msnbot. Antes, esta compañía utilizaba los sistemas de búsqueda de otros. En 2006 Microsoft migró este sistema a una nueva plataforma de búsqueda: Windows Live Search.

Ask.com, antes Ask Jeeves -aparecido en 1996-, fue el primer sistema comercial de búsqueda de respuestas en la web. La idea original de éste fue posibilitar a los usuarios conseguir repuestas a preguntas formuladas en lenguaje natural, es decir, prácticamente en el mismo lenguaje que utilizamos en la comunicación humana. Tras la aparición de Google Ask perdió relevancia hasta que integró también sistemas de búsqueda mediante palabras clave. En 2006 se convirtió en el cuarto mayor sistema de búsqueda del mundo.

 

3. Modelos de búsqueda

Imagen tomada de
www.exitlow.com

En el apartado Buscadores y Portales hemos visto que, a grandes rasgos, los sistemas de búsqueda se polarizan en uno de dos modelos: el índice temático y el motor de búsqueda. Vamos ahora a establecer una clasificación más general y también más precisa que nos permitirá entonces entender con qué diferentes clases de utilidades contamos cuando pretendemos localizar información en Internet.

Podemos clasificar los buscadores desde diversos puntos de vista:

  1. Según el procedimiento de recopilación y clasificación de la información, tenemos:
    1. buscadores automáticos
    2. buscadores temáticos
    3. buscadores mixtos
  2. Según la finalidad de la búsqueda:
    1. buscadores genéricos
    2. buscadores especializados o verticales
  3. Otros: metabuscadores y agentes

Expondremos sólo ahora las características básicas de estos buscadores y los estudiaremos con más detenimiento en los próximos temas.

 

Buscadores automáticos

También denominados motores de búsqueda (search engine), robots de búsqueda (web robot, internet bot o, simplemente, bot) o arañas (spiders), la mayoría de los grandes buscadores internacionales que todos usamos y conocemos son de este tipo. Requieren muchos recursos para su funcionamiento. Recorren automáticamente, sin la intervención de operadores humanos, las páginas web recopilando información sobre los contenidos de las mismas. Cuando buscamos una información en ellos consultan su base de datos, y nos presentan los resultados clasificados normalmente por su relevancia. De los distintos sitios web, los buscadores pueden almacenar desde sólo la página de entrada, a todas las páginas que contienen. Si buscamos una palabra clave, por ejemplo, “legislación”, en los resultados que nos ofrecen aparecerán páginas que contengan esta palabra en alguna parte de su texto. Si consideran que una web es importante para el usuario, tienden a registrarlas todas. Si no la consideran importante, sólo almacenan una o pocas páginas. Cada cierto tiempo, los motores revisan las webs, para actualizar los contenidos de su base de datos, por lo que a veces los resultados de la búsqueda no están totalmente actualizados.

Ejemplos de motores de búsqueda son: Google, Altavista, Windows Live Search, Infoseek, etc. Trataremos con mucho más detalle estos buscadores en el Tema 1.2 y en el Tema 1.3.

 

Buscadores temáticos

También denominados índices o directorios temáticos. A diferencia de los motores, en los directorios las páginas web son revisadas por operadores humanos y clasificadas según categorías, de forma que es más fácil encontrar sitios del tema de nuestro interés. Más que buscar información sobre los contenidos de un sitio web en función de palabras clave, los resultados se presentan haciendo referencia a la temática de los contenidos de dicho sitio. Los motores de búsqueda,  puesto que operan de forma automática, "contienen" normalmente más información que los directorios.

En resumen, podemos imaginar a un buscador como una base de datos similar a la que nosotros utilizamos para cualquier propósito, y sobre la que se pueden realizar búsquedas. Lo que diferencia a motores y directorios es la forma de incorporar la información a dicha base de datos y de clasificarla.

Ejemplos de directorios son: Yahoo, The Open Directory, Trovator, etc. Trataremos con más detalle estos buscadores en el Tema 1.4.

 

Buscadores mixtos

Son aquéllos que incorporan las capacidades tanto de buscadores automáticos como temáticos. A día de hoy muchos buscadores usan los dos sistemas indistintamente, de hecho, los buenos directorios combinan ambos sistemas. Tanto Google como Yahoo, por ejemplo, lo hacen.

 

Buscadores genéricos

Son aquéllos que permiten buscar información de cualquier tipo, no sólo relacionada con algún tema determinado. Los buscadores automáticos y temáticos que hemos nombrado en los párrafos anteriores son también buscadores genéricos.

 

Buscadores especializados

Los buscadores especializados o verticales envían sus arañas a un conjunto determinado de sitios y sus bases de datos contienen información depurada acerca de un tema concreto. Como consecuencia, son más valiosos que los genéricos para los usuarios con interés en una determinada materia y, por tanto, tienen una audiencia muy específica. Así, existen buscadores verticales para medicina, ciencia, educación, viajes, compañías comerciales, buscadores de trabajo, etc.

Estos buscadores devuelven resultados más precisos, más rápidamente y mediante la realización de consultas más simples que las que se necesitarían en los genéricos. Proporcionan contenidos relevantes y esenciales frente a los amplios y poco definidos que proporcionan los genéricos (de ahí la idea de verticalidad, como sinónimo de refinamiento y definición, contrapuesta a la idea de amplitud y poca definición).

Un ejemplo de buscador especializado es Scirus, dedicado a la búsqueda en millones páginas web dedicadas a Ciencia. Y puedes encontrar buscadores especializados en distintas áreas temáticas y en distintas áreas geográficas en el directorio Buscopio.

 

Otros buscadores: Metabuscadores y Agentes

Nos referimos ahora a buscadores que proporcionan un valor añadido frente a los mencionados con anterioridad. En el caso de los metabuscadores o multibuscadores, son capaces de consultar simultáneamente varios buscadores automáticos y temáticos compilando en un sólo producto los resultados proporcionados por los distintos buscadores individuales.

Ejemplos de metabuscadores son: Biwe, Ipselon, Vivisimo, etc. Trataremos con más detalle estos buscadores en el Tema 1.5.

Los agentes, por otro lado, permiten realizar un seguimiento de las actualizaciones que se producen en los sitios web o en los resultados de una búsqueda, e incluso pueden informarnos periódicamente de dichas modificaciones mediante nuestro correo electrónico.

Algunos ejemplos de agentes son: Tracerlock, Copernic, etc. Trataremos también con más detalle este tipo de buscadores en el Tema 1.5.

 

 


Referencias y fuentes

[1] Habilidades necesarias para utilizar Internet. Pere Marqués. Departamento de Pedagogía Aplicada, Facultad de Educación, UAB.

Encontrar información en el World Wide Web, Serrano Cinca C., Sistemas Informativos Contables

Buscar en Internet, Antonio Vicent

Towards a Classification-based Approach to Resource Discovery on the Web, Jon Wallis & Peter Burden School of Computing & Information Technology, University of Wolverhampton, UK

Wikipedia, la enciclopedia libre.

Uso didáctico de Internet. La WebQuest. Víctor R. González y otros. Curso a distancia en www.formacion.educa.jcyl.es

 

Volver a Inicio