1.5
Un paso más:
Metabuscadores y Agentes

Imagen tomada de
www.jegsworks.com


Existe todavía una considerable variedad de formas de buscar en la web, aún sin acudir directamente a un buscador como los que hemos estudiado en los temas anteriores. Introducimos a continuación algunas de ellas.

 

1. Metabuscadores

También denominados multibuscadores, son sistemas de búsqueda que envían las consultas del usuario a un conjunto de varios buscadores automáticos y, en su caso, directorios, bases de datos u otras fuentes de información, y devuelven los resultados que proporcionan todos ellos. La búsqueda múltiple o "metabúsqueda" (a veces también referida como "multibúsqueda" y "superbúsqueda"), permite, entonces, el acceso simultáneo a varios motores de búsqueda introduciendo los criterios de búsqueda una sola vez.

Puesto que es tremendamente difícil catalogar toda la web, la idea subyacente consiste en que la búsqueda simultánea en múltiples motores ofrecerá mejores resultados (en términos de cantidad) con menor esfuerzo. La facilidad de uso y la elevada probabilidad de localización de las páginas deseadas ha convertido a los metabuscadores en muy populares, a pesar de la importante cantidad de resultados irrelevantes que pueden devolver. Otro posible objetivo para el uso de los metabuscadores es localizar al menos algún resultado cuando el uso de un buscador automático en particular no lo ha proporcionado.

Los metabuscadores no cuentan con una base de datos de búsqueda o un directorio propios, sino que crean una "base de datos virtual" compilando en un producto homogéneo los heterogéneos resultados proporcionados por los distintos buscadores individuales.



 

Los distintos metabuscadores difieren bastante entre sí. Algunos sólo utilizan los motores de búsqueda más populares mientras que otros aprovechan también los menos conocidos, buscan en grupos de noticias y en otras bases de datos. También suelen diferir en la  cantidad de motores que usan y en la forma en que presentan sus resultados: unos clasifican los resultados según el motor del que provienen y otros intentando conciliar la relevancia que cada motor concede a sus resultados particulares. Esto beneficia al usuario al eliminar resultados duplicados y agrupar los más relevantes al principio de la lista.

Los metabuscadores se suelen utilizar en portales de búsqueda vertical y para buscar en la denominada web "profunda" (también llamada "invisible" u "oculta"), que se refiere a la parte de contenidos de la web que no están accesibles en primera instancia mediante los navegadores y los sistema de búsqueda habituales.

Algunos de los principales metabuscadores son:

  • Biwe (multibuscador.biwe.com ). Lanza consultas simultáneas en los motores Lycos, Google, AltaVista, Hotbot, Excite y Alltheweb
  • Dogpile (www.dogpile.com ). Combina y clasifica los resultados de tres de los motores de búsqueda más importantes: Google, Yahoo!,Windows Live, Ask y otros. Proporciona un informe con los resultados en cada uno de los buscadores
  • Ipselon (www.ipselon.es ). Combina y clasifica los resultados de tres de los motores de búsqueda más importantes: Google, Yahoo! y Windows Live. Utiliza un servicio denominado "Ipselon Suggest en Español" mediante el cual mientras escribes en el campo de búsqueda, monitoriza lo que estás escribiendo y te ofrece sugerencias en tiempo real. Está basado en la idea de la versión inglesa de Suggest creada por Google.
  • KartOO (www.kartoo.com ). Curioso por su forma de presentar sus resultados: lo hace mediante mapas interactivos (gracias a la utilización de FlashPlayer, disponible en la casi totalidad de navegadores).
  • MetaCrawler (metacrawler.com ) y WebCrawler (webcrawler.com ). Devuelven los resultados más relevantes de Google, Yahoo!, MSN Search, Ask.com, About.com, MIVA, LookSmart y otros. También proporcionan resultados multimedia que incluyen imágenes, audio, video, noticias, e información regional.
  • Todalanet (www.todalanet.net ). Versión española del internacional Ithaki (www.ithaki.net ). Consulta algunos de los mejores buscadores de internet simultáneamente, extrae los resultados más destacados y los ordena por relevancia de palabras en un ranking.
  • Vivísimo (vivisimo.com ). Muestra en primer lugar aquellos servidores que obtienen los mejores resultados en varios buscadores (Wisenut, Open Directory, Ask, ...). Recomendable además por la forma en que presenta los resultados, agrupándolos por conceptos relacionados (clustered results).

En el sitio All Metasearch puedes encontrar (en inglés) una valoración de los distintos sistemas de búsqueda múltiple así como sus características fundamentales (nº de motores que usan, velocidad de respuesta, etc.)

En la siguiente pantalla puedes observar como la página inicial de la mayoría de los metabuscadores, en este caso Ipselon, es sumamente similar a la de un motor de búsqueda simple:


y también sus páginas de resultados:
 


 

En la imagen anterior puedes observar como en el metabuscador Ipselon cada resultado se acompaña debajo por un texto en pequeña tipografía y color gris que indica el buscador en el que ha sido hallado y en qué posición de éste ha sido devuelto. Cuando colocas el ratón (sin pulsar) sobre el vínculo de cada resultado, verás que se despliega una pequeña ventana con una imagen representativa de la página web localizada.

En la figura siguiente puedes observar, sin embargo, que la página de resultados del metabuscador KartOO es diferente. Se trata de un caso especial, pues devuelve los resultados representados en forma "visual", como mapas interactivos. En estos mapas, los sitios encontrados son representados por iconos con forma de página más o menos grande, según su relevancia. Cuando pasas el ratón por encima de estas páginas, una serie de palabras clave relacionadas se iluminan y pulsando en ellas puedes refinar la búsqueda. También aparece una descripción breve del sitio a la izquierda de la pantalla. Cuando pulsas en una página, accedes al sitio correspondiente.
 

 

2. Agentes

Una vez que hemos identificado mediante un buscador un sitio con información y recursos interesantes (una página oficial con normativa, una página personal de alguien que incorpora recursos paulatinamente, etc.) es habitual repetir la búsqueda cada cierto tiempo para comprobar si en dicho sitio hay nuevos recursos o actualizaciones de los existentes, o si existen nuevos sitios de interés. Así, ¿qué hacemos para mantenernos informados de las novedades?, ¿cómo podemos llevar a cabo un seguimiento de dichos sitios? ¿cómo podemos saber si aparecen nuevos sitios de interés? Lo más intuitivo parece acceder periódicamente al sitio y al buscador para comprobar si se han producido novedades. Pero nos encontraremos con el inconveniente de que en bastantes ocasiones accedemos y no ha cambiado nada. Por el contrario, otras veces comprobaremos con disgusto que ha habido alguna novedad y no lo hemos advertido a tiempo. Así pues, parece más eficaz utilizar un sistema inteligente para recibir un aviso cada vez que se modifiquen los resultados de una búsqueda o los contenidos de un sitio mediante, por ejemplo, el envío de un correo electrónico a nuestro buzón. Esta tarea la realizan los denominados agentes de búsqueda, de seguimiento o de monitorización, otras veces también conocidos como espías, soplones o alertas.

El agente de seguimiento web TracerLock (www.tracerlock.com ) puede monitorizar hasta 20 sitios web de tu interés, permitiéndote realizar consultas mediante palabras clave, frases o términos más complejos para localizar cambios en dichos sitios. Puede informarte de una novedad a los 15 minutos de su ocurrencia. En la misma línea, ChangeDetection (www.changedetection.com/monitor.html ) comprueba diariamente si una determinada página web (la que tú elijas) ha cambiado y te informa en tu dirección de correo electrónico. SpyPress (www.spypress.com ) puede enviar a primera hora del día a tu buzón de correo electrónico un resumen de prensa con las noticias que contienen las palabras que decidas, indicar en qué medios realizar la búsqueda, utilizar el buscador para leer las noticias del día, realizar consultas retrospectivas, etc (no se trata de un servicio gratuito aunque sí dispone de un período de prueba gratis).
 

Alertas de Google

Las alertas de Google son mensajes que este buscador te envía automáticamente cuando encuentra nuevos resultados para los términos de búsqueda de tu interés. Actualmente se ofrecen cuatro tipos de alertas:

  • Web: te envía un mensaje si aparecen nuevas páginas web entre los veinte primeros resultados de tu búsqueda en la página de Google
  • Noticias: te envía un mensaje si aparecen nuevos artículos entre los diez primeros resultados de tu consulta en Google Noticias
  • Noticias y Web: te envía un correo electrónico si aparecen nuevas páginas web entre los veinte primeros resultados de una búsqueda de Google o si aparecen nuevos artículos entre los diez primeros resultados de una búsqueda en Google Noticias
  • Grupos: te envía un mensaje si aparecen nuevas entradas en los cincuenta primeros resultados de tu búsqueda en los Grupos de Google.

Para recibir las alertas debes acceder a la página principal de alertas de Google, www.google.com/alerts. En ésta, introduce la consulta y el tipo de resultado (Web, Noticias, ...) que te interesan, la frecuencia con la que deseas que se comprueben los resultados de la consulta y tu dirección de correo electrónico.
 


 

Para finalizar, pulsa en Crear alerta. Google te enviará un mensaje de confirmación (que puede tardar varios minutos y, a veces, horas). Cuando lo recibas y hagas clic en el vínculo de verificar la solicitud de creación de la alerta que se incluye en dicho mensaje, se activará tu servicio de alertas y comenzarás a recibir las novedades con la periodicidad que hayas seleccionado. Puedes crear varias alertas diferentes basadas en distintos términos de búsqueda.
 

 

3. Metabuscadores/agentes de escritorio

También denominados en ocasiones utilidades de metabúsqueda o agentes de escritorio, se trata de programas de búsqueda que pueden ser instalados en un ordenador personal, que combinan varias herramientas avanzadas y permiten al usuario buscar, organizar, analizar y mantenerse al día de la información relevante para él que se encuentra en la web. Podríamos verlos, en primera aproximación, como una combinación inteligente de metabuscadores y agentes que residen en nuestro ordenador y nos proporcionan instrumentos para la búsqueda, organización y seguimiento de la información que nos interesa de la web.

Un agente suele clasificar los motores de búsqueda por categorías según su especialización, de modo que puede determinar aquéllos que resultan más adecuados para resolver una determinada consulta. También puede eliminar los resultados duplicados, verificar y suprimir vínculos rotos, agrupar los resultados según determinados criterios y desplegarlos por orden de relevancia, destacar palabras clave en las listas de resultados y en las páginas Web, descargar los resultados al ordenador del usuarios para su navegación fuera de línea (sin conexión a Internet) y consulta en cualquier momento, y encontrar palabras clave en los resultados mediante operados lógicos. Mantienen un histórico de búsqueda que permite visualizar y manipular los resultados a conveniencia, rastreando los cambios en las páginas y actualizando posteriormente la búsqueda. Suelen incluir también barras de búsqueda rápida y la integración de un menú de enlaces favoritos que pueden ahorrar bastante tiempo. Estos programas suelen presentar algunas funciones que se integran con el sistema operativo del PC y con otras aplicaciones como los navegadores web, los programas de edición de documentos, etc.

Algunos agentes de escritorio típicos son:

  • Copernic Agent (disponible para descarga gratuita de una versión básica en el sitio www.copernic.com )
     
  • SSSpider -Subject Search Spider-(disponible para descarga gratuita de una versión básica en el sitio www.kryltech.com/spider.htm, )
  • Web Ferret (disponible para descarga gratuita de una versión básica en el sitio www.ferretsoft.com )

El Anexo 1 está dedicado a la instalación y aprovechamiento básico del agente Copernic, de modo allí profundizaremos en sus posibilidades.

 

 


Fuentes

Search Toolbars & Utilities, artículo en http://searchenginewatch.com

Centro de asistencia de Google

All Metasearch, guía de metabuscadores en la web

Buscadores genéricos, categoría en http://www.buscopio.net/

Wikipedia, la enciclopedia libre

Encontrar información en el World Wide Web, Serrano Cinca C., "Sistemas Informativos Contables"

Ayuda de WebCrawler
 

Volver a Inicio