Evaluación de Buscadores Web

Recuperación y acceso a la información

Introducción a la evaluación

En esta web se hará una introducción a la evaluación de buscadores web, uno de los principales apartados en el estudio de la recuperación y acceso a la información. La información se dividirá en varias secciones principales.

  • En primer lugar, se expondrá la necesidad de definir un método para la evaluación de los distintos buscadores web.
  • Tras esto se mostrará un método de evaluación de buscadores, en el que se aplicarán los aspectos señalados en el punto anterior.
  • Además, se comentarán los aspectos evaluables de un buscador web.
  • Por último se verá la importancia de la existencia del TREC para la evaluación de buscadores.

evaluacion buscadores

Necesidad de Evaluación

A principio de los 90 el número de páginas publicadas era muy reducido y el acceso a ellas se realizaba de forma directa. En poco tiempo la cantidad de páginas alojadas en el Web se disparó, siendo necesaria la aparición de los buscadores web. Los primeros buscadores consistían en directorios de páginas organizados manualmente, lo cual funcionó mientras Internet albergaba una cantidad moderada de páginas. Tras la explosión del Web, la única forma viable de realizar búsquedas sobre su contenido pasó a ser los motores de búsqueda. Hoy en día existe una gran oferta de buscadores Web, de los cuales sólo unos pocos tienen la potencia y capacidad para satisfacer a los usuarios, por lo que resulta necesario realizar una evaluación de los distintos buscadores.

Evaluación...¿De qué?

La sección actual explicará los factores a tener en cuenta para realizar una correcta evaluación de los distintos buscadores web. Estos se ordenarán por importancia, por lo que los buscadores web deberán realizar un especial esfuerzo en optimizar los primeros. Cuando un buscador web realizar una consulta, suele obtener miles de resultados, pero un usuario medio raramente pasa de los primeros enlaces. Por ello, resulta crítico para cualquier buscador web ofrecer los mejores resultados posibles en las 10 primeras posiciones de cada consulta. La calidad de estos se suele medir mediante los siguientes factores:

  • Número de enlaces relevantes: Indica el número de páginas realmente relacionadas con el tema buscado que aparecen en las primeras posiciones. Las páginas anteriores pueden ser evaluadas otorgándolas un peso según la relevancia de las mismas, sumándose finalmente los pesos de todos los resultados para la evaluación del buscador.
  • Número de enlaces duplicados o muertos: Indica el número de enlaces rotos o duplicados.
  • Número de páginas almacenadas en el buscador: Cuantas más páginas contengan los distintos buscadores en sus bases de datos, mayor probabilidad habrá de contener la página buscada. Por ello resulta una característica importante el número de páginas contenidas en los buscadores web para su evaluación.
  • Rapidez de los resultados: En general, el usuario valora la rapidez con la que el motor de búsqueda obtiene los resultados deseados.
  • Interfaz y accesibilidad a la página de acceso al buscador: En general el acceso se realiza mediante una página Web, pero también resulta común ver barras de búsqueda integradas en navegadores. También resulta importante en el caso del acceso mediante Web la sobriedad y apariencia de la página en la que está alojado el buscador.
  • Servidicios adicionales

Método de Evaluación

En esta sección se expondrá un método para la evaluación de un conjunto de buscadores Web. Para ello se deberán seguir los siguientes pasos:

  • Se escogen los buscadores a evaluar.
  • La evaluación se realizará en base a una batería de consultas. Resulta crítico la elección de las mismas, pues de ellas dependerá el resultado de la evaluación. Se recomienza escoger consultas que abarquen las siguientes posibilidades:
    • Consultas con una única palabra no ambigua.
    • Consultas con varias palabras.
    • Consultas con varias palabras, de las cuales al menos una resulta por sí misma ambigua pero tiene sentido con el resto de la consulta. Por ejemplo la palabra "paris" puede referirse a un nombre de persona o de ciudad, y los resultados deberían depender del resto de palabras de la búsqueda.
  • Realizar las consultas: Se deberá realizar la batería de consultas anterior contra todos los buscadores web sujetos a evaluación.

  • Evaluación de resultados de las consultas:

    Cada páginas recibirá un peso según su relevancia con la consulta realizada.

 

Text REtrieval Conferences (TREC)

   La comunidad internacional, interesada en la optimización de los sistemas de recuperación de la información, ha desarrollado una serie de metodologías exhaustivas para la completa evaluación de la recuperación de documentos en dichos sistemas.

El exponente más conocido de esta serie de metodologías de evaluación de la recuperación son las conferencias TREC promovidas con carácter anual por el National Institute of Standard and Technology de los Estados Unidos.

La introducción de métodos de evaluación de la recuperación a gran escala como TREC ha creado grandes focos de interés en esta tecnología lo cual ha acelerado la investigación en sus diversos campos (incluido la evaluación de buscadores web).

 

Valid CSS!Valid XHTML 1.0 Strict rss validoevaluacion buscadoresevaluacion buscadores web

rss feed foaf feed