Motores de búsqueda
Search Engine Coverage of the OAI-PMH Corpus
Autores: Frank McCown, Xiaoming Liu, Michael L. Nelson y Mohammed Zubair
Autores: Frank McCown, Xiaoming Liu, Michael L. Nelson y Mohammed Zubair
IEEE Internet Computing, March/April 2006, Vol. 10, No. 2, pp. 66-73.
El informe técnico está disponible en http://library.lanl.gov/cgi-bin/getfile?LA-UR-05-9158.pdf
El informe técnico está disponible en http://library.lanl.gov/cgi-bin/getfile?LA-UR-05-9158.pdf
Resumen:
Tras indizar la mayor parte de la web «superficial», ahora los motores de búsqueda utilizan distintas aproximaciones para indizar la web «profunda». Al mismo tiempo, los repositorios institucionales y las bibliotecas digitales han adoptado la Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) para exponer sus resultados.
Los autores recopilaron cerca de 10 millones de archivos de los repositorios OAI-PMH. A partir de ellos extrajeron 3,3 millones de URL únicas y luego emprendieron búsquedas, a partir de muestras de este universo, para determinar cuál de los tres motores utilizados, pudo indizar más páginas.


