Uso de minería de datos para acelerar la recuperación de documentos

Ryckeboer, Hugo Emilio Julio Ludovico; Blanco, Gabriel Esteban; Spósitto, Osvaldo Mario; Procopio, Gastón Emanuel; Prilusky, Elisa Mirta; Matteo, Lorena Romina; Macias Corral, Patricio Ezequiel; Gargano, Cecilia Victoria; Casuscelli, Mauro Javier; Bossero, Julio César

Por favor, use este identificador para citar o enlazar este ítem: http://repositoriocyt.unlam.edu.ar/handle/123456789/1972

Autor(es):	Ryckeboer, Hugo Emilio Julio Ludovico Blanco, Gabriel Esteban Spósitto, Osvaldo Mario Procopio, Gastón Emanuel Prilusky, Elisa Mirta Matteo, Lorena Romina Macias Corral, Patricio Ezequiel Gargano, Cecilia Victoria Casuscelli, Mauro Javier Bossero, Julio César
Título:	Uso de minería de datos para acelerar la recuperación de documentos
Director(es):	Ryckeboer, Hugo Emilio Julio Ludovico Blanco, Gabriel Esteban
Descriptores y temas:	SISTEMAS DE INFORMACION ANALISIS DE DATOS RECOPILACION DE DATOS
Editor:	Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas
Referencia sugerida:	Ryckeboer, H. E. J. L., Blanco, G. E., Spósitto, O. M., Procopio, G. E., Prilusky, E. M., Matteo, L. R., Macias Corral, P. E., Gragano, C. V., Casuscelli, M. J. y Bossero, J. C. (2018). Uso de minería de datos para acelerar la recuperación de documentos (Informe C-205). Universidad Nacional de La Matanza. http://repositoriocyt.unlam.edu.ar/handle/123456789/1972
Resumen y filiaciones:	El objetivo de este proyecto se basó en construir una alternativa innovadora, basada en algoritmos de clasificación, para realizar la búsqueda de documentos relevantes en un tiempo menor de respuesta. Siguiendo los procesos de un sistema de recuperación de información (SRI), los documentos de un corpus son transformados en vectores descriptivos. Una consulta de usuario es también convertida en otro vector descriptivo. Para obtener un documento que satisfaga la necesidad de información del usuario, el vector de la consulta se debe enfrentar con todo el corpus, en búsqueda de similitudes. Este proceso genera un índice de relevancia, que ordenará la lista de documentos sugeridos que recibe el usuario. En este trabajo se analiza la posibilidad de fraccionar un corpus de modo tal de reducir la cantidad de documentos a comparar. Para ello, se requiere de dos procesos preparatorios: a) uno que particione el corpus utilizando una noción de vecindad o similitud y b) el entrenamiento de un algoritmo de clasificación que direccione la consulta hacia la parte más promisoria. Ambos servicios los estudia y provee la minería de datos (MD). Luego por cada consulta se deben ejecutar dos pasos: a) aplicar el algoritmo que direcciona la consulta hacia una de las partes, para b) enfrentar la consulta con cada documento de esa parte para determinar su grado de adecuación y posterior posición en la lista de documentos sugeridos. Los números obtenidos en las simulaciones del primer año fueron promisorios, lo que incentiva seguir investigando para obtener indicadores aún mejores. La cantidad de ideas que fueron generadas es de no acabar. Destacando algunas ideas que deberían contribuir a lograrlo: decidir por cada consulta la conveniencia de explorar o no los documentos de la franja marginal de los particionados, recurrir a varios particionados para reducir el problema de frontera. Fil: Ryckeboer, Hugo Emilio Julio Ludovico. Universidad Nacional de La Matanza; Argentina. Fil: Blanco, Gabriel Esteban. Universidad Nacional de La Matanza; Argentina. Fil: Spósitto, Osvaldo Mario. Universidad Nacional de La Matanza; Argentina. Fil: Procopio, Gastón Emanuel. Universidad Nacional de La Matanza; Argentina. Fil: Prilusky, Elisa Mirta. Universidad Nacional de La Matanza; Argentina. Fil: Matteo, Lorena Romina. Universidad Nacional de La Matanza; Argentina. Fil: Macias Corral, Patricio Ezequiel. Universidad Nacional de La Matanza; Argentina. Fil: Gargano, Cecilia Victoria. Universidad Nacional de La Matanza; Argentina. Fil: Casuscelli, Mauro Javier. Universidad Nacional de La Matanza; Argentina. Fil: Bossero, Julio César. Universidad Nacional de La Matanza; Argentina.
URI:	http://repositoriocyt.unlam.edu.ar/handle/123456789/1972
Otros identificadores:	https://ror.org/01bmj8t37
Aparece en las colecciones:	Investigaciones

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
Uso de minería de datos para acelerar la recuperación de documentos.pdf		1.34 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro Dublin Core completo del ítem