Por favor, use este identificador para citar o enlazar este ítem: http://repositoriocyt.unlam.edu.ar/handle/123456789/575
Autor(es): Ryckeboer, Hugo Emilio
Spossito, Osvaldo Mario
Gargano, Cecilia Victoria
Prilusky, Elisa Mirta
Barone, Miriam Andrea Teresa
Procopio, Gastón Emanuel
Quintana, Fabio Hernán
Título: Optimización de la recuperación de documentos, usando como técnica base el LSI (Lematización Semántica Latente)
Director(es): Ryckeboer, Hugo Emilio
Spositto, Osvaldo Mario
Descriptores y temas: INDEXACION
ESTRATEGIAS DE BUSQUEDA
RECUPERACION DE LA INFORMACION
Editor: Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas
Referencia sugerida: Ryckeboer, H, E., Spositto, O. M., Gargano, C. V., Prilusky, E. M., Barone, M. A. T., Procopio, G. E., Quintana, F. H. (2016). Optimización de la recuperación de documentos, usando como técnica base el LSI (Lematización Semántica Latente) [Archivo PDF]. San Justo: Universidad Nacional de La Matanza. Recuperado de http://repositoriocyt.unlam.edu.ar/handle/123456789/575
Resumen y filiaciones: Al evaluar los logros de las distintas etapas, que se realizaron durante la investigación precedente (2013-2014), surgieron ideas de mejora que, en bien de no demorar el objetivo de tener un prototipo, fueron recogidas, y no evaluadas durante el proyecto anterior pasando al presente. Contando con un sistema funcionando, es sencillo sustituir componentes y ver si con ello se obtienen mejoras. A continuación, se señalan los avances de las 3 observaciones heredadas, que fueron las inquietudes centrales de este proyecto. 1- La lematización del idioma español disponible no daba resultados satisfactorios. En esta etapa se demuestra su mejora a realizar el procesamiento más rápido que la forma secuencial, se aceleró notablemente sin afectar la exhaustividad y relevancia. 2- Dada la posibilidad de extender la selección de documentos a corpus muy voluminosos, existen diversas ideas de subdividir el corpus en Grupos aplicando técnicas de Agrupamiento (Clustering), de modo tal de disminuir el espacio de búsqueda cuando se procesa una consulta. En este proyecto se incorporaron estas tecnologías a nuestro prototipo, con la intención de evaluar mejoras, pero se deberá reflexionar en un nuevo proyecto sobre la utilización conjunta de SVD (Descomposición en Valores Singulares) y agrupamiento. 3- Los sistemas que operan en gran escala deben recurrir necesariamente al uso en paralelo de varios procesadores. Se estudió la forma de paralelizar algunos algoritmos para acelerar adecuadamente los cómputos, demostrando que la mejora arroja resultados muy positivos, los tiempos bajan drásticamente. Se logró distribuir en placas de video, pero esto abren nuevos interrogantes que son motivos de nuevos proyectos.
Fil: Ryckeboer, Hugo Emilio. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Spositto, Osvaldo Mario. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Gargano, Cecilia Victoria. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Prilusky, Elisa Mirta. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Barone, Miriam Andrea Teresa. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Procopio, Gastón Emanuel. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Quintana, Fabio Hernán. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
URI: http://repositoriocyt.unlam.edu.ar/handle/123456789/575
Aparece en las colecciones: Investigaciones



Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.