# UC7004317

Minería de Texto y Minería web de los Perfiles y Publicaciones de una Afiliación en Google Scholar para procesamiento estadístico de textos.


2016 - 2017


Terminada

Extraer los datos del perfil de GS de la Universidad Tecnológica de Panamá (UTP) para medir el factor de impacto de sus publicaciones a través del índice H de cada Investigador y la cantidad de citaciones de los perfiles de las Revistas UTP en GS.



Para obtener los datos de GS se desea extraer la información de un sitio web utilizando “Web Scraping” o “Raspado de páginas web”, para ello evaluaremos diferentes métodos de Web Scraping para extraer datos de los perfiles y Publicaciones de Googles Scholar. A través de estos métodos queremos realizar una comparación de extracción de datos y desarrollar e implementar un Algoritmo para extraer todos los datos de los perfiles, publicaciones por Afiliación, de una forma más rápida, eficiente y estructurada, tomando en cuenta de que actualmente no existe un paquete que pueda extraer estos datos en GS, queremos comparar con otros métodos de Web Scraping y la velocidad de extracción de datos de 15 diferentes perfiles de Universidades.



Tecnologías de la Información y Comunicaciones

Tecnología de Información y Comunicación


Investigación y Desarrollo (I+D)

Panamá


VIPE

Investigadores