Aplicación de la metodología CRISP-DM a la recolección y análisis de datos georreferenciados desde Twitter
Application of the CRISP-DM methodology to recollection and analysis of georreferenced data from Twitter
Citación
Fecha
2018-12-18Autor
García Vélez, Gustavo Adolfo
Título obtenido
Especialista en Geomática
Publicador
Universidad Militar Nueva Granada
Palabras claves
; mineria de datos; sistemas de recoleccion automatica de datos
Metadatos
Mostrar el registro completo del ítem
Documentos PDF
Resumen
La minería de datos es actualmente una de las áreas con mayor auge y éxito dentro de la informática, al permitir encontrar correlaciones y patrones a partir del análisis de grandes volúmenes de datos. En este sentido, la Geomática es fundamental si los datos se encuentran georreferenciados, aportando el componente espacial del análisis. Una metodología ampliamente utilizada en el desarrollo de proyectos de minería de datos es la denominada CRISP-DM®, compuesta de seis etapas (comprensión del negocio, comprensión de los datos, preparación de los datos, modelado, evaluación e implementación), la cual se emplea para el análisis de información georreferenciada proveniente de la red social Twitter®, con el fin de hallar patrones que permitan responder preguntas como: ¿en dónde se generan más trinos geolocalizados en la ciudad de Bogotá? ¿Cuáles son los sectores catastrales de Bogotá en donde sería más probable encontrar un tweet georreferenciado?
Data mining is currently one of the most successful areas in informatics since it allows finding correlations and patterns from analysis of big data. In that sense, Geomatics is fundamental as long as data is georeferenced, by giving the spatial component of the analysis. CRISP-DM® is a widely-used methodology in data mining with six basic steps: business understanding, data understanding, data preparation, modeling, evaluation and deployment, which will be used for analysis of geolocated data from Twitter® social network in order to find patterns and answer questions such as: In what places of Bogotá more georreferenced tweets are generated? In which cadastral sectors is likely to find a located tweet?
Colecciones
- Geomática [318]