Modelo predictivo que analice cuales son las zonas con mayor índice de peligrosidad en la ciudad de Guayaquil y a partir de esta información predecir qué sectores en desarrollo tendrán el mismo nivel de delincuencia.

 

Authors
Flores Asinc, Miguel Alfonso
Format
BachelorThesis
Status
publishedVersion
Description

En el presente proyecto de investigación contiene el diseño de un modelo predictivo que analice las zonas con mayor índice de peligrosidad en la ciudad de Guayaquil y con esta información predecir qué sectores en desarrollo tendrán un aumento de delincuencia usando la minería de datos y algoritmos de aprendizaje de máquina. Este modelado se lo hará con el uso de herramientas de programación con las que se podrá limpiar los datos, procesarlos y aplicando aprendizaje supervisado junto con algoritmos de regresión y random forest y así de esta manera entrenar el modelo y poder predecir valores futuros de la delincuencia en las diferentes zonas de Guayaquil y poder ser visualizados en una herramienta de visualización de datos. Todo el proceso desde la recopilación de datos hasta el análisis de los resultados obtenidos forma parte de las etapas de la metodología de minería de datos KDD o Knowlede Discovery in Databases. Los objetivos del proyecto de investigación constan de recopilar y analizar variables que describan a un sector como peligroso, diseño propio del modelo predictivo y la valoración de las predicciones obtenidas tras la creación del modelo. Por último, el proyecto concluye con la visualización de los algoritmos de regresión en una herramienta de visualización que presente las zonas que puedan convertirse en peligrosas en un futuro.
This research project contains the design of a predictive model that analyzes the areas with the highest index of danger in the city of Guayaquil and with this information predict which developing sectors will have an increase in crime using data mining and machine learning algorithms. This modeling will be done with the use of programming tools that will be used to clean the data, process it and apply supervised learning algorithms like linear regression and ramdom forest to train the model and predict future values of crime in different areas of Guayaquil and be able to be visualized in a data visualization software. The whole process from data collection to the analysis of the results obtained is part of the stages of the KDD or Knowlede Discovery in Databases (KDD) data mining methodology. The objectives of the research project consist of collecting and analyzing variables that describe a sector as dangerous, the design of the predictive model itself and the assessment of the predictions obtained after the creation of the model. Finally, the project concludes with the visualization of the regression algorithms in a visualization software that presents the areas that may become dangerous in the future.

Publication Year
2023
Language
spa
Topic
MINERÍA DE DATOS
ALGORITMOS DE REGRESIÓN
MODELOS PREDICTIVOS
PROGRAMACIÓN INFORMÁTICA
KDD
Repository
Repositorio Universidad Católica de Santiago de Guayaquil
Get full text
http://repositorio.ucsg.edu.ec/handle/3317/20850
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-sa/4.0/