Aplicación de la regresión polinomial para la caracterización de la curva del COVID-19, mediante técnicas de machine learning

2020 
espanolObjetivo: Caracterizar el comportamiento de las curvas de casos, muertes y personas recuperadas por el COVID-19 en Colombia, en esta investigacion se propuso como aporte el uso del enfoque de regresion polinomial para el modelar el comportamiento de los datos. Metodologia: Se obtuvieron los datos a partir de los reportes proporcionados por el Ministerio de Salud de Colombia. En primera instancia, se estudio el procedimiento empleado para la obtencion de la regresion polinomial mediante la regresion lineal multiple, en segunda instancia, se diseno e implemento una herramienta para la aplicacion del procedimiento estudiado sobre el conjunto de datos recolectado, y finalmente, se realizo el analisis de los resultados. Resultados: Se obtuvo para los tres estudios considerados (casos, muertes y personas recuperadas) 20 polinomios en conjunto con el error medio cuadratico (RMSE) y el nivel de determinacion (R2) asociados a cada uno. Asi mismo, se obtuvo un conjunto de predicciones basadas en las regresiones lineales obtenidas para cada estudio. Conclusiones: La volatilidad de los polinomios con valores futuros, las ecuaciones polinomicas son mas utiles para evaluar el comportamiento de la curva del COVID-19 hasta el dia de captura de los datos, it means, pueden ser usadas para determinar el impacto de las medidas gubernamentales en un periodo determinado de tiempo. Igualmente, las librerias de machine learning provistas por el lenguaje Python, demostraron ser de gran apoyo a la estimacion de la regresion polinomial. EnglishObjective: This research study proposes the use of the polynomial regression approach to model data behavior for characterizing behavior patterns for COVID-19 case, death, and recovery curves in Colombia. Methodology: Data were obtained from the reports provided by the Colombian Ministry of Health. First, the authors assessed the polynomial regression procedure through multiple linear regressions. Then, a tool was designed and implemented for applying this procedure on the collected dataset. Finally, the corresponding results were assessed. Results: For the three studies considered (cases, deaths, and recoveries), 20 polynomials were obtained together with the root mean square error (RMSE) and the determination level (R2) associated with each study. Further, a set of predictions was generated based on the linear regressions obtained for each study. Conclusions: Because polynomials with future values are volatile, polynomial equations have proven more useful when assessing COVID-19 curves up to the data capture date. Therefore, they can be used to determine the impact of government measures over a given period of time. In addition, the machine learning libraries provided in Python language significantly supported the estimation of polynomial regressions.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []