Service of machine learning in streaming: supervised learning – decision tree

2020 
Hoy en dia, los datos son el bien intangible mas valioso para las empresas y organizaciones, debido a, que sobre ellos apoyan la toma de sus decisiones, mismas decisiones que son el factor diferenciador con respecto a su competencia o mantenerse a la vanguardia en el mercado, es por ello, que de la capacidad de explotacion de estos datos dependera la calidad y valia de la informacion que se pueda obtener, por consiguiente, aplicar tecnicas de machine learning sobre los datos, permitiran generar modelos que ayuden a dichas empresas y organizaciones a predecir el comportamiento de su negocio. Por otra parte debido al actual y creciente volumen de informacion que generan el conjunto de dispositivos, sistemas y aplicaciones que se pueden interconectar (Big Data), la capacidad de computo de toda esa informacion se vuelve un verdadero desafio, y si, a eso le anadimos la premisa de que dichas empresas y organizaciones requieren tomar sus decisiones en el menor tiempo posible, esta cada vez mas latente la demanda de procesar esa gran cantidad de informacion en tiempo real (Streaming). Finalmente, el uso cada vez mayor de internet y el cloud computing originan que las arquitecturas orientadas a servicios tengan una mayor adopcion para implementar los sistemas, debido a su capacidad de desacoplamiento y escalabilidad, asi como la facilidad de integracion entre sistemas con arquitecturas heterogeneas. Son estos aspectos, lo que motivan este trabajo de fin de master, que propone el desarrollo y despliegue de una API REST de machine learning de aprendizaje supervisado, basado en arboles de decision, que permita entrenar un modelo predictivo sobre un especifico dominio de datos, y tenga la capacidad de predecir sobre nuevos datos del mismo dominio en tiempo real. Esta API REST pretende impulsar el desarrollo de nuevas aplicaciones inteligentes para empresas, organizaciones e incluso usuarios finales, facilitando el procesamiento, el analisis de grandes volumenes de informacion y la integracion con sistemas externos. Tambien busca impulsar el machine learning hacia el paradigma de los servicios.---ABSTRACT---Today, data is the most valuable intangible asset for companies and organizations, due to the fact that they support decision-making on them, the same decisions that are the differentiating factor with respect to their competition or staying ahead in the market, that is why the quality and value of information that can be obtained will depend on the capacity to exploit this data, therefore applying machine learning techniques to the data will allow the generation of models that help these companies and organizations to predict the behaviour of your business. On the other hand, due to the current and growing volume of information generated by the set of devices, systems and applications that can be interconnected (Big Data), the computing capacity of all that information becomes a real challenge, and if, we add the premise that these companies and organization need to make their decisions in the shortest possible time, the demand to process this large amount of information in real time (Streaming) is increasingly latent. Finally, the increasing use of the internet and cloud computing mean that service-oriented architectures have a greater adoption to implement systems, due to their decoupling capacity and scalability, as well as the ease of integration between systems with heterogeneous architectures. It is these aspects that motivate this master’s thesis, which proposes the development and deployment of a supervised learning machine learning REST API, based on decision trees, that allows training a predictive model on a specific data domain, and have the ability to predict new data from the same domain in real time. This REST API aims to drive the development of new smart applications for companies, organizations and even end users, facilitating the processing, the analysis of large volumes of information and integration with external systems. It also seeks to push machine learning towards the services paradigm.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []