Enhancing robustness and sparsity via mathematical optimization

2016 
espanolEsta tesis se centra en derivar metodos robustos o dispersos bajo la perspectiva de la optimizacion para problemas que tradicionalmente se engloban en los campos de la Estadistica o de la Investigacion Operativa. Concretamente, el objetivo de esta tesis doctoral es fusionar tecnicas de optimizacion con conceptos estadisticos para desarrollar metodologias innovadorass que puedan mejorar a los metodos ya existentes y que aunen las matematicas teoricas con los problemas de la vida real. Por una parte, los metodos robustos propuestos facilitaran un nuevo enfoque sobre el modelado y la interpretacion de problemas clasicos del area de la Investigacion Operativa, produciendo soluciones que sean resistentes a varios tipos de incertidumbre. Por otra parte, las estrategias dispersas desarrolladas para resolver problemas notorios del area de Estadistica tendran forma de Problemas No Lineales Mixtos (es decir, problemas de optimizacion con algunas variables enteras o binarias y funcion objetivo no lineal, denotados MINLP a partir de ahora). Se mostrara que los metodos propuestos no solamente son manejables computacionalmente, sino que ademas realzan la interpretabilidad y obtienen una buena calidad de prediccion. Especificamente, el Capitulo 1 se centra en descubrir causalidades potenciales en series temporales multivariantes. Esto se lleva a cabo formulando el problema como un MINLP donde las restricciones modelan distintos aspectos de la dispersion, incluyendo restricciones que no permiten la aparicion de relaciones espureas en el modelo. El metodo muestra un buen rendimiento en terminos de poder de prediccion y de recuperacion del modelo original. Analogamente, el objetivo del Capitulo 2 es descubrir cuales son los predictores relevantes en un problema de regresion lineal, sin llevar a cabo tests de significacion ya que estos pueden fallar si existe multicolinealidad. Para ello, se formulan MINLPs que restringen los metodos de estimacion seleccionados, anadiendo restricciones que miden la importancia de los predictores y que estan disenadas para evitar los problemas que produce la multicolinearidad en los datos. Los modelos restringidos muestran un buen equilibrio entre interpretabilidad y precision. Por otra parte, en el Capitulo 3 se generaliza el problema clasico del vendedor de periodicos, asumiendo demandas correladas. En particular, una estrategia de inventario robusta, donde no se asumen hipotesis distribucionales sobre la demanda, se formula como un problema de optimizacion. Para el modelado de dicho problema se hace uso de tecnicas que ligan conceptos estadisticos con conjuntos de incertidumbre. Las soluciones obtenidas son robustas ante la presencia de ruido con alta variabilidad en los datos, mientras evitan el exceso de conservadurismo. En el Capitulo 4 se extiende esta formulacion para series temporales multivariantes. El escenario es, ademas, mas complejo: no solamente se busca fijar los niveles de produccion, sino que se quiere determinar la localizacion de instalaciones y la asignacion de clientes a las mismas. Empiricamente se muestra que, para disenar una cadena de suministros eficiente, es importante tener en cuenta la correlacion y la variabilidad de los datos multivariantes, desarrollando tecnicas basadas en los datos que hagan uso de metodos de prediccion robustos. Un examen mas exhaustivo de las caracteristicas especificas del problema y de los conjuntos de incertidumbre se lleva a cabo en el Capitulo 5, donde se estudia el problema de seleccion de portfolios con costes de transaccion. En este capitulo se obtienen resultados teoricos que relacionan los costes de transaccion con diferentes maneras de proteccion ante la incertidumbre de los retornos. Como consecuencia, los resultados numericos muestran que calibrar la penalizacion de los costes de transaccion produce resultados que son resistentes a los errores de estimacion. EnglishThis thesis is focused on deriving robust or sparse approaches under an optimization perspective for problems that have traditionally fell into the Operations Research or the Statisics fields. In particular, the aim of this Ph.D. dissertation is to merge optimization techniques with statistical concepts, leading to novel methods that may outperform the classic approaches and bridge theoretical mathematics with real life problems. On one hand, the proposed robust approaches will provide new insights into the modelling and interpretation of classic problems in the Operations Research area, yielding solutions that are resilient to uncertainty of various kinds. On the other hand, the sparse approaches derived to address some up-to-the-minute topics in Statistics will take the form of Mixed Integer Non-Linear Programs (i.e. optimization problems with some integer or binary variables and non linear objective function, denoted as MINLP thereafter). The proposed methods will be shown to be computationally tractable and to enhance interpretability while attaining a good predictive quality. More specifically, Chapter 1 is focused on discovering potential causalities in multivariate time series. This is undertaken by formulating the estimation problem as a MINLP in which the constraints model different aspects of the sparsity, including constraints that do not allow spurious relationships to appear. The method shows a good performance in terms of forecasting power and recovery of the original model. Analogously, in Chapter 2 the aim is to discover the relevant predictors in a linear regression context without carrying out significance tests, since they may fail in the presence of strong collinearity. To this aim, the preferred estimation method is tightened, deriving MINLPs in which the constraints measure the significance of the predictors and are designed to avoid collinearity issues. The tightened approaches attain a good trade-off between interpretability and accuracy. In contrast, in Chapter 3 the classic newsvendor problem is generalized by assuming correlated demands. In particular, a robust inventory approach with distribution-free autoregressive demand is formulated as an optimization problem, using techniques that merge statistical concepts with uncertainty sets. The obtained solutions are robust against the presence of noises with high variability in the data while avoiding overconservativeness. In Chapter 4 this formulation is extended to multivariate time series in a more complex setting, where decisions over the location-allocation of facilities and their production levels are sought. Empirically, we illustrate that, in order to design an efficient supply chain or to improve an existent one, it is important to take into account the correlation and variability of the multivariate data, developing data-driven techniques which make use of robust forecasting methods. A closer examination of the specific characteristics of the problem and the uncertainty sets is undertaken in Chapter 5, where the portfolio selection problem with transaction costs is considered. In this chapter, theoretical results that relate transaction costs with different ways of protection against uncertainty of the returns are derived. As a consequence, the numerical experiments show that calibrating the transaction costs term yields to results that are resilient to estimation error.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []