Aplicación de las ontologías al ámbito de Big Data

2016 
En los ultimos anos, el area tecnologica de Big Data ha vivido un crecimiento excepcional. Este concepto puede definirse como la gestion, analisis y tratamiento de grandes volumenes de datos mediante diferentes tecnicas, con el objetivo de encontrar patrones que se repiten, siendo esto una valiosa fuente de informacion. Esta informacion se puede usar habitualmente en el ambito empresarial o el marketing; incluso, se trata de una informacion aplicable a ambitos tan dispares como el analisis politico o la investigacion cientifica. Esta informacion es un activo imprescindible para ayudar a las organizaciones a tomar buenas decisiones. Al tratarse de grandes volumenes de datos –en algunos casos, correspondientes a distintas bases de datos-, es necesario aplicar herramientas de analisis y gestion propias, especificas de esta area tecnologica; sin embargo, existen herramientas de representacion y gestion del conocimiento que, convenientemente adaptadas, pueden aplicarse a estos grandes volumenes de datos. Existen algunas herramientas tradicionales ya utilizadas, como la mineria de datos o el analisis de texto; sin embargo, es interesante aplicar otras iniciativas, ya conocidas en el ambito de las Ciencias de la Documentacion, para potenciar y mejorar la capacidad de recuperacion de grandes volumenes de datos. Un ejemplo de estas herramientas son las ontologias: definidas como “una especificacion formal de una conceptualizacion compartida”, han pasado a ser un concepto tradicional propio de la filosofia a herramientas de gestion del conocimiento intimamente relacionadas con las Nuevas Tecnologias e Internet. La aplicacion de las ontologias al ambito de Big Data esta directamente relacionada con la esencia misma de los datos que se manejan: su heterogeneidad. Como se ha explicado, se trata de grandes volumenes de datos, a menudo de diferentes origenes; esto implica una descentralizacion y desorganizacion, que puede repercutir negativamente a la recuperacion de informacion. Existe, por tanto, un paralelismo con la problematica a la que se enfrentan los desarrolladores de ontologias a la hora de establecer la representacion de un dominio: descentralizacion, desorganizacion y falta de estructura. Teniendo en cuenta que las ontologias han demostrado ser muy eficaces para solventar este problema, se considera que la aplicacion de algunos de los principios ontologicos a la recuperacion de la informacion en Big Data puede ser muy beneficiosa. Hay que tener en cuenta que se trata de una aproximacion teorica; es decir, se analizan los diversos aspectos fundamentales del diseno y desarrollo de una ontologia, para observar su posterior aplicacion a los grandes volumenes de datos. Para ello, podemos establecer paralelismos entre conceptos fundamentales de las ontologias y su reflejo desde la perspectiva de recuperacion de la informacion en Big Data. Un ejemplo de ello es el dominio, como se ha dicho. La organizacion fundamental de un dominio –es decir, de un elemento del mundo real- se realiza mediante la division de sus conceptos en clases, es decir, en categorias que comparten unas caracteristicas comunes. Por su parte, otros aspectos fundamentales de las ontologias como las propiedades y las instancias pueden ser el reflejo –desde un punto de vista teorico- de una representacion de un entorno complejo; un ejemplo de ello es la aplicacion de estos principios a la idea del analisis de la informacion relevante del area de Big Data que se este analizando, especialmente en relacion a su uso posterior. Esta informacion, que usualmente estara compuesta por los conceptos propios del “mundo real” que se estudia, puede verse reflejada en el marco teorico de las ontologias como las instancias. De la misma manera, en el caso de las propiedades, se puede aplicar un meta-analisis de los “datos sobre los datos”, es decir, de la informacion utilizada para la definicion, descripcion y delimitacion de la informacion que se ha considerado relevante. En conclusion, podemos ver que la aplicacion de un marco teorico propio de la representacion del conocimiento en el ambito de las ontologias puede ser beneficioso al ambito de Big Data. Por supuesto, al tratarse de un acercamiento teorico, es necesario llevar a cabo un analisis en profundidad tanto desde el punto de vista de la recuperacion de la informacion como desde el punto de vista de la propia arquitectura de Big Data. En consecuencia, el marco ideal para ello seria un trabajo en conjunto de profesionales de estas dos areas, para poder obtener un resultado que aune las ventajas de ambas.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []