Accélération par pré-agrégations des accès complexes et répétitifs aux Big Data

2018 
Contexte: L’humanite produit des quantites de donnees numerisees dans des proportions et avec un rythme sans commune mesure avec le passe. Ces masses de donnees,designees communement comme Big Data, sont entreposees dans des clusters de stockage ou les donnees sont plus ou moins structurees. Ces masses de donnees sont ensuite exploitees par des analystes (((data scientists))) qui utilisent des chaines complexes de traitements, afin d’extraire les phenomenes contenus dans les masses de donnees. Ces traitements consistent a explorer les donnees, les classifier suivant des approches supervisees, semi-supervisees ou encore non supervisees. Par exemple, les donnees radars dans l’aviation civile sont stockees sous forme binaire par traces radars reconstituees. Un acces repetitif consiste a extraire toutes les trajectoires dans une fenetre spatio-temporelle de l’espace aerien 3D. Un tel traitement reclame de nombreux acces aux donnees brutes pour constituer une reponse. L’aspect repetitif est induit notamment lorsque plusieurs requetes demandent des calculs elementaires communs repetes sur les donnees brutes. Par exemple, calculer le nombre de trajectoires par semaine dans une fenetre de l’espace aerien revient a agreger 7 calculs de trajectoires quotidiennes.
    • Correction
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []