Exploiting rateless coding in structured overlays to achieve persistent storage

2012 
L'importante augmentation de la quantite d'informations sur Internet a contribue a une forte demande pour un stockage persistant des donnees. Les architectures centralisees de stockage de donnees sont financierement onereuses, faiblement evolutives et vulnerables aux attaques car elles constituent un point unique de defaillance du systeme. Ces dernieres annees, les architectures pair-a-pair ont merge comme une alternative pour la mise en place d'une architecture de stockage persistant des donnees. Les systemes pair-a-pair sont fondamentalement evolutifs et moins chers que les modeles client-serveur. Cependant, pour construire des systemes de stockage persistant en utilisant le modele pair-a-pair, deux defis fondamentaux doivent etre abordes. I) Faire face a la dynamique des pairs, en raison de leur connectivite transitoire. Ii) Reduire l'impact du comportement malicieux des pairs. La replication est une technique regulierement utilisee pour faire face a la connectivite transitoire des systemes de stockage pair-a-pair. Toutefois, selon le ratio d'arrivees et de departs des pairs dans le systeme, cette technique presente un impact negatif en termes de stockage et de bande passante. Les reseaux pair-a-pair qui offrent la tolerance aux fautes byzantins, font generalement l'hypothese que seulement une fraction limitee des pairs dans le systeme sont des pairs de comportements malveillants. Toutefois, l'estimation de la proportion de pairs malveillants dans un systeme pair-a-pair est une operation peu fiable. Ainsi, creer une architecture qui fournit le stockage persistant de donnees fiables et qui permet de faire face a tous ces problemes est une contribution souhaitable. Dans cette these, nous proposons Datacube. Datacube est une architecture pair-a-pair de stockage de donnees scalable et efficace qui fournit un stockage persistant en utilisant un schema de redondance hybride sur un reseau overlay structure basee sur des clusters. Le schema de redondance hybride propose par Datacube assure la persistance et l'integrite des donnees garantissant une forte resilience aux arrivees et departs de pairs meme en presence de pairs malveillants. Datacube repose sur les proprietes des codes fontaines pour mettre en place son schema de redondance hybride. Les valuations analytiques ont montre que Datacube est notamment performant en termes de disponibilite, de surcharge de stockage et de bande passante. Nous avons aussi effectue des evaluations pratiques concernant les performances de deux types de codes fontaines dans le contexte de systemes de stockage pair-a-pair. Ces evaluations ont aide a comprendre l'impact des parametres de codage sur les performances de Datacube. A notre connaissance, ceci est la premiere etude complete qui permet aux developpeurs d'applications de trouver les valeurs des parametres de codage adaptes au contexte des reseaux pair-a-pair.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    20
    References
    0
    Citations
    NaN
    KQI
    []