Découvrabilité et réutilisation de données produites par des workflows : un cas d'usage en génomique.

2021 
Les systemes de workflows ont largement contribue a ameliorer la reproductibilite des experiences scientifiques. Cependant, relativement peu de travaux ont porte sur la reutilisation des donnees produites au cours de l’execution. Dans cet article, nous faisons l’hypothese que ces donnees intermediaires doivent etre considerees comme des objets de premier ordre, qui doivent etre conserves et publies. Non seulement cela permettra d’economiser des ressources de calcul et de stockage, mais surtout cela facilitera et accelerera l’evaluation de nouvelles hypotheses. Pour aider les scientifiques a annoter ces donnees, nous exploitons plusieurs sources d’information : i) les informations de provenance capturees lors de l’execution des workflows, et ii) les annotations de domaine qui sont fournies par des catalogues semantiques d’outils, tels que Bio.Tools. Finalement, nous montrons, sur un scenario reel de bioinformatique, comment des graphes de provenance peuvent etre transformes et resumes, a destination des utilisateurs et des machines.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []