Studio di associazione Genome Wide: Preprocessing e Selezione SNPs

2011 
Gli studi di associazione intervengono nello studio di dataset casi/controllo caratterizzati da un’importante mole di dati (tipicamente il numero di soggetti per classe e dell’ordine delle migliaia e il numero di variabili, i polimorfismi a singolo nucleotide, nell’ordine di 108 ) .E necessario operare una riduzione del numero di variabili iniziali per poter classificare. Dopo un’ analisi dello stato dell’arte, e dopo l’osservazione dei limiti principali dovuti essenzialmente alla feature selection e alla riduzione di informazione che ne consegue, in questa tesi si propone un nuovo approccio basato sulla definizione di mutua informazione per la definizione di metavariabili, da utilizzarsi poi nella classificazione. La metodologia viene applicata con successo su due distinti dataset, isolando in prima battuta il pathway dell’insulina e procedendo alla classificazione. L’applicazione del metodo nella sua completezza prevede la costruzione di un classificatore aggregato dei singoli classificatori costruiti su diversi pathway biologici
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []