Statistische Analyse mittels Softwarefehler-Datenbanken unter Berücksichtigung von fehlenden Werten

2015 
Im Rahmen der Softwareentwicklung ist die Verwaltung von Fehlermeldungen von zentraler Bedeutung. Die Meldungen werden in Form von Fehlertickets in einer Datenbank erfasst. Im Idealfall enthalt ein Fehlerticket eine detaillierte Beschreibung hinsichtlich der Nachvollziehbarkeit einer Fehlerkonstellation. Jedoch weisen Fehlertickets in der Realitat deutliche Schwankungen in ihrer Qualitat auf. Um eine Aussage uber die Korrekturdauer von Fehlertickets treffen zu konnen, ist es erforderlich, den Aufwand zu schatzen. Die am haufigsten hierfur eingesetzte Methode ist die Expertenschatzung. Alternativ lasst sich die Schatzung des Aufwands mit einem statistischen Modell ermitteln. Zugleich ist es somit moglich, die Einflussfaktoren auf die Effizienz des Bearbeitungsprozesses zu bestimmen. Mit den daraus gewonnen Erkenntnissen konnen die Erfasser von Fehlertickets dahingehend geschult werden, Tickets moglichst vollstandig auszufullen. Eine Voraussetzung der meisten empirischen Methoden zur Analyse eines Datensatzes ist, dass die zu untersuchenden Daten vollstandig sind. Dies ist bei einer Fehlerdatenbank nicht zwingend gegeben. In erster Linie fehlen Werte bei neu erfassten Fehlertickets, wenn bei Nicht-Pflichtfeldern kein Wert eingetragen ist. Zusatzlich konnen fehlende Werte durch fehlerhafte Werte in Pflichtfeldern entstehen. In der vorliegenden Arbeit wird der Einfluss von Ticket-Eigenschaften einer Fehlerdatenbank einer Closed-Source-Software auf die Effizienz des Ticket-Bearbeitungsprozesses analysiert. Zudem werden Ticket-Anderungen und ein Wechsel im Vorgehensmodell zur Softwareentwicklung und dessen Einfluss auf die Effizienz des Ticket-Bearbeitungsprozesses untersucht. Daruber hinaus werden in einer Simulationsstudie funf unterschiedliche Techniken zum Umgang mit fehlenden Werten verglichen. Es werden drei verschiedene Mechanismen, die zu fehlenden Werten fuhren, und deren Auswirkungen auf die Ergebnisse analysiert. In der Simulationsstudie werden Anteile von 10 %, 20 %, 30 % und 40 % an fehlenden Werten berucksichtigt. Mithilfe der Simulationsstudie soll geklart werden, welche Erganzungsmethode fur einen Datensatz aus einer Fehlerdatenbank die beste Eignung aufweist und ab welchem Anteil an fehlenden Werten eine Erganzung uberhaupt sinnvoll ist.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []