banner2.jpg

Prof. Dr. Ulrich Müller-Funk

Statistische Ziffernanalyse basiert zum einen auf einem theoretischen Modell zur Beschreibung des Normfalles („Nichtbetrug“) –etwa der Benford-Verteilung für die ersten Ziffern. Zum anderen erfordert diese ein Verfahren zur Erfassung etwaiger Diskrepanzen zwischen diesem Normfall und real beobachteten Ziffernhäufigkeiten. Typischerweise wird hier der Chi-2-Anpassungstest herangezogen, der auf dem zentralen Grenzwertsatz beruht. Dieser asymptotische Ansatz erfordert daher Daten, die (approximativ) unabhängig und identisch verteilt sind und keine nur spärlich besetzten Zellen aufweisen. Derartige Annahmen sind in diversen Anwendungsfällen nicht gegeben, wie in einigen Publikationen auch bereits angemerkt wurde. Wünschenswert ist daher eine nicht-asymptotische Alternative zum Chi-2-Ansatz. Hierzu soll nun ein Klassifikationsverfahren vorgestellt werden, dass auf der “receiver operating characteristic“ beruht.