Algorithmus zeigt Betrug bei Musik-Verkaufszahlen
Archivmeldung vom 19.07.2018
Bitte beachten Sie, dass die Meldung den Stand der Dinge zum Zeitpunkt ihrer Veröffentlichung am 19.07.2018 wiedergibt. Eventuelle in der Zwischenzeit veränderte Sachverhalte bleiben daher unberücksichtigt.
Freigeschaltet durch Thorsten SchmittForscher der Technischen Universität Wien (TU Wien) haben ein Statistik-Modell in Form eines Algorithmus entwickelt, das Betrügereien bei den Verkaufszahlen von im Internet vertriebenen Musikstücken mit hoher Zuverlässigkeit aufdeckt. Damit soll die Musikbranche transparenter und fairer werden. Denn bisher mussten sich Musiklabels und Bands darauf verlassen, dass die großen Musikplattformen die richtigen Zahlen weitergeben und korrekte Honorare überweisen - ein Streit, der die Musikindustrie seit Jahren beschäftigt.
100 Mio. Beobachtungen analysiert
Um korrekt zu ermitteln, wie oft Musiktitel auf großen internationalen Plattformen wie iTunes, Spotify oder YouTube angeklickt werden, haben die Wissenschaftler aus Wien mit der Musikvertriebs-Firma Rebeat Innovation zusammengearbeitet. Für das zu entwickelnde Betrugsbekämpfungs-Tool wurden riesige Datensätze mit über 100 Mio. Einzelbeobachtungen aus der Musikbranche analysiert.
Die Labels bekamen schon bisher Abrechnungen, wie viel Umsatz wann gemacht wurde. Ob das stimmte, ließ sich kaum kontrollieren. "Natürlich kann man sich den zeitlichen Verlauf der Verkaufszahlen ansehen, und beobachten, ob es Auffälligkeiten gibt. Aber das nützt wenig. Wir haben festgestellt, dass die entscheidende Information im relativen Verhältnis zwischen den Verkaufszahlen der einzelnen Anbieter liegt", erläutert TU-Wien-Statistikerin Nermina Mumic.
System hat Trefferquote von 92 Prozent
Wenn sich ein Lied auf einer Online-Plattform doppelt so häufig verkauft wie auf einer anderen, so die Expertin, dann wird sich dieses Verhältnis typischerweise nicht abrupt ändern. Die Verkaufszahlen entwickeln sich näherungsweise parallel - kometenhaft steigende Klickzahlen auf YouTube sollten normalerweise auch mit rasant steigenden Downloadraten auf itunes einhergehen. Alles andere sei verdächtig.
"Aber das alleine genügt auch noch nicht", sagt Mumic. "Die Sache ist noch komplizierter: Es gibt wöchentliche oder monatliche Schwankungen, die ganz normal sind." Das Statistikmodell muss also die üblichen Schwankungen von betrügerischen Datenschummeleien unterscheiden. "Wenn man die Daten mit bloßem Auge untersucht, findet man auf den ersten Blick viele merkwürdige Auffälligkeiten, aber viele von ihnen sind ganz normal. Um statistisch erklärbare Unregelmäßigkeiten von echten Fehlern oder Betrügereien zu unterscheiden, benötigt man statistische Werkzeuge, die es bisher in dieser Form noch nicht gab."
Um die neuen statistischen Werkzeuge zu testen, wurden manche der Originaldaten aus der Musikindustrie probeweise manipuliert. "Unsere Software hat über 92 Prozent der Manipulationen aufgedeckt", freut sich Mumic und ergänzt: "Das ist eine extrem gute Quote, und wir glauben, sie noch weiter verbessern zu können." Die einzige Möglichkeit, die Software zuverlässig zu überlisten, wäre eine Absprache zwischen allen Musik-Anbietern weltweit, sämtliche Daten auf genau abgestimmte Weise zu fälschen - und das sei extrem unrealistisch.
Quelle: www.pressetext.com/Florian Fügemann