Big Data Analytics in der Finanzindustrie

Zurück zum Blog

Die Finanzwelt ist ein dankbares Anwendungsgebiet für Data Engineers und ihre mächtigen Algorithmen: Zahlengetrieben, Prozesse, die seit Dekaden IT-gestützt ablaufen und Unmengen an historischen Daten bereitstellen und ein definiertes Set an KPIs, gegen die die guten von den bösen, die gewinnbringenden von den verlustbehafteten Verträgen unterschieden werden können – schöne Finanzwelt.

Erst ein genauerer Blick in die Datenbanken von Finanzunternehmen offenbart: Da steht ja kaum etwas drin! Natürlich ist da jede Transaktion mit Zeit und Ort, Absender und Empfänger und einer Referenz zum zugrundeliegenden Vertrag erfasst. Aber der Kontext, in dem eine Transaktion stattgefunden hat, ist selten strukturiert beschrieben. Welche Ereignisse könnten zum Ausfall eines Kreditnehmers führen? Welche politischen Entwicklungen in Asien können die Lieferkette eines Versicherungsnehmers in Europa gefährden? Welche Kosten verursacht der 6-stündige Ausfall eines irischen Rechenzentrums?

Tatsächlich liegen die Informationen, die zur Beantwortung solcher Fragen benötigt werden, regelmäßig bei Banken und Versicherungen vor. Kaum ein größeres Kreditrisiko, das nicht in ausgiebigen Gutachten fundiert bewertet wurde, kaum ein Industrierisiko, das nicht von Ingenieuren vor dem Abschluss eines Versicherungsvertrags besichtigt und im Detail beschrieben worden wäre. Nur fließen aus diesen Beschreibungen allzu oft nur die Daten in die Sammlung strukturierter Informationen, die sich auf bereits bekannte Key Performance Indikatoren abbilden lassen. Das Gros der Informationen in solchen Gutachterberichten wird hingegen kaum einmal gelesen, sondern lediglich ordnungsgemäß archiviert.

Und bei genauerem Hinsehen enthalten schon diese Expertenberichte nur Bruchteile der Informationen, die zur Einschätzung von Kredit-, Versicherungs- oder Vertragsrisiken herangezogen werden könnten. Pressemitteilungen, Nachrichten in sozialen Medien, Lokal- und Wirtschaftsnachrichten, Mitteilungen von Aufsichtsbehörden, Statements von NGOs oder auch – gerne unterschätzt – die Wettervorhersage stellen viel mehr Informationen zu Finanzrisiken bereit, als einzelne Experten in ihren Gutachten berücksichtigen könnten. Und das regelmäßig frei Haus und in Echtzeit. Warum nutzen wir diese Informationen nicht, um Risiken besser zu bewerten, Gefahren früher zu erkennen und auf Schäden schneller zu reagieren?

Die Antwort darauf ist denkbar einfach: Weil das erst einmal Arbeit macht!

KI ist in aller Munde. Und der Diskurs, der in Politik und Feuilletons über die Macht künstlicher Intelligenz geführt wird, weckt geradezu den Eindruck, als müssten wir einfach nur die gewünschten Datenquellen aufzählen, auf einen Knopf drücken und warten, bis aussagekräftige Reports und – bei Bedarf – eine Warnung direkt auf dem Bildschirm des zuständigen Entscheiders generiert werden. Besser noch: Die Maschine selbst trifft ohne menschliches Eingreifen die richtige Entscheidung.

Das wäre schön und, ja, da wollen wir hin. Aber da sind wir nicht. Niemand bietet heute ein Standardsoftwareprodukt an, das ohne weiteren Aufwand ein Risikogutachten von einem Schadenbericht unterscheiden, aus dem Volltext eines Schadenberichts eine klassifizierte Liste der Schadenursachen extrahieren oder aus dem Risikogutachten die Eintrittswahrscheinlichkeit aller genannten Gefahren benennen könnte.

Geht das also alles gar nicht? – Doch, natürlich geht das. Die Daten sind da, die Technologien sind da und auch das Wissen, wie wir die Technologien auf die Daten anwenden müssen. Was noch fehlt, sind all die Wissensmodelle, Trainingsdaten und linguistischen Regeln, um die richtigen Informationen zu erkennen, zuverlässig zu extrahieren und in den richtigen Analysen bereitzustellen. Und dazu eine Portion Realismus: Ein Text verwandelt sich nicht in eine fehlerfreie Datenbank, wenn man ihn einfach durch einen Klassifikator schickt – so einfach ist es nicht. Im Gegenzug: selbst Informationen, die in Texten gar nicht explizit benannt sind, lassen sich erkennen. Die Frage, ob sich etwas realisieren lässt ist meistens keine der Informationstheorie, sondern eine an das Verhältnis von Kosten und Nutzen.