Nachrichten in Frühwarnsystemen und dem Kreditrisikomanagement

Abbildung 1: Anzahl an Nachrichten pro Tag über den Beobachtungszeitraum Quelle: Dr. F. Graf/T. Dobrikov

Dr. Ferdinand Graf und Todor Dobrikov, beide d-fine GmbH, Frankfurt am Main - Textbasierte Informationen haben dank technischen Rahmenbedingungen stark an Bedeutung gewonnen: Mobile Endgeräte, Soziale Netzwerke und Messaging-Dienste erlauben schnelle Publikation und Verbreitung der aktuellen Informationen, unter anderem zu den Themen Unternehmen und Finanzmärkte. Die Integration dieser Informationen in das Risikomanagement und die Marketing- und Vertriebsprozesse der Finanzinstitute sind erste logische Schritte, die der gestiegenen Bedeutung Rechnung tragen. Im Folgenden beschreiben die Autoren eine moderne Methode um unstrukturierte, textbasierte Informationen (kurz: Nachrichten) systematisch in die Adressrisikoüberwachung einzubinden. Damit sollen einerseits die Qualität und die Effizienz der Adressrisikoüberwachung gesteigert und andererseits die zumeist manuellen Prozesse unterstützt werden. Ziel des Ansatzes ist es außerdem, Nachrichten direkt in ein Ratingverfahren oder Frühwarnsystem zu integrieren. (Red.)

Für die Kreditrisikomessung in Segmenten mit sehr wenigen Ausfallereignissen wie zum Beispiel große Unternehmen, Staaten oder Banken haben qualitative Informationen, die sich oft aus der aktuellen Nachrichtenlage ableiten, eine große Bedeutung. Die Nachrichtenlage wird in vielen Instituten aber zumeist nicht systematisch in die entsprechenden Prozesse eingebunden und stattdessen von Analysten individuell bewertet. Dies verursacht hohen Aufwand um die Nachrichtenlage konsistent über die Zeit und verschiedene Analysten hinweg zu bewerten. Außerdem ist nicht sichergestellt, dass die relevanten Daten und Entscheidungen ausreichend transparent dokumentiert werden. Entsprechend ist eine objektive und kohärente Bewertung oft nicht gegeben.

Vier Kennzahlen für jede Nachricht

Der folgende Ansatz zur Auswertung von Nachrichten basiert zum einen auf Wortlisten für die Wortkategorien positive, negative, strong und weak und zum anderen auf dem Vergleich einer Nachricht mit zuvor veröffentlichten Nachrichten. So werden unternehmensspezifisch vier Kennzahlen für jede Nachricht berechnet, namentlich Sentiment, Commitment, Information und Relevance berechnet, die anschließend zu einem Gesamtsignal kombiniert werden.

Der Ansatz bedarf zudem keiner Kalibrierung, die immer die Gefahren birgt erstens sehr rechenintensiv zu sein und zweitens auf Daten, die nicht in der Kalibrierung verwendet wurden, deutlich schlechtere Ergebnisse zu liefern.

Die Leistungsfähigkeit des Ansatzes wird auf Basis von englischsprachigen Nachrichten von Reuters und Bloomberg im Zeitraum 2007 bis 2014 durch zum Industriestandard gehörende Regressionsanalysen demonstriert. Die quantitativen Ergebnisse belegen einen statistisch signifikanten Zusammenhang zwischen den Unternehmensbeurteilungen der führenden Ratingagenturen Fitch, Moody's und S&P und den nach dem Ansatz ausgewerteten Nachrichten.

Der Ansatz kann aber auch herangezogen werden, um erstens frühzeitig maßgebliche Informationen über Schuldner und potenzielle Neukunden aus internen oder öffentlichen Informationsquellen zu beschaffen und hinsichtlich ihres Geschäftspotenzials systematisch zu analysieren, oder zweitens um Handelsstrategien für ein aktives Portfoliomanagement zu entwickeln.

Die Datengrundlage umfasst acht Jahre. In der Analyse werden Nachrichten von Reuters im Zeitraum 1. Januar 2007 bis 31. Dezember 2014 betrachtet sowie Nachrichten von Bloomberg für den Zeitraum 1. Januar 2010 bis 31. Dezember 2014, die über das jeweilige Onlinearchiv verfügbar sind. Obwohl es weitere namenhafte Nachrichtenagenturen gibt, werden diese beiden Quellen als repräsentativ erachtet. Die Analyse basiert auf etwa 6,5 Millionen Nachrichten, von denen rund 5,5 Millionen aus dem Reuters-Archiv stammen und die übrigen aus dem Bloomberg-Archiv. Die Nachrichten verteilen sich hinreichend gleichmäßig über den Betrachtungszeitraum. Für Werktage liegen im Schnitt rund 3000 Nachrichten vor (Abbildung 1).

Für den Zeitraum 1. Januar 2007 bis 31. Dezember 2014 werden zudem Long-Term Foreign Currency Ratings der Ratingagenturen Moody's, Standard & Poors und Fitch für insgesamt 449 Unternehmen im S&P500 Index betrachtet. Darüber hinaus werden Bilanzkennzahlen und Aktienrenditen dieser Unternehmen als Kontrollvariablen herangezogen.

Methodischer Ansatz: individuell gewichtete Worte

In dem Ansatz erhalten die Worte einer Nachricht ein individuelles und unternehmensspezifisches Gewicht in dem kontinuierlichen Wertebereich 0 bis 1. Dieses ergibt sich erstens aus der kleinsten Anzahl an Worten zwischen dem betrachteten Wort und dem vorrausgehenden oder nachfolgenden Namen des betrachteten Unternehmens (oder eines Synonyms), und zweitens aus der Anzahl an Worten zwischen dem betrachteten Wort und dem Anfang der Nachricht. Dabei gilt, je größer die Anzahl an Worten ist, desto kleiner ist das Gewicht des Wortes in der Analyse. So wird zum einen der Tatsache Rechnung getragen, dass dieselbe Textpassage für unterschiedliche Unternehmen eine unterschiedliche Bedeutung haben kann, und zum anderen, dass die Bedeutung einer Textpassage am Beginn einer Nachricht größer ist als am Ende einer Nachricht.

Sentiment über positive und negative Worte gemessen

Anschließend werden ausschließlich Worte betrachtet, die - unter Zuhilfenahme des Porter-Stemmers1) - den Wortkategorien positive, negative, strong und weak des General Inquirer (GI, siehe Tetlock, 2007) oder selbigen Wortlisten von Loughran und McDonald's Financial Sentiment Dictionary (FS, siehe Loughran und McDonald, 2011) zugeordnet werden können. Für jede Nachricht, jedes Unternehmen und jede der vier Wortkategorien eines Lexikons wird dann die Summe der Wortgewichte berechnet und anhand der gesamten Anzahl an Worten in der Nachricht standardisiert. Basierend auf den standardisierten Summen der Wortgewichte in den Kategorien positive und negative wird die Kennzahl Sentiment für eine Nachricht und ein Unternehmen berechnet. Die Kennzahl hat den kontinuierlichen Wertebereich minus 1 bis 1, wobei die Ausprägung minus 1 bedeutet, dass mehr negative Worte und weniger positive Worte in der Nähe des Unternehmensnamens verwendet wurden als im Artikelsdurchschnitt. Ein Wert von 1 bedeutet, dass im Mittel mehr positive Worte und weniger negative Worte verwendet wurden. Werte, die betragsmäßig kleiner 1 sind, bedeuten, dass im Mittel sowohl mehr positive als auch negative Worte verwendet wurden, beziehungsweise sowohl weniger positive als auch negative Worte. Das Vorzeichen zeigt dann an, welcher Effekt dominiert.

Über die Kategorien strong und weak wird die Kennzahl Commitment für eine Nachricht und ein Unternehmen bestimmt. Werden zum Beispiel viele Konjunktiv- Konstruktionen in einer Nachricht verwendet, ist die Kategorie weak tendenziell höher frequentiert als die Kategorie strong. Da dann über einen eher unsicheren Sachverhalt berichtet wurde, ist es auch wahrscheinlich, dass sowohl bei klar positivem als auch bei negativem Sentiment die Auswirkungen der Nachricht für das Unternehmen eher gering sind. Diese Kennzahl hat den kontinuierlichen Wertebereich 0 bis 1, wobei die Ausprägung 0 bedeutet, dass im Mittel mehr schwache und weniger starke Worte verwendet wurden und vice versa.

Die Kennzahl Relevance einer Nachricht für ein Unternehmen ergibt sich aus der Häufigkeit und der Position des Unternehmensnamens. Je häufiger und je näher am Beginn der Nachricht das Unternehmen genannt wird, desto höher ist die Relevanz der Nachricht für das Unternehmen. Der Wertebereich ist auf das Intervall 0 bis 1 festgelegt.

Nachrichten können mit nur leichten Änderungen im Vergleich zu bereits zeitnah publizierten Nachrichten veröffentlicht werden. Die Auswirkungen solcher Nachrichten sollten gering sein, da ihr Informationsgehalt gering ist. Daher wird jede Nachricht mit allen Nachrichten über das betrachtete Unternehmen verglichen, die bis zu 120 Minuten vor dem Publikationszeitpunkt der betrachteten Nachricht veröffentlicht wurden. Die Kennzahl Information wird anschließend über die ähnlichste Nachricht innerhalb des Zeitfensters definiert und hat den Wertebereich 0 bis 1, wobei die Ausprägung 0 bedeutet, dass bereits eine identische Nachricht innerhalb des Zeitfensters publiziert wurde.

Aggregation zu einem Signal

Die obigen vier Kennzahlen werden multiplikativ zu einem Signal kombiniert. Dessen Vorzeichen wird einzig von der Kennzahl Sentiment bestimmt, alle Kennzahlen können das Signal auf den Wert 0 setzen. Für ein starkes Signal müssen alle Kennzahlen deutlich von 0 verschieden sein. Die Signale aller Nachrichten zu einem Unternehmen über einem Zeitraum werden zu einen aggregierten Signal verdichtet. Hierbei wird verhindert, dass das Signal basierend auf Nachrichten ohne Informationsgehalt aufgrund von Spekulationen oder durch Wiederholung zu 0 tendiert. Der Einfluss von Nachrichten mit nur geringer Relevanz auf das Signal wird ebenfalls reduziert. Da zwei Lexika, namentlich der General Inquirer und das Financial Sentiment Dictionary betrachtet werden, ergeben sich zwei unabhängige Signale, die nachfolgend isoliert analysiert werden.

Shadow-Rating-Modell für das Level der Ratingnote

Ein Shadow-Rating-Modell repliziert in einem ersten Schritt die Note einer Ratingagentur und kann im Anschluss verwendet werden um ein Unternehmen, das nicht von einer Ratingagentur bewertet wird, zu raten. Hierzu wird zunächst der Zusammenhang zwischen der zum 31. Dezember 2014 letzten Einschätzung2) (Ratingnote und Outlook) einer Ratingagentur für ein Unternehmen und der Nachrichtenlage (Anzahl an Nachrichten und dem aggregierten Signal) für das Unternehmen im Vormonat der entsprechenden Ratingeinstufung geschätzt. Die Bonitätseinschätzung der Agenturen S&P, Moody's oder Fitch zu einem Unternehmen besteht aus zwei Komponenten: Ratingnote r(·) und Outlook o(·). Während der Ratingnote anhand von Tabelle 1 ein numerischer Wert zugewiesen wird, wird ein negativer Outlook mit 0,25 und ein positiver Outlook mit minus 0,25 identifiziert.3)

In der Regression wird anschließend -ln(r(·) + o(·)) als abhängige Variable betrachtet. Als erklärende Variable dient für jedes Unternehmen das aggregierte Signal der Nachrichten nach einem der beiden Lexika, bezeichnet mit GI_Signal(·) beziehungsweise FS_Signal(·). Zusätzlich wird die Aufmerksamkeit, die das Unternehmen in den Medien erfahren hat, berücksichtigt. Diese wird definiert als Attention(·) = log (1+#Nachrichten(·)), wobei #Nachrichten(·) der Anzahl der für das Unternehmen publizierten Nachrichten entspricht. Beide erklärenden Variablen beinhalten ausschließlich Nachrichten, die in dem Monat vor der Bonitätseinschätzung publiziert wurden.

Als Kontrollvariablen werden die Aktienrendite im Monat vor der Bonitätseinschätzung betrachtet, in der Tabelle 2 bezeichnet mit SRet(·), und die Volatilität der Rendite, bezeichnet mit SVol(·). Zudem werden aus der aktuellsten Bilanz mit einem Bilanzstichtag von mindestens drei Monaten vor dem Zeitpunkt der Ratingeinschätzung der Return-on-Equity, RoE(·), der Free-Cash-Flow/Sales, CFS(·), die Debtto-Equity Ratio, DtE(·), die kurzfristigen Verbindlichkeiten zu allen Verbindlichkeiten, StD(·), und das Umsatzwachstum über die letzten drei Bilanzjahre, RG3(·) berücksichtigt. Erfasst werden auch binäre Variablen für jede Ratingagentur. Für Finanzinstitute wird aufgrund ihres speziellen Bilanz- und Risikoprofils folgende Vorgehensweisen gewählt:

1) Finanzinstitute werden durch eine binäre Variable gekennzeichnet und

2) Finanzinstitute werden von den Regressionen ausgeschlossen.

Die Grundmenge bei dem ersteren Vorgehen wird in Tabelle 2 mit all bezeichnet und bei letzteren mit non-fin.

Frühwarnsystem für die Änderung der Ratingnote

Der Zweck eines Frühwarnsystems besteht in der frühzeitigen Vorhersage der Verschlechterung der Ratingnote beziehungsweise des Outlooks bei einer Ratingagentur. Er wird getestet, ob das aggregierte Signal aller Nachrichten über ein Unternehmen und die mediale Aufmerksamkeit in einem Kalendermonat eine Verschlechterung im Folgemonat antizipieren. Dies geschieht mit einem logistischen Regressionsmodell. Das Vorgehen ist in Abbildung 2 illustriert.

In dem logistischen Regressionsmodell werden dieselben erklärenden Variablen wie bei dem linearen Regressionsmodell zuvor betrachtet. Darüber hinaus wird für Saisonabhängigkeiten anhand von binären Variablen für jeden Kalendermonat kontrolliert. Falls Unternehmen der Finanzbranche nicht ausgeschlossen sind, ist für sie ebenfalls eine binäre Variable vorgesehen.

Ergebnisse zum Shadow-Rating-Modell

Die Ergebnisse für das Shadow-Rating-Modell beruhen auf 635 Beobachtungen für 377 Unternehmen4) und sind im oberen Teil von Tabelle 2 ausgewiesen.5) Fast alle Kontrollvariablen sind signifikant auf dem 10-Prozent-Level. Nur die Aktienrendite in dem Monat vor der Ratingentscheidung ist nicht signifikant. Dies ändert sich auch nicht, wenn das Nachrichtensignal und die Anzahl an Nachrichten als erklärende Variablen in das Modell mit aufgenommen werden. Letztere sind signifikant und implizieren einen ökonomisch plausiblen Zusammenhang. Das bedeutet, dass Unternehmen mit negativen Nachrichten ceteris paribus ein schlechteres Rating haben als Unternehmen mit positiven Nachrichten. Die Güte des Modells, gemessen anhand des Adjusted R-square, wird durch die Nachrichten um 20 bis 30 Prozent, beziehungsweise um 5 bis 7 Prozentpunkte gesteigert.6)

Dieses Ergebnis bleibt strukturell unverändert, wenn die Nachrichtenlage der drei Monate unmittelbar vor der Ratingvergabe berücksichtigt wird. Wird das Intervall auf sechs Monate erweitert, verschwindet der signifikante Zusammenhang. Diese Ergebnisse sind nicht ausgewiesen.

Ergebnisse zum Frühwarnsystem

Zur Entwicklung des Frühwarnsystems werden 43 004 monatliche Beobachtungen für die 449 Unternehmen beziehungsweise 37 814 Beobachtungen für 395 Unternehmen betrachtet, die nicht aus der Finanzbranche stammen. Für 1 191 beziehungsweise 1 018 Beobachtungen folgte von einer Ratingagentur ein Downgrade im sich anschließenden Monat oder ein negativer Rating-Outlook. Die Ergebnisse der logistischen Regressionen sind im unteren Teil von Tabelle 2 dargestellt.

In dem Regressionsmodell erweist sich der Return on Equity als durchweg statistisch signifikant, die Volatilität der Aktienrendite und die Fremdkapitalstruktur sind bei der Berücksichtigung aller Unternehmen signifikant. Darüber hinaus erweisen sich das mit dem General Inquirer berechnete Nachrichtensignal und die mediale Aufmerksamkeit durchweg als statistisch signifikant und haben einen plausiblen Regressionskoeffizienten. Das heißt, dass Unternehmen mit negativen Nachrichten und Unternehmen, über die exzessiv berichtet wird, mit höherer Wahrscheinlichkeit einen Downgrade oder einen negativen Outlook erhalten. Der Likelihood-Ratio-Test belegt zudem, dass die Nachrichtenkennzahlen das Basis-Regressionsmodell signifikant verbessern. Für einen Prognosezeitraum von 3 Monaten bleiben die Ergebnisse strukturell unverändert. Diese Ergebnisse sind nicht ausgewiesen.

Ein transparentes und robustes Verfahren

Die Nachrichtenlage sollte strukturiert in Kreditrisikoüberwachung eingebunden werden. Dies kann automatisiert im Rahmen eines Ratingverfahrens geschehen ohne hohe manuelle Aufwände zu verursachen, wie die Analyse zeigt. Zudem wird in dem Ansatz auf eine potenziell aufwendige Kalibrierung und auf komplexere Machine-Learning-Methoden mit gegebenenfalls nicht intuitiven oder zeitlich variablen Regeln verzichtet, wodurch ein transparentes und robustes Verfahren präsentiert werden kann.

Der Ansatz kann aber auch für die manuelle Einbindung der Nachrichtenlage in die Prozesse der Kreditrisikoüberwachung he rangezogen werden, um diese für den Analysten strukturiert aufzubereiten und seinen Fokus auf wichtige Nachrichten zu lenken.

Die Bedeutung von textbasierten Informationen wird aufgrund der Rolle der sozialen Netzwerken und einer immer direkter werdenden Berichterstattung permanent zunehmen. Daher ist die Integration dieser Information in die Prozesse der Finanzinstitute ein wesentlicher Erfolgsfaktor für die nächsten Dekaden. Neben dem Risikomanagement, das in diesem Artikel im Fokus ist, sollten auch die Marketingprozesse von dieser Information Gebrauch machen, um Kunden gezielt anzusprechen. Für diese Aufgabe sollte allerdings die Anbindung weiterer Quellen wie lokale Zeitungen und Nachrichtendienste wie Twitter eruiert werden, da nicht länger nur global operierende Unternehmen im Fokus sind, sondern auch lokal ansässige kleine Unternehmen.

Literatur

Loughran, Tim and Bill McDonald. (2011). When Is a Liability Not a Liability? Textual Analysis, Dictionaries, and 10-Ks. Journal of Finance 66, 35-66.

Ratha, Dilip, Prabal K. De und Sanket Mohapatra. (2010). Shadow Sovereign Ratings for Unrated Developing Countries. World Development 39, 295-307.

Tetlock, Paul C. (2007). Giving Content to Investor Sentiment: The Role of Media in the Stock Market. Journal of Finance 62, 1139-1167.

Fußnoten

1) Der Porter-Stemmer-Algorithmus führt englische Worte auf einen Wortstamm zurück.

2) Durch die Einschränkung der Regression auf die jeweils aktuellste Einschätzung einer Ratingagentur wird die Grundgesamtheit nach Unternehmen und Ratingagentur stratifiziert, siehe auch Ratha et. al. (2010).

3) Sollte eine Klasse einer Agentur mehreren r-Werten entsprechen, wird die Ratingklasse mit dem Durchschnitt der infrage kommenden r-Werte identifiziert, zum Beispiel wird die Fitch-Ratingnote C mit 20,5 identifiziert. Der numerische Wert für den Outlook ist so gewählt, dass in der Transformation durch ihn keine bessere beziehungsweise schlechtere Ratingklasse erreicht werden kann.

4) Von den 449 Unternehmen besitzen nur 377 Unternehmen eine Bonitätseinschätzung in dem Betrachtungszeitraum.

5) Die Ergebnisse für die binären Variablen bezüglich der Ratingagenturen, der Kalendermonate und für Finanzinstitute sind der Kürze halber nicht ausgewiesen.

6) Aufgrund der unterschiedlichen Branchen in der Grundgesamtheit fällt die Modellgüte niedriger aus als zum Beispiel in Ratha et al. (2010), die ein Shadow-Rating-Modell ausschließlich für Staaten entwickeln.

Weitere Artikelbilder

Noch keine Bewertungen vorhanden


X