Koalitionsvertrag mit künstlicher Intelligenz analysiert

thingsTHINKING ist eine Ausgründung aus dem Karlsruher Institut für Technologie (KIT) und arbeitet an einer künstlichen Intelligenz, die die Bedeutung von natürlicher Sprache versteht. Ähnlich wie Menschen ignoriert die Maschine die Wortwahl und extrahiert die eigentliche Bedeutung der Aussage.

Mit ihrer Software haben die Karlsruher die Parteiprogramme von CDU/CSU und SPD mit dem Koalitionsvertrag verglichen. Die Ergebnisse bestätigen die Aussagen der Experten, dass die SPD gut verhandelt hat.

Zum Koalitionsvertrag

Menschen sind im Umgang mit natürlicher Sprache Computern immer noch stark überlegen. Das gilt vor allem, wenn es darum geht, Sprache kreativ zu verwenden, Inhalte zu verstehen und wenn wir unseren gesunden Menschenverstand benutzen. thingsTHINKING ist eine Ausgründung aus dem renommierten Karlsruher Institut für Technologie (KIT) und bringt diesen gesunden Menschenverstand Maschinen bei.

Mit über einer Dekade Forschungsarbeit kombinieren thingsTHINKING verschiedene KI-Technologien um Kontexte auszuwerten, und um der Maschine beizubringen, Texte zu verstehen.

So kann die Maschine im konkreten Beispiel sagen, dass das Statement der CDU “Wir wollen, das [sic] alle unsere Kinder die bestmögliche Erziehung, Bildung und Betreuung erhalten, unabhängig von Herkunft und Lebenssituation der Eltern” im Endeffekt formal Deckungsgleich mit der Aussage “Wir werden die Benachteiligung von Kindern armer Eltern beseitigen und ihnen eine gleichberechtigte Teilhabe ermöglichen.” der SPD ist. Was die CDU oder die SPD sich insgeheim dabei gedacht haben mögen, also ob sie mentale Vorbehalte haben, interne Signalwörter verwenden und sie die Begrifflichkeiten gleich verstehen (ab wann ist man “arm” im Sinne der CDU und wann im Sinne der SPD?) kann die Maschine nicht wissen, wenn es nicht explizit im Text steht. Dennoch: Die entsprechenden Passagen im Koalitionsvertrag lesen sich dann laut Maschine: “Wir wollen, dass Kinder unabhängig vom Elternhaus die gleichen Chancen auf gesellschaftliche Teilhabe erhalten und ihre Fähigkeiten entwickeln können. [..] Wir wollen die bestmögliche Betreuung für unsere Kinder und die bessere Vereinbarkeit von Familie und Beruf.”

Klassische Machine Learning-Ansätze beschränken sich meist (nur) auf statistische/datengetriebene Verfahren (Deep Learning, etc.), die im Umgang mit Sprache laut den Gründern von tT nur Teilergebnisse liefert. thingsTHINKING surft hingegen mit seinem Ansatz auf der “Dritten Welle der künstlichen Intelligenz”, die erst vor wenigen Monaten begonnen hat.

Zum Thema Koalitionsvertrag

thingsTHINKING (thingsTHINKING.net) versteht Texte ähnlich wie wir Menschen und das hilft der Maschine dabei, Texte inhaltlich zu vergleichen, kontextbasierte Entscheidungen zu treffen und “Dinge zuende” zu denken.

Die Gründer um Dr. Sven J. Körner nennen ihre Maschine einen “Side-Kick” oder “Gabelstapler fürs Hirn”. Sie unterstützt Menschen in aufwändigen Vorgängen wie juristische Recherche, Steuerverarbeitung, Verwalten von Verträgen und Anforderungen im Bereich Maschinenbau, etc.

Einer der großen Vorteile ist die Geschwindigkeit und Unermüdlichkeit, mit der die Maschine vorgeht. Die Prüfung der Parteiprogramme mit dem Koalitionsvertrag dauert wenige Sekunden.

Bis dato sind viele Prozesse in den oben genannten Anwendungsfällen rein manuelle und von Menschen durchzuführende Arbeiten. Dies wird sich auch mit einer Lösung wie dieser nicht ändern - lediglich der Aufwand für Lesen und Verstehen wird enorm gekürzt. Menschen werden nach wie vor Entscheidungen treffen müssen, auch wenn die Maschine hier Handlungsvorschläge machen kann. “Es ist als ob jemand alles für Sie vorliest, einschätzt und Ihnen schön markiert vorlegt”, beschreibt Abdelmalik El Guesaoui die Plattform der Firma.

Konkrete Beispiele der Anwendung der Lösung ist das schnelle prüfen großer Mengen von Unterlagen im Bereich Due Dilligence, Requirements Engineering (Ausschreibungen, RFPs, RFIs) und natürlich Unterlagen zu und von Versicherungen. Ein wichtiger Punkt der Zusammenarbeit für thingsTHINKING sind Wirtschaftsprüfer, Steuerberater und Kanzleien, deren Prozesse im Bereich Accounting/Tax/Auditing durch die Lösung deutlich profitieren. Hier helfen sich laut den Aussagen der Gründer beide Partner immer gegenseitig: “KI kann man nicht aus dem Regal nehmen … es ist wichtig, dass Fachleute aus der jeweiligen Fach-Domäne die Maschine richtig einsetzen. Unsere Aufgabe ist es, uns - die Techniker - und die Partner so zusammenzubringen, dass die Maschine sofort einen klaren Mehrwert liefert”.


Im Interview erklärt thingsTHINKING, dass es für das Unternehmen (das aus reinen Technikern besteht) wichtig sei, Kooperationspartner für Lösungen in der echten Welt zu finden. Nur so sei es möglich, z.B. im Bereich LegalTech zu prüfen, wie gut die Maschine die Aufgaben out-of-the-box beherrscht. Hier sind Kooperationen mit der ELTA (u.a. Dr. Micha-Manuel Bues) und den Rechtsinformatikern in Stanford (CodeX) und Fachgespräche mit Experten wie Markus Hartung, Simon Ahammer, Wolf Michael Nietzer oder Tom Braegelmann beispielhaft im Bereich LegalTech. Das so genannte Benchmarking ist hier der wichtigste Bestandteil. Hier wird vorab festgelegt, wie man die Maschine prüfen kann und deren Ergebnisse bewertet. “Die Maschine weiß zwar viel über die Welt, aber im juristischen Bereich gelten teilweise andere Regeln. Das muss man der Maschine zeigen und das kann nur ein Jurist leisten”, meint Micha Manuel Bues von der European Legal Tech Association (ELTA).

Bues fügt unisono mit Körner an, dass die Maschine (noch) nicht beurteilen kann, welcher Faktor in Verträgen wie stark wiegt. Die Übereinstimmungen im Vertrag sind rein quantitativ. “Damit die Maschine solche Aufgaben auch qualitativ bewerten kann”, fährt Körner fort, “sind ein paar Vorarbeiten und entsprechender Input von Experten notwendig. Strukturelle Grenzen der Erkenntnis wird es auch geben, so Tom Braegelman im Gespräch mit Körner: “Die Menschen sind sich schon immer uneinig darüber gewesen, was wann gerecht und was Gerechtigkeit überhaupt ist, das wird auch eine Maschine nicht wissen. Bei den Juristen kommt zudem als die Komplexität  erhöhender Faktor hinzu, dass Recht grds. fragmentarisch und stets abänderbar und damit paradoxerweise, obwohl es menschliche Verhaltenserwartungen stabilisieren soll, prinzipiell instabil ist. Zudem können rechtliche Bewertungen und Entscheidungen immer auch rechtspolitisch gefärbt und damit unvorhersehbar sein, auch wenn sie es eigentlich nicht sein sollten. Das macht den Menschen schon die Rechtsanwendung und Rechtserzeugung schwer und wird ihnen keine Maschine voll abnehmen können.”  
Allerdings kann die Maschine solche Aufgaben übernehmen, welche heute im Bereich Steuern und Anforderungsverarbeitung bereits möglich sind.

Die Idee die Parteiprogramme mit dem Koalitionsvertrag zu vergleichen wurde dem Team von einem weiteren Partner, der vtmw AG aus München, zugespielt. Dieser nutzt die Lösung im Versicherungsumfeld und wollte wissen, ob die Maschine nicht einmal alle Verträge durchlesen und prüfen könnte. Gesagt, getan. “In der Mittagspause haben wir dann die entsprechenden Dokumente heruntergeladen und der Maschine gegeben”, sagt Dr. Mathias Landhäußer, einer der Geschäftsführer der tT.

“Und nach wenigen Sekunden war klar, dass das Bauchgefühl der Presse und Analysten bzgl. des Vertrages durch die Maschine bestätigt wird. Die SPD hat deutlich mehr Teile ihres Parteiprogramms im Koalitionsvertrag unterbekommen. Teilweise sind die Punkte zwar anders formuliert, aber sie bedeuten dasselbe.” Und genau das ist es ja, was die Maschine aus Karlsruhe am besten kann.

Kernaussagen

“Wir können es drehen und wenden, wie wir wollen: die Maschine findet im Schnitt 2-3 mal so viele thematische Verbindungen des SPD Parteiprogramms im Koalitionsvertrag als im CDU/CSU Programm”, so Körner. “Man kann der Maschine sagen, wie frei Sie Aussagen interpretieren darf - das Verhältnis der Abdeckung im Koalitionsvertrag verschiebt sich aber nicht. Das scheint sich stringent durchzuziehen”.

Die Entwickler haben den Vergleich zusätzlich umgedreht und geprüft, wieviel Koalitionsvertrag im Parteiprogramm steckt und sogar die Parteiprogramme untereinander verglichen. Vorläufiges Fazit: es ist mehr Koalitionsvertrag im SPD Programm und die beiden Parteiprogramme selbst sind zu einem Drittel semantisch (also von der Bedeutung her) sehr ähnlich.

“Theoretisch sollte es auch möglich sein, die Bildung von generellen Clustern in Parteiprogrammen oder jedem anderen Dokument, das verhandelt wird, festzustellen”, sagt Körner. Das bedürfe aber nach Aussage der Firma dann mehr als einer Kaffeepause, um sinnvolle Ergebnisse zu erzielen. In wenigen Stunden sollten hier aber auch brauchbare Ergebnisse zu liefern sein, meinen die Gründer.

Details zur Auswertung

Die Maschine hat den Koalitionsvertrag selbständig in rund 8200 Sätze und 4500 Abschnitte gegliedert. Es kann eingestellt werden, wie frei oder strikt die Maschine beim bewerten der Ähnlichkeiten vorgeht. Zum Beispiel liefert die Maschine bei moderater Einstellung zu den oben genannten Beispielen auch Sätze wie “Eltern wünschen sich, ihre Arbeit und die Kindererziehung partnerschaftlich aufteilen zu können” aus dem SPD Programm oder Teile aus dem Koalitionsvertrag “Zumeist wollen beide Elternteile nach Trennung und Scheidung intensiv in die Erziehungsverantwortung für ihre Kinder eingebunden bleiben”, die damit verbunden sind.

Wie weit man hier geht, und wieviel Spielraum man der Maschine lässt, ist von Fall zu Fall sehr unterschiedlich - dies können die Benutzer aber ad hoc einstellen.


Die vorläufige Auswertung zeigt ein grobes Verhältnis von 2:1 im Verhältnis für das Parteiprogramm der SPD. Diese Ergebnisse sind jedoch mit Vorsicht zu genießen, da nur Stichproben gemacht wurden.

Es zeigt sich auch, dass das Programm der SPD deutlich umfangreicher gestaltet ist, als das der Union. Die Christdemokraten schreiben kürzer und insgesamt weniger. Ähnliche Formulierungen sind im Schnitt 10% kürzer geschrieben.

Lässt man die Maschine die Parteiprogramme in Klassen einteilen, so findet sie eine breitere Themen(Klassen)-Abdeckung des CDU/CSU Parteiprogramms im SPD Parteiprogramm (197 ähnliche Themencluster) als bei die SPD im CDU/CSU Parteiprogramm (hier hat die SPD 134 ähnliche Themengebiete).