Generative Künstliche Intelligenz - wir erschließen damit die Rechtswissenschaften.
Titel des Projektes:
LeDaMo - Legal Data Modeling
Ansprechpartner:
Martin Heckelmann Christina Kratsch
In vielen Bereichen ist Maschinelles Lernen bereits sehr erfolgreich. Es punktet dort, wo es Impulse für die eigene Arbeit liefert oder seine Ausgaben vom Nutzer leicht zu überprüfen sind. Juristische Entscheidungen bringen gegenwärtige Modelle hingegen aus zwei Gründen an ihre Grenzen. Erstens kann der Nutzer mangels eigener Expertise die richtigen Ausgaben nicht von den redundanten, irrelevanten und falschen Ausgaben (zusammenfassend häufig als „Halluzinationen“ bezeichnet) unterscheiden und den erzeugten Text daher nicht aus eigener Kraft korrigieren. Zweitens unterliegt das Rechtssystem – ähnlich der Mathematik oder den Naturwissenschaften – zahlreichen Kausalzusammenhängen und weitverzweigten Regeln, an denen LLMs aufgrund ihrer Textgebundenheit und geringen Sprungweite gelegentlich scheitern. Darüber hinaus ist die Fallhöhe für KI-basierte Anwendungen hoch: juristische Entscheidungen oder Beratungen führen ggf. zu umfassenden realweltlichen Handlungen mit teilweise umfassenden persönlichen und monetären Konsequenzen.
Vergleichbar zum medizinischen Bereich müssen juristische KI-Systeme deshalb ein (zu definierendes) Mindestmaß an Zuverlässigkeit und Korrektheit garantieren. Hier zeigt sich die dringende praktische Notwendigkeit, die Zuverlässigkeit von Output KI-basierter juristischer Anwendungen automatisiert quantifizieren zu können.
Die Ursachen für das Problem liegen folglich nicht in einer zu geringen Rechenleistung, sondern in der zu universellen Transformer-Architektur der LLMs und der fehlenden Möglichkeit, die Sicherheit ihrer Aussagen zu quantifizieren. Lösungen werden den LLMs daher vor- oder nachgeschaltet, etwa als Retrieval Augmented Generation (RAG) oder als Fine Tuning. Für diese und andere Ansätze braucht es zum einen Daten und zum anderen ein Datenmodell. Umfangreiche, datenschutzkonform generierte und urheberrechtsfreie Daten liegen bereits vor. Die Schaffung eines geeigneten Datenmodells zur Erfassung der teils durch Normen, teils durch Rechtsbegriffe hergestellten Bezüge hingegen ist eine anspruchsvolle und komplexe Forschungsmaterie.
Eine derartige umfassende, maschinenlesbare und strukturierte Datenmodellierung ist jedoch essenziell zur Entwicklung, Optimierung und Qualitätssicherung. Denn die rein textliche Arbeit ohne Eingang der juristischen Verknüpfungen genügt für sich genommen nicht. Unser Projekt hat sich zum Ziel gesetzt, bestehende Methoden des Knowledge Managements, des Information Retrievals und natürlich des Data Engineerings zu verknüpfen, um eine belastbare und umfassende KI-freundliche Daten- und Wissensbasis juristischer Sachverhalte zu erstellen. Ziel und Zweck dieses Datenmodels ist ein signifikanter Beitrag zu aktuellen Modellen der (insbesondere generativen) Künstlichen Intelligenz, um neue innovative juristische KI-Applikationen zu entwickeln.
Mit der KI-Werkstatt schafft die HTW Berlin einen Ort für das gemeinsame Forschen, Lehren und Anwenden von KI-Technologie auf aktuelle Praxisprobleme. Ziel ist u.a. die Schaffung einer hochschulweiten Infrastruktur, welche die Verwendung und Weiterentwicklung aktueller KI-Algorithmen auf höchstem wissenschaftlichem Niveau ermöglicht, sowie die Entwicklung eines KI-Modulbaukastens um die KI-Lehre interdisziplinär fördern.
Kontaktiere Uns