Suchen Kontrast Hilfe

Besitzen Sie diesen Inhalt bereits, melden Sie sich an.
oder schalten Sie Ihr Produkt zur digitalen Nutzung frei.

Dokumentvorschau
RWK 4, 15. April 2026, Seite 142

AccountingBench: Wie gut sind KI-Modelle im Rechnungswesen?

Ein Benchmark zur systematischen Evaluierung von LLMs in Rechnungswesen und Steuerrecht

Manuel Kaburek, Ewald Aschauer, Alexander Hofer und Markus Isack

Der Einsatz von Künstlicher Intelligenz (KI) in Rechnungswesen, Steuerrecht und Wirtschaftsprüfung nimmt rapide zu. Doch wie verlässlich sind LLMs tatsächlich bei normativen, regelgebundenen Aufgaben?

AccountingBench ist ein strukturierter Benchmark zur systematischen Evaluation von LLMs in Rechnungswesen und Steuerrecht. Der vorliegende Beitrag stellt Methodik und aktuelle Ergebnisse vor und gibt einen Überblick über Implikationen für die Praxis. Das Tool steht frei zugänglich unter https://www.boardservice.center/research/accountingbench.html zur Verfügung.

1. Warum ein eigener Benchmark für das Rechnungswesen?

Rechnungswesen und Steuerrecht sind durch normative Standards, urteilsbasierte Einschätzungen und Compliance-Verantwortung geprägt, also von Eigenschaften, die besonders hohe Anforderungen an die Verlässlichkeit und Nachvollziehbarkeit von KI-gestützten Entscheidungen stellen.

Frühe Studien, die LLMs anhand von Prüfungsaufgaben für Berufsqualifikationen wie den CPA testeten, zeigten, dass die Leistung je nach Modellgeneration, Aufgabentyp und Konfiguration erheblich variiert. Entscheidend ist dabei, dass Testergebnisse keine stabilen Modelleigenschaften, sondern Funktionen de...

Daten werden geladen...