KI-gestütztes formatives Feedback zu Freitextaufgaben

Autor*innen: Karolyi, Heike; Hanses, Michael; de Witt, Claudia
Mentor*innen: Kohls, Christian
Hochschule: FernUniversität in Hagen
Veröffentlichung: 23. März 2026
Lesezeit: 8 minute read

Abstract

Dieses Pattern richtet sich an Lehrende, Mediendidaktiker*innen und Mediendidaktische Zentren an Hochschulen, die KI-gestütztes Feedback, das datenschutz- und EU KI-VO-konform entwickelt wurde, in ihre Lehrveranstaltungen integrieren möchten. Beschrieben wird ein Ansatz, der Bewertungskriterien von Lehrenden und die Vorteile von genKI nutzt, um automatisiert formatives Feedback zu Freitextaufgaben in allen Disziplinen für Studierende anzubieten.

Fachkompetenzen Feedback Lernerfolg Motivation Prüfen

Pattern

Kontext

Feedback ist ein zentraler Bestandteil guter Lehre, insbesondere als lernförderliches formatives Feedback zu Freitextaufgaben, also ein Feedback, das im Lernprozess zu Übungszwecken gegeben wird. Gutes Feedback für Studierende ist ein wichtiger Faktor für den Lernerfolg. Ein systematisiertes Feedback folgt in der Regel klaren Kriterien, die z.B. auf formale Aspekte, fachliches Wissen und Transferleistungen rekurrieren und als Anforderungen an eine gute Lösung formuliert werden können. Lehrende können so Freitextaufgaben noch besser einsetzen, um Studierende kontinuierlich und individualisierter auf die Prüfungsanforderungen vorzubereiten.

Problem

Lösungsspezifisches Feedback zu Freitextaufgaben ist in sehr großen Kursen nicht skalierbar und erfordert viele Ressourcen der Lehrenden. Für Lehrende kann es zudem herausfordernd sein, in einem Feedback auch das Wissen darüber, was eine gute Lösung ausmacht, an die Studierenden weiterzugeben.

Wirkkräfte

Formatives Feedback nimmt eine entscheidende Rolle für den Lernerfolg ein. Effektives und zeitnahes Feedback kann Studierenden dabei helfen, ihre Kenntnisse und Fähigkeiten zu verbessern, selbstreguliertes Lernen zu fördern und Motivation und Autonomie im Lernprozess zu unterstützen. (vgl. Hattie & Timperley, 2007; Shute, 2008; Evans, 2013; Kluger & DeNisi, 1996; Wisniewski et al., 2020).

Im Hochschulstudium können Freitextaufgaben zu sehr ausführlichen Antworten führen, die von einfachen Darstellungen von Sachverhalten hin zu komplexen wissenschaftlichen Diskursen in langen Texten führen. Lehrende brauchen die Möglichkeit, Bewertungskriterien an die eigenen Anforderungen und das gewünschte Leistungsniveau für jede Aufgabe anzupassen.

Studierende lösen Freitextaufgaben zunehmend mit generativer KI, so dass in dem Fall das Aufgabenformat nicht mehr die gleiche Wirkung erzielen kann wie vor dem breiten Zugang zu generativer KI. Auf diese KI generierten Lösungen Feedback durch Lehrende zu geben, würde sogar zu einer “Verschwendung” von Ressourcen führen.

Beim Einsatz von KI gibt es hohe Anforderungen an Privatsphäre und an einen geschützten Übungsraum, in dem Studierende nicht zu identifizieren sind. Dies ist eines der Desiderate aus Studierendenbefragungen.

Lösung

Lehrende geben ihre Freitextaufgaben, eigene Bewertungskriterien und den Lernkontext in eine Anwendung für KI-gestütztes formatives Feedback ein und erstellen einen systematisierten Prompt, um ein Feedback mit einem ausgewählten LLM von dieser Anwendung generieren zu lassen.

Mit der Veröffentlichung stellen Lehrende so Aufgabenfeedbacks für Studierende bereit. Studierende reichen ihre Lösungen über eine Eingabemaske ein. Per Knopfdruck generiert die KI dann ein spezifisches Feedback zur jeweiligen Lösung. Feedbacks können für eine beliebige Anzahl an Fragen erstellt werden und die Nutzerzahl bzw. Kursgröße ist nicht begrenzt, da automatisiert zu jeder eingegebenen Lösung ein systematisches Feedback generiert wird. Für einen schnellen Start können Lehrende typische Kriterien und passende Prompts über Begleitmaterialien nutzen, die dann an die eigenen Bedarfe angepasst werden können. Large Language Models (LLMs) können passend zu jedem Kriterium ausgewählt werden, so dass man für den fachlichen Zusammenhang das am besten geeignete Modell nutzen kann.

Eine Anwendung, die genau dieses Lösungsmuster umsetzt, ist COFFEE (Corrective Formative Feedback). Die nachfolgenden Screencasts geben einen ersten Eindruck, wie die Anwendung COFFEE diese Lösung umsetzt: Screencast der Studierendensicht und Screencast der Lehrendensicht

Details der Lösung

Grundsätzliche Umsetzung der Lösung

Die Umsetzung der Lösung wird exemplarisch an der KI-Anwendung COFFEE illustriert. Mit COFFEE können Lehrende ihren Studierenden ein Feedback zu Lösungen auf Freitextaufgaben bereitstellen. Dieses Feedback basiert auf den didaktischen Kriterien, welche von Lehrenden vorgegeben werden. Stark vereinfacht kann man sich die Funktionsweise von COFFEE so vorstellen: Ein Teil der Anwendung wird durch Lehrende bestimmt, die ihre Aufgaben und Bewertungskriterien in die Anwendung eingeben, und dann über einen Prompt an ein generatives KI-Model gesendet wird, das dann das Feedback lösungsspezifisch ausführt. So können Studierende schnell die Stärken und Schwächen ihrer Lösung in Bezug zu den Lernzielen des Kurses überprüfen.

In einem Value Sensitive Designprozess wurde COFFEE entwickelt und als Open Source Lösung für Hochschulen veröffentlicht. Nach Installation der Anwendung und der Ausbildung von KI-Kompetenzen bei den Nutzergruppen kann die Anwendung COFFEE an Hochschulen direkt in Betrieb genommen werden. Alle dafür nötigen Informationen und Begleitmaterialien sind im Abschnitt Medien verlinkt. Rahmenbedingungen wie Datenschutz und EU KI-VO wurden im Entwicklungsprozess berücksichtigt. Anforderungen zu Datenschutz und EU KI-VO wurden daher nach dem „Privacy by Default“ Konzept umgesetzt. Die Applikation kommt ohne personenbezogene Daten aus. Transparenzinformationen werden direkt in der Anwendung automatisiert zu den jeweiligen Kriterien angegeben. Sie sind durch einen einfachen Klick auf den Info-Button abrufbar. Weitere Informationen können über in der Anwendung integrierte Nutzungsbedingungen aufgerufen werden. Details dazu sind im Abschnitt Stolpersteine beschrieben.

Notwendige Vorbereitungen (Lehrende)

Der Zugang zur Anwendung COFFEE (s. Abschnitt Medien) muss an der eigenen Hochschule eingerichtet werden. Lehrende sollten eigene Freitextaufgaben mit Bewertungskriterien und passenden Kontextinformationen (Musterlösungen, Studientexte) vorbereiten. Kenntnisse im Prompt Engineering sind vorteilhaft, können aber schnell mit Begleitmaterialien erlernt werden. Zur Anwendung gehört auch ein Schulungsangebot (z. B. “How to make COFFEE”), das vor der Nutzung der Anwendung durchlaufen werden sollte, sowie Content-Vorlagen zu Kriterien und Prompts.

Durchführung

Eine Lehrperson muss zunächst Fragen, Kriterien und Kontextinformationen – also wissenschaftliche Fachtexte, Musterlösungen oder Lehrtexte – in die entsprechenden Eingabemasken einfügen. Sie schreibt einen Prompt zu jedem Bewertungskriterium und wählt ein dazu passendes LLM aus.

Screencast der Lehrendensicht

Alle Informationen werden dann in einer Datenbank zusammengeführt und an ein generatives KI-Modell gesendet, die aus diesen Informationen Feedbacktexte in der Web-Anwendung erstellt. Die einzelnen Aufgaben zu einem Kurs können dann per Link in die Lernumgebung zum Kurs als Link oder in einem „iframe“ eingebunden werden, sodass Studierende sich das Feedback jederzeit für ihre Aufgabenlösung generieren lassen können.

Screencast der Studierendensicht

Nachbereitung (Lehrende)

Je nach Bedarf und Evaluationsergebnis kann im Anschluss eine Qualitätssicherung und Anpassung der Prompts erfolgen.

Die Anwendung besitzt unter dem Menüpunkt „Metrics“ ein Dashboard, in der die Nutzung und Bewertung der angelegten Feedbacks eines Kurses mit Filtermöglichkeiten dargestellt werden. So können verbesserungswürdige aktive Feedbacks schnell identifiziert werden.

Erforderliche Werkzeuge

Dieses Muster kann über die Anwendung COFFEE umgesetzt werden. Dies erfordert die Installation der Anwendung auf Systemen der Hochschule incl. Anbindung an LLM. Alle Informationen dazu finden Sie hier: https://github.com/hansesm/COFFEE

Stolpersteine

Weniger gehaltvolle Feedbacks durch einfache LLM-Nutzung: Da generative KI, oder genauer gesagt LLMs trainiert wurden, immer die Antwort zu geben, die mit hoher Wahrscheinlichkeit gewünscht ist, kommt es oft zu sogenannten Halluzinationen und damit zu ungenauen Feedbacks. Daher ist es wichtig, klare Bewertungskriterien mit in einen Prompt zu integrieren.
Sehr komplexe Aufgaben: Feedbacks zu umfangreichen Wissensfragen, Kettenaufgaben o.ä. bedürfen besonderer Sorgfalt. Es sollte darauf geachtet werden, dass die Aufgabenstellungen eindeutig sind. Ggf. müssen zu komplexe oder verschachtelte Aufgaben in mehrere Aufgaben aufgeteilt werden.
Didaktische Kriterien: Feedbacks sollten idealerweise ca. 3 Kriterien nutzen. Zu viele Kriterien führen zu einem hohen Tokenverbrauch und machen das System langsam. Kriterien sollten trennscharf entwickelt werden, damit keine Redundanzen in den einzelnen Feedbacktexten entstehen.
Qualitätssicherung: Die Qualität wird bestimmt durch die Passung von Kontextinformation, Prompt und genutztem LLM. Generelle Schwächen generativer KI für wissenschaftliche Anforderungen können nur minimiert werden, sind aber ggf. nicht ganz zu vermeiden. Eine erprobte Anleitung zur Qualitätssicherung ist Teil der Begleitmaterialien.
EU KI-VO: Eine solche Anwendung ist laut EU KI-VO nur im Rahmen von Übungen während des Lernprozesses zu nutzen. Wie in den Nutzungsbedingungen beschrieben, dürfen z. B. keine Prüfungsleistungen mit COFFEE bewertet werden. Am Beispiel von COFFEE kann gezeigt werden, wie dies gelingen kann: Die Betreiber von COFFEE müssen Transparenzinformationen nach Art. 50 EU KI-VO geben, diese wurden bereits in die Anwendung in Nutzungsbedingungen und in Info-Felder integriert. Nach Art. 4 EU KI-VO müssen Nutzende KI-Kompetenzen besitzen, die von der Hochschule ggf. dokumentiert werden müssen. Das Lernangebot „How to make COFFEE“ dient zur Erfüllung dieser Pflicht. Studierende sollten vor allem KI-Kompetenzen im kritischen Umgang mit genKI besitzen. Dazu können kurze Lernvideos genutzt werden, insofern diese Kompetenzen nicht bereits auf andere Weise im Studium vermittelt wurden.
DSGVO: Die Anwendung selbst nutzt keine personenbezogenen Daten, das Rollensystem der Anwendung kann durch Gruppenrollen erfolgen. Da die Datenschutzgesetze auch auf Landesebene oder den Regelungen einer Hochschule unterliegen, müssen die Pflichten immer im Zusammenhang mit der tatsächlichen Installation und Einbettung der Anwendung betrachtet werden. Bitte stimmen Sie sich dazu mit dem / der zuständigen Datenschutzbeauftragten ab und lassen Sie sich gut zu möglichen Szenarien beraten.

Folgen (Vorteile, Nachteile)

Vorteile

Entlastung der Lehre durch automatisiertes Feedback
Bestimmung der Bewertungskriterien für eine Aufgabe durch die Lehrenden selbst
Lernförderliches Feedback für Studierende innerhalb weniger Sekunden nach Übermittlung einer Lösung
Geschützter digitaler Übungsraum, da das Feedback ohne die Speicherung personenbezogener Daten gegeben werden kann
Bereitstellung von Feedback, das ggf. aufgrund fehlender Ressourcen nicht möglich wäre
Steigerung der Lernmöglichkeiten für Studierende, COFFEE kann mit entsprechenden Prompts die Anforderungen an gute Lösungen an Studierende kommunizieren bzw. vermitteln
Umfangreiches Begleitmaterial mit Beispieltexten zu Bewertungskriterien und Prompts
Transparenz für Nutzende, die automatisiert in Infoboxen Beschreibungen zum Bewertungskriterien und zum genutzten Prompt erhalten
Evaluierter Einsatz und nachgewiesene Lernwirksamkeit
Ein LLM wird mit der Anwendung installiert
Ergänzung von beliebig vielen LLMs über eine dafür vorbereitete Schnittstelle möglich
DSGVO- und EU KI-VO-konform bei Berücksichtigung der Stolpersteine

Nachteile

Lokale Installation der Anwendung notwendig, keine Cloud Lösung.
Zu Beginn möglicher erhöhter Aufwand bei der Generierung eines hochwertigen Feedbacks. Entscheidende Bedeutung der Kombination von Kontext, LLM und Prompt zur Erzeugung eines qualitätsgesicherten Feedback

Praxisbeispiele, Medien & Literatur

Detailliertes Beispiel

Eine Anwendung, die genau dieses Lösungsmuster umsetzt ist COFFEE (Corrective Formative Feedback). Weitere Informationen dazu siehe Literaturverweise und Links.

Praxisbeispiele

Es wurden noch keine Elemente hinterlegt.

Downloads

Es wurden noch keine Elemente hinterlegt.

Literatur

Zitiervorschlag

Karolyi, Heike; Hanses, Michael; de Witt, Claudia (2026): KI-gestütztes formatives Feedback zu Freitextaufgaben. Veröffentlicht am 23. März 2026 auf patternpool.de.

Lizenz des Textes

CC BY NC SA ist eine Creative-Commons-Lizenz, die mehrere Rechtemodule kombiniert. CC BY NC SA ermöglicht eine offene und kooperative Nutzung von Inhalten, während der Urheber seine Rechte schützt und die kommerzielle Nutzung ausschließt.

BY (Namensnennung): Der Urheber des Werks muss genannt werden.
NC (Nicht-kommerziell): Der Lizenznehmer darf das Werk nur nicht-kommerziell nutzen.
SA (Weitergabe unter gleichen Bedingungen): Wenn der Lizenznehmer das Werk bearbeitet oder verändert, muss er es unter denselben Bedingungen (CC BY NC SA) weitergeben.

Diese Lizenz ermöglicht es anderen, ein Werk zu kopieren, zu verteilen oder zu bearbeiten, solange dies nicht kommerziell geschieht und der Urheber genannt wird. Die Lizenznehmer müssen auch ihre eigenen Bearbeitungen unter denselben Bedingungen (CC BY NC SA) weitergeben. Die Bilder werden, soweit als Quelle nicht anders gekennzeichnet, von Bilddatenbanken mit sog. CC0 Lizenz bezogen. Weitere Informationen zu den Bild-Quellen entnehmen Sie bitte dem Impressum.

Verwandte Patterns