Qualitätssicherung von Lerninhalten — E-Learning Wissen

Warum Qualitätssicherung entscheidend ist

Fehlerhafte Lerninhalte haben direkte Konsequenzen: Falsche Informationen in einer Compliance-Schulung können zu rechtlichen Risiken führen. Eine schlecht formulierte Prüfungsfrage misst nicht das, was sie messen soll. Ein didaktisch schwacher Kurs verschwendet die Zeit der Lernenden, ohne den gewünschten Lernerfolg zu erzielen.

Qualitätssicherung (QA) ist kein optionaler Zusatzschritt — sie ist integraler Bestandteil jedes professionellen Content-Erstellungsprozesses.

Review-Prozesse

Das Vier-Augen-Prinzip

Mindestens zwei Personen sollten jeden Inhalt prüfen, bevor er veröffentlicht wird. Idealerweise aus unterschiedlichen Perspektiven:

Fachliche Prüfung: Ist der Inhalt korrekt und aktuell?
Didaktische Prüfung: Ist der Inhalt verständlich und lernzielgerecht?
Sprachliche Prüfung: Ist die Sprache klar, konsistent und fehlerfrei?
Technische Prüfung: Funktionieren alle Interaktionen, Links und Medien?

Redaktionsworkflows

Professionelle Content-Erstellung folgt einem definierten Workflow mit klaren Zuständigkeiten und Übergabepunkten:

Entwurf (Draft): Autor erstellt den Inhalt
Fachreview: SME (Subject Matter Expert) prüft inhaltliche Korrektheit
Didaktisches Review: Instruktionsdesigner prüft Lernzielpassung und Verständlichkeit
Sprachliches Lektorat: Korrektor prüft Sprache, Konsistenz und Terminologie
Technisches Testing: QA-Team testet Funktionalität in der Zielumgebung
Freigabe: Verantwortlicher gibt den Inhalt zur Veröffentlichung frei

Freigabestufen

Für kritische Inhalte (Compliance, Prüfungsrelevanz) empfehlen sich mehrere Freigabestufen:

Entwurf → Fachreview → Überarbeitet → Didaktik-Review → Final → Freigabe → Veröffentlicht

Autorensysteme unterstützen dies durch Status-Workflows, automatische Benachrichtigungen und Audit-Trails.

Die Rolle des Subject Matter Expert (SME)

Wer ist der SME?

Der Fachexperte (Subject Matter Expert) bringt das tiefe Fachwissen ein, das die Grundlage der Lerninhalte bildet. Das kann ein Arzt sein, der medizinische Schulungen prüft, ein Steuerberater, der Rechnungswesen-Fragen validiert, oder ein Arbeitsschutzbeauftragter, der Sicherheitsunterweisungen freigibt.

SME-Zusammenarbeit

Die häufigsten Herausforderungen:

Zeitknappheit: SMEs haben wenig Zeit für Content-Reviews
Kommunikationslücke: SMEs denken in Fachsprache, Lernende brauchen verständliche Sprache
Perfektionismus: SMEs neigen dazu, Inhalte zu verkomplizieren

Best Practices:

Klare Review-Checklisten bereitstellen (nicht „prüfe den Kurs”, sondern spezifische Fragen)
Zeitaufwand realistisch kommunizieren und einplanen
Instruktionsdesigner als Vermittler zwischen SME und Lernenden

Item-Analyse für Prüfungsfragen

Klassische Teststatistik

Nach dem ersten Einsatz von Prüfungsfragen liefert die Item-Analyse wertvolle Daten zur Qualität jeder einzelnen Frage:

Schwierigkeitsindex (P)

Der Anteil der Prüflinge, die eine Frage richtig beantworten.

P > 0,9: Zu leicht — fast jeder beantwortet sie richtig. Differenziert nicht.
P = 0,3 – 0,8: Idealer Bereich — differenziert zwischen verschiedenen Leistungsniveaus
P < 0,2: Zu schwer — fast niemand beantwortet sie richtig. Möglicherweise fehlerhaft oder unklar formuliert.

Trennschärfe (Punkt-biseriale Korrelation)

Misst, ob eine Frage zwischen guten und schlechten Prüflingen unterscheidet.

r > 0,30: Gute Trennschärfe — die Frage misst, was der Gesamttest misst
r = 0,10 – 0,30: Akzeptabel, aber verbesserungswürdig
r < 0,10: Schlechte Trennschärfe — die Frage sollte überarbeitet werden
r < 0: Negative Trennschärfe — gute Prüflinge antworten öfter falsch als schlechte. Die Frage ist fehlerhaft.

Distraktoranalyse

Bei MC-Fragen: Wie oft wird jede Antwortoption gewählt?

Guter Distraktor: Wird von einer substanziellen Minderheit gewählt (z. B. 10-30 %)
Schlechter Distraktor: Wird fast nie gewählt — zu offensichtlich falsch
Problematischer Distraktor: Wird häufiger gewählt als die richtige Antwort — möglicherweise missverständlich oder die „richtige” Antwort ist tatsächlich falsch

Automatisierte Item-Analyse

Moderne Assessment-Engines berechnen diese Kennwerte automatisch und flaggen problematische Items:

Fragen mit P < 0,2 oder P > 0,9
Fragen mit negativer oder sehr niedriger Trennschärfe
Distraktoren, die nie gewählt werden
Fragen, bei denen die Bearbeitungszeit stark vom Durchschnitt abweicht

Inhaltliche Qualitätskriterien

Für Lerneinheiten

Lernzielpassung: Behandelt der Inhalt das definierte Lernziel?
Korrektheit: Sind alle Fakten, Zahlen und Verfahren aktuell und korrekt?
Verständlichkeit: Ist die Sprache der Zielgruppe angemessen?
Didaktische Struktur: Gibt es eine logische Progression vom Einfachen zum Komplexen?
Praxisbezug: Werden Beispiele und Anwendungsszenarien geboten?
Medieneinsatz: Sind Bilder, Videos und Grafiken sinnvoll eingesetzt — nicht nur dekorativ?

Für Prüfungsfragen

Haladyna et al. (2002) formulierten 31 Richtlinien für die Erstellung von MC-Fragen. Die wichtigsten:

Ein eindeutiges Problem pro Frage — die Frage muss auch ohne Antwortoptionen verständlich sein
Positive Formulierung — Verneinungen vermeiden oder deutlich markieren
Homogene Antwortoptionen — gleiche Länge, gleiche grammatikalische Struktur
Kein „Alle/keine der obigen” — methodisch problematisch
Plausible Distraktoren — jede falsche Antwort muss für jemanden ohne Wissen plausibel sein

Feedback-Loops

Lernerdaten als Qualitätsindikator

Die wertvollste Qualitätsinformation kommt von den Lernenden selbst — nicht durch Umfragen, sondern durch Verhaltensdaten:

Hohe Abbruchrate bei einem Modul → Inhalt zu lang, zu schwer oder nicht relevant
Häufige Falschantworten bei einer Frage → Frage missverständlich oder Inhalt schlecht vermittelt
Niedrige Bewertung → Lernende finden den Inhalt nicht hilfreich
Kurze Verweildauer → Inhalt wird überflogen, nicht durchgearbeitet

Kontinuierliche Verbesserung

Der Content-Erstellungsprozess sollte nicht mit der Veröffentlichung enden. Ein Continuous Improvement Cycle umfasst:

Daten sammeln: Nutzungsdaten, Testergebnisse, Feedback
Analysieren: Schwache Stellen identifizieren
Priorisieren: Welche Verbesserungen haben den größten Impact?
Überarbeiten: Inhalte aktualisieren, Fragen optimieren
Erneut messen: Hat die Überarbeitung die gewünschte Wirkung?

Qualitätssicherung bei KI-generierten Inhalten

Mit dem zunehmenden Einsatz von KI in der Content-Erstellung wird QA noch wichtiger:

Faktencheck: KI kann plausibel klingende, aber falsche Informationen generieren
Bias-Prüfung: Automatisch generierte Inhalte können Vorurteile aus den Trainingsdaten widerspiegeln
Konsistenzprüfung: Automatisch generierte Fragen müssen in den bestehenden Pool passen
Quellennachweis: KI kann keine Quellen verifizieren — das muss der Mensch tun

Fazit

Qualitätssicherung von Lerninhalten ist ein systematischer Prozess, der fachliche Expertise, didaktisches Wissen und datenbasierte Analyse kombiniert. Die Investition in QA zahlt sich vielfach aus: durch bessere Lernergebnisse, fairere Prüfungen und weniger Nacharbeit.

Quellen und weiterführende Informationen:

Haladyna, T.M., Downing, S.M. & Rodriguez, M.C. (2002): „A Review of Multiple-Choice Item-Writing Guidelines.” Applied Measurement in Education, 15(3), S. 309-333.
Moosbrugger, H. & Kelava, A. (2020): Testtheorie und Fragebogenkonstruktion. 3. Aufl. Springer.
Allen, M.W. (2016): Michael Allen’s Guide to e-Learning. 2. Aufl. Wiley.
Crocker, L. & Algina, J. (2008): Introduction to Classical and Modern Test Theory. Cengage.