Rasch / IRT

Fragebögen, Tests und Skalen in den Sozialwissenschaften enthalten oft komplexe Strukturen. Doch wie genau messen diese Instrumente wirklich das, was sie messen sollen? Die Antwort darauf liefern Zuverlässigkeitsmodelle, insbesondere das Rasch-Modell und die Item-Response-Theorie (IRT). Diese Methoden gehen über die klassische Testtheorie hinaus und ermöglichen eine wissenschaftlich fundierte Bewertung der Messqualität.

 

  1. Was sind Rasch und IRT?

IRT (Item-Response-Theorie) ist eine Modellfamilie, die die Antworten von Personen auf Testitems analysiert, um sowohl die Fähigkeit der Person als auch die Schwierigkeit der Items zu schätzen.

Das Rasch-Modell ist eine spezielle, vereinfachte Form der IRT, die nur die Item-Schwierigkeit und die Personenfähigkeit berücksichtigt. Es wird häufig in der Bildungs- und Psychologieforschung eingesetzt.

 

  1. Unterschiede zur klassischen Testtheorie (CTT)
MerkmalKlassische Testtheorie (CTT)IRT / Rasch
ItemanalyseAuf GruppenebeneAuf Itemebene
ReliabilitätTestspezifischItemspezifisch
Item-SchwierigkeitFixPersonenabhängig
FlexibilitätGeringHoch (z. B. adaptive Tests)

 

  1. Wie funktioniert das Rasch-Modell?

Das Rasch-Modell berechnet die Wahrscheinlichkeit einer richtigen Antwort basierend auf dem Unterschied zwischen der Fähigkeit einer Person und der Schwierigkeit eines Items.

Grundannahme:
„Die Wahrscheinlichkeit einer richtigen Antwort hängt ausschließlich von der Fähigkeit der Person und der Schwierigkeit des Items ab.“

Das ermöglicht:

  • Skalen, die unabhängig von der Stichprobe sind
  • Vergleichbarkeit von Items über verschiedene Gruppen hinweg
  • Mehr Objektivität in der Messung

 

  1. IRT-Modelltypen

IRT bietet über das Rasch-Modell hinaus weitere Modelle mit zusätzlichen Parametern:

  • 1-Parameter-Modell (Rasch): Item-Schwierigkeit
  • 2-Parameter-Modell: Item-Schwierigkeit + Trennschärfe
  • 3-Parameter-Modell: Zusätzlich Ratewahrscheinlichkeit

Diese Modelle werden u. a. in Prüfungsanalysen, psychometrischen Tests und Leistungsbewertungen eingesetzt.

 

  1. Einsatzbereiche in den Sozialwissenschaften
  • Skalenentwicklung und Validierung
  • Kalibrierung psychologischer Tests
  • Individuelle Leistungsbewertung im Bildungsbereich
  • Itemanalyse und Optimierung in Umfragen

 

  1. Fazit

Rasch und IRT sind leistungsstarke Werkzeuge für Forschende, die die Messqualität in den Sozialwissenschaften verbessern möchten. Mit diesen Methoden testen Sie nicht nur „wie viel“ Sie messen, sondern auch „wie genau“. Die Einbindung solcher Analysen in Ihre Abschlussarbeit erhöht deren wissenschaftliche Tiefe und Glaubwürdigkeit erheblich.

Kontaktieren Sie uns!

Benötigen Sie eine Rasch- / IRT-Analyse?

Kontaktieren Sie uns über unsere Kontaktseite für Forschungsdesigns und Analysen, die je nach Ihren Bedürfnissen mit Datambar-Expertise erstellt werden.