Bielefelder Lehrer*innenbildung
Betreuende*r Dozent*in: Prof. Dr. Gisela Lück
Studiengang: GymGe
Studienprojektvariante: Forschung über die eigene unterrichtspraktische Tätigkeit
Methodische Umsetzung: quantitativ/qualitativ
Forschungsfrage
Welche Qualität haben S*S-Selbsteinschätzungen betreffs der fachlichen Leistungsfähigkeit?
Im Rahmen schulischer Diagnostik stellt S*S-Selbsteinschätzung ein interessantes und bisher weniger beachtetes Instrument dar. Das Studienprojekt vergleicht die Selbsteinschätzung von 9 S*S eines Chemieleistungskurses im JG 13 mit dem Ergebnis eines fachlichen Tests sowie mit der Fremdeinschätzung (der regulären Lehrkraft und des*r Praxissemesterstudierenden).
Als Ergebnisse zeigen sich nur geringe Unterschiede zwischen den Selbst- und Fremdeinschätzungen, aber große Überschätzungen in Bezug auf den Test. Dabei zeigt sich die Fremdeinschätzung sogar noch positiver, weicht also höher vom Test ab.
Fokussiert auf den Vergelich einzelner Fälle zeigen sich zum Teil sehr niedrige und zum Teil sehr hohe Abweichungswerte, die jedoch nicht weiter interpretiert wurden. In qualitativer Richtung werden stattdessen Einschätzungstypen charakterisiert, die erstaunlicherweise keine Korrelation mit den erbrachten Leistungen oder dem Geschlecht aufweisen.
Ein Diagnoseanspruch ist gesetzlich verankert und zudem ein wichtiges Prinzip einer gut umgesetzten Didaktik (Ingenkamp et al. 2008). Demgegenüber steht ein überraschend unterentwickeltes Forschungsfeld. In der Schule wird meist formativ und zur Bewertung statt summativ und zur Förderung diagnostiziert (Paradies et al. 2005). Das Studienprojekt stellt in dieser Lücke einen Beitrag dar, indem es mit der S*S-Selbsteinschätzung - gegenüber der wohl am weitest verbreiteten Lehrkraftfremddiagnose - eine Alternativmethode untersucht.
Forschungsmethode: Mischformen aus quantitativen und qualitativen Verfahren
Es wurde zu einem Zeitpunkt die S*S-Selbsteinschätzungen (Chemie, Jg. 13, n=9) und die Fremdscheinschätzungen erhoben. Direkt im Anschluss wurde ein fachlicher Test (Thema organische Chemie) bearbeitet.
Es erfolgte der Vergleich der drei erhobenen Dimensionen. Besonderes Augenmerk lag dann auf der Gesamtabweichung und einer differenzierten Darstellung, in der positive und negative Abweichungen verrechnet wurden.
Des weiteren wurden auch Fallanalyse und eine Einteilung in Einschätzungstypen (überschätzt, gemischt, unterschätzt) vorgenommen.
Der Test ist schlecht ausgefallen. Nur drei Personen konnten knapp die Hälfte der Punkte erreichen. Erklärungsansätze sind hier in den unterschiedlichen Operatoren und einer unausgewogenen Bepunktung der Teilaufgaben zu sehen.
Die Abweichungen der Testleistungen zu beiden Einschätzungensformen (Lehrkraft und Praxissemesterstudierenden wurden zusammengefasst) sind hoch. Die Fremdeinschätzung zeigt eine größere Überschätzung als die Selbsteinschätzung. Beide Einschätzungen zeigen in der Gesamtabweichung von der dritten Dimension des Testes einen marginalen Unterschied von 2% auf.
Diese Befunde führten zu einer Diskussion der Abbildungskraft von fachlichen Tests. So lässt sich zusammenfassend lediglich festhalten, dass die Selbsteinschätzung zwar anhand der Testergebnisse gemessen weniger verlässlich (67% Abweichung), anhand der Fremdeinschätzung gemessen jedoch höher verlässlich (43% Abweichung) sind.
Die erstellten Falltypen (unterschätzt - Mischtyp - überschätzt) zeigen variable Ergebnisse, je nachdem welche der drei Größen miteinander verglichen wird. Geschlechter- oder Leistungsspezifische Tendenzen lassen sich hier nicht feststellen.
Die Vorarbeit im VPS ist hier zu betonen. Dort war nicht nur eine Projektskizze, sondern eine kurze Hausarbeit anzufertigen. Dabei paarte sich eine gute Ausarbeitung mit glücklichen - weil wenig beschränkenden - Umständen an der Schule, sodass das dort anvisierte Vorhaben durchgeführt werden konnte.
Die Forschungsergebnissen (s.o.) haben überrascht - ich hätte nicht mit einer großen Übereinstimmung gerechnet. So bin ich fest entschlossen Selbsteinschätzung als Diagnoseinstrument einzusetzen! In diesem Studienprojekt habe ich zudem viel wichtige Erfahrungen über das Test(aufgaben)erstellen gelernt. Wie leicht der Schwierigkeitsgrad zu verändern ist und wie schwer die Wahl des geeigneten ist.
Erhebungsmethodisch bin ich auf das Problem gestoßen, für eine Qualitätsaussage einen Maßstab zu finden. Spiegelt der Test die "wirklichen" Fähigkeiten der S*S wieder? Oder haben sie vielleicht einen schlechten Tag und die Fremdeinschätzung ist valider? Im Prinzip (und das habe ich diskutiert) wäre hier am ehesten ein imaginärer Mittelwert aller drei Größen zu berechnen.
Czikszentmihalys, M. (2005): Das Flow-Erlebnis: Jenseits von Angst und Langeweile: Im Tun aufgehen. Stuttgart: Klett-Cotta.
Ingenkamp, K. & Lissmann, U. (2008): Lehrbuch der pädagogischen Diagnostik. Weinheim: Beltz.
Paradies, L.; Wester, F. & Greving, J. (2005): Leistungsmessung und -bewertung. Berlin: Cornelsen.
Weide, H. (2011): Mit Heterogenität umgehen: Erfahrungen im Einsatz von Diagnosetests und Selbstdiagnosebögen in der Einführungsphase der gymnasialen Oberstufe. In: Unterricht Chemie, 22, 124/125, 20-25.