Thema 6/09

Zensuren – oder was?
Flexible Lösungen für eine alte Streitfrage

Annemarie von der Groeben

Zensuren sollen objektiv, transparent und gerecht sein – was sonst? Kritiker bezweifeln das und haben gute Argumente. Vorerst scheint die Macht der Zensuren ungebrochen zu sein. Aber unterhalb dieser Zahlen-Ebene entwickeln sich vielfältige Formen eines anderen, flexibleren Umgangs mit Leistungen. Sind wir auf dem Weg zu einer veränderten Unterrichts- und Bewertungskultur?

»Zensuren – oder was?« Wer so redet, kann ein Verteidiger der Noten sein, der diesen Satz als provokative Scheinfrage versteht: Es gibt keine vernünftigere Lösung für das Problem der Leistungsbewertung, also lasst uns bei der bewährten alten bleiben. Für einen Kritiker hingegen wäre die Lesart ganz anders: Die Unzulänglichkeit von Noten ist hinreichend bekannt, also lasst uns endlich nach vernünftigen Alternativen suchen.

Die gegenwärtige Situation in unseren Schulen scheint keinem von beiden Recht zu geben. Zensuren halten sich hartnäckig, ungeachtet aller Forschungsergebnisse, mit denen die Kritiker argumentieren. Zugleich mehren sich die Beispiele für einen anderen, flexibleren Umgang mit Leistungen. Der Wunsch, Kindern und Jugendlichen individuell gerecht zu werden, führt zu einem Reichtum an neuen Entwicklungen und neuen Formen der Leistungsbegleitung und -bewertung.

Wie ist dieser Widerspruch zu erklären?

Leistung – oder was?

Hier ein gedachtes Unterrichtsbeispiel. Jahrgang 5, im Biologieunterricht geht es um das Thema »Haustiere«. Die Kinder sollen den Körperbau einiger Tiere in Abhängigkeit von ihrer Umwelt und ihren Verhaltensweisen verstehen lernen, grundlegendes Wissen erwerben und die Bedeutung der Tiere für den Menschen reflektieren. Das zu erwerbende Wissen wird methodisch vielfältig angeboten, gesichert und vertieft, das erworbene Wissen mit einer Klassenarbeit abgeprüft.

In einer anderen Schule wird das gleiche Thema im gleichen Jahrgang als fächerverbindendes Projekt angelegt. Die Kinder führen ein Lesetagebuch zu einer gemeinsamen Lektüre, ordnen sich Spezialistengruppen zu, die später den anderen über »ihr« Tier berichten werden, schreiben eigene Geschichten, debattieren mit Experten über Tierschutz, besuchen ein Tierheim, üben ein selbst geschriebenes Theaterstück ein, in dem die Tiere zu Wort kommen. Am Ende steht eine Präsentation vor den Eltern mit einer Ausstellung, Vorträgen und einer Aufführung.

In beiden Fällen orientieren die Lehrkräfte sich und ihr professionelles Handeln an dem Ziel, die Schülerinnen und Schüler zu guten Leistungen zu befähigen. In beiden Fällen orientieren sie sich auch an Lehrplanvorgaben, an klaren Erwartungen und transparenten Bewertungskriterien. Beiden Unterrichtsmustern liegen jedoch unterschiedliche Vorstellungen zugrunde, was als Leistung zu werten ist, wie Lernprozesse im Hinblick darauf angelegt werden sollten, allgemein: was guter Unterricht ist. Darum sind auch in beiden Fällen die Leistungserwartungen und die Bewertungskriterien unterschiedlich.

Die unterschiedlichen Entwicklungstendenzen auf dem Gebiet der Leistungsbewertung und die widerstreitenden Argumente ihrer Befürworter sind also keineswegs Ausdruck eines vorübergehend aufflammenden Streits, der sich irgendwann von selbst erledigt, sondern liegen in der Natur der Sache und verweisen auf grundlegende Fragen. Im Kern steht die Doppelnatur jedes Lernens und jeder Leistung als individueller Prozess, der in der Regel zu einem nachweisbaren Ergebnis führt.

Leistung ist ein Prozess; wie kann dieser so angelegt werden, dass möglichst alle Schülerinnen und Schüler gute Leistungen erzielen können und wie kann dieser Prozess der individuellen Aneignung begleitet und gewürdigt werden? Wie können unterschiedliche Verstehenswege und Aneignungsformen im Unterricht angeboten werden? Welche Rolle spielen Eigenverantwortlichkeit und soziales Miteinander? Wie viel Freiraum soll es geben: für Umwege, für eigenwillige, unerwartete Lösungen, für »Querdenker«, für Kreativität und Imagination? Wie gehen wir mit Fehlern um? Was folgt aus alledem für die Leistungsbewertung?

Leistung wird am Ergebnis sichtbar: Was kann/muss von allen erwartet werden? Wer definiert diese Erwartungen? Wie wird der Prozess der Aneignung von vorab definierten Zielen abgeleitet und nach welchem Maßstab werden die Produkte bewertet?

Lehrerinnen und Lehrer werden ihren Unterricht sehr unterschiedlich gestalten und mit Schülerleistungen sehr unterschiedlich umgehen, je nachdem welche dieser Prioritäten sie höher gewichten. Was als Leistung im Unterricht angelegt und später bewertet wird, ist abhängig: nicht nur von gesellschaftlichen Erwartungen, gesetzlichen und inhaltlichen Vorgaben, sondern auch vom Selbstverständnis und Ethos der Schule, vor allem vom Selbstverständnis und der Verantwortung des einzelnen Lehrers, der einzelnen Lehrerin. »Leistung ist ein Konstrukt« (Winter 2000, S. 108), ein Ergebnis von Entscheidungen, die ihrerseits in einem umfassenden Kontext stehen. »Leistung ist niemals wertfrei oder objektiv, sondern konstituiert sich erst über den gemeinsamen Verständigungsprozess« (Bohl 2004, S. 28). Das gilt im erweiterten Sinne auch für die Leistungsbewertung. Es ist also nicht verwunderlich, dass die Diskussion darüber nicht verstummt.

Gerechtigkeit – oder was?

Auf dem Weg zur richtigen Schreibung gibt es bekanntlich Stufen, die von allen Kindern durchlaufen werden, jedoch in unterschiedlicher Verweildauer. Jahrgangsnormen sind Durchschnittswerte, denen die individuellen Entwicklungen oft keineswegs entsprechen. Angenommen, ein Kind mit schwachen Rechtschreibleistungen, das in einem Test-Diktat 25 Fehler machte, hat sich durch intensive Arbeit auf 15 verbessert und liegt damit immer noch unter der Note »ausreichend«. Ist es gerecht, diesem Kind seine Lernleistung und seine ausgewiesenen Fortschritte durch ein »Mangelhaft« zu quittieren?

Dieses schon fast abgegriffene Beispiel soll den bekannten Normenkonflikt in der Bewertung schulischer Leistungen beleuchten und damit ein weiteres Spannungsfeld. Gemessen an seinem Entwicklungsstand, also an der Individualnorm, hat das Kind eine gute Leistung gezeigt, gemessen an der Sachnorm jedoch eine mangelhafte. Wie es in seiner Klasse »steht«, hängt von deren Durchschnittsleistung ab, wird also nach einer Gruppennorm bewertet. Diese aber ist extrem kontextabhängig. Neuere Ergebnisse zeigen die Brisanz dieses Problems: Die in Hamburg durchgeführte LAU-Studie (Lehmann et al. 1997) hat ergeben, dass die guten Leistungen von Kindern in einem besonders belasteten Stadtteil in etwa den mit »mangelhaft« benoteten von Schülerinnen und Schülern aus einem Nobel-Vorort entsprechen. Diese Befunde sind seither durch weitere Studien erhärtet worden. Schon Schulanfänger weisen hinsichtlich ihrer Lern- und Leistungsentwicklung Unterschiede auf, die mehreren Jahren entsprechen. »Die Unterschiede in den Eingangsvoraussetzungen kovariieren mit sozialer und ethnisch-kultureller Herkunft« (Baumert 2006, S. 42). Diese Einflüsse werden durch ein selektives Schulsystem verstärkt. So »ergibt sich ein Syndrom von Kompositionsmerkmalen, das den Eindruck einer kumulativen Privilegierung oder Benachteiligung von Schulen erweckt« (ebd., S. 43).

Was folgt daraus für die Leistungsbewertung? Gerechtigkeit ist offensichtlich nicht so leicht zu haben und zu gewährleisten, wie es scheinen mag. Die Forderung, eine Drei müsse überall eine Drei sein, erweist sich angesichts solcher Befunde als naiv. Ist eine Deutschlehrerin ungerecht, die in einem belasteten Stadtteil unterrichtet und die sprachlichen Fortschritte und Leistungen von Schülern mit Migrationshintergrund mit einer guten Note bewertet, obwohl diese Ergebnisse von denen der Jahrgangsbesten aus anderen Schulen weit abweichen? Ist ein Sportlehrer gerecht, der eine bestimmte Laufleistung für die Note Drei festlegt und dabei den trainierten Läufer, der diese Leistung locker und ohne Anstrengung bringt, ebenso bewertet wie einen übergewichtigen und unbeholfenen Mitschüler, der sich angestrengt und sein Bestes gegeben hat?

Auch die Frage nach der Gerechtigkeit von Zensuren verweist also auf die viel grundsätzlichere, wie wir Kindern und Jugendlichen in ihrer Unterschiedlichkeit gerecht werden, ihr Lernen individuell begleiten, fördern und würdigen und die bestehende systemische Benachteiligung abbauen können.

Transparenz – oder was?

Mehr Bildungsgerechtigkeit durch transparente Vorgaben, Qualitätskriterien und Kontrollen – auf diese Kurzformel lassen sich die gegenwärtigen vielfältigen Anstrengungen der Bildungsadministration zur Umsteuerung des Systems bringen. Bildungs- und Lernziele werden in Form von abprüfbaren Kompetenzen definiert, für Hauptfächer gibt es Kernlehrpläne und Standards, für zentrale Lernstandserhebungen und Prüfungen Aufgaben und Bewertungsraster. Diese Instrumente und die ihnen zugrunde liegende Denkweise haben erhebliche Auswirkungen auch auf das alltägliche Unterrichtshandeln von Lehrerinnen und Lehrern und ihren Umgang mit Schülerleistungen.

Kritiker nennen vor allem drei Schwachpunkte:

  • Fragwürdigkeit der Tests: In einer Presseerklärung des Grundschulverbands heißt es über die Vergleichsarbeiten in Jahrgang 4: (1) der Zufall entscheide über Erfolg oder Misserfolg, (2) wesentliche Schulleistungen seien ausgeklammert, (3) einige Aufgaben seien pädagogisch skandalös (Bartnitzky 2005). Solche Tests sollen für mehr Transparenz sorgen, basieren aber ihrerseits auf nicht offen gelegten Voraussetzungen.
  • Ein verengtes Lern- und Leistungsverständnis: Nach der bekannten Definition von F.E. Weinert sind Kompetenzen »bei Individuen verfügbare oder durch sie erlernbare, kognitive Fähigkeiten und Fertigkeiten, um bestimmte Probleme zu lösen, sowie die damit verbundenen motivationalen, volitionalen und sozialen Bereitschaften und Fähigkeiten, um die Problemlösungen in variablen Situationen erfolgreich und verantwortungsvoll nutzen zu können« (Weinert 2001, 27 f.). Ein so komplexer Leistungsbegriff ist jedoch nicht oder nur teilweise in eine quantifizierende Testlogik überführbar. Anders gesagt: über wichtige Dimensionen der Leistung von Schülerinnen und Schüler gibt es in den Tests gerade keine transparenten Kriterien.
  • Die Entscheidung der KMK, Regelstandards anstatt der von der Expertengruppe um Klieme empfohlenen Mindeststandards einzuführen. Die Folge: Viele Schülerinnen und Schüler können die Standards nicht erreichen. Die neuen Verfahren spiegeln ihnen nach transparenten Kriterien, dass sie nicht mithalten können. Angesichts dieser Tatsache werden gegenwärtig neue Standards auf reduziertem Niveau entwickelt. Ob das zu mehr Bildungsgerechtigkeit führt oder diese Jugendlichen noch weiter marginalisiert, sei dahingestellt.

Die Einführung transparenter Vorgaben und Kontrollen hat also die pädagogische Diskussion keineswegs beruhigt oder gar beendet, sondern neu angefacht. Das gilt auch und besonders für die Zensuren. Ihre Verteidiger verweisen u. a. auf die Allokationsfunktion der Schule, die eine frühzeitige Einübung in gesellschaftliche Zuordnungen und Maßstäbe nahelege, sowie auf die Überlegenheit von Zensuren gegenüber stark personenabhängigen Alternativen wie den Lernberichten. Ihre Kritiker können bekannte Argumente mit neuen Befunden belegen: Zensuren seien nicht valide, nicht verlässlich, nicht objektiv, nicht vergleichbar, nicht fair (Arbeitsgruppe Primarstufe 2006).

Pragmatismus und pädagogischer Mut – Antworten der Praxis

In dieser sehr widersprüchlichen Szene können und müssen Schulen ihre Position neu klären. Sie können sich den staatlichen Maßnahmen nicht widersetzen. Viele von ihnen wollen das auch nicht. Andere hingegen gehen von einem umfassenden pädagogischen Leistungsverständnis aus und suchen nach alternativen Formen der Leistungsbegleitung und -bewertung in der Schulpraxis und
-forschung, die es reichlich gibt. Sie fordern nicht, Zensuren abzuschaffen, was gegenwärtig wenig Chancen haben dürfte, sondern entwickeln eine neue Kultur im Umgang mit Schülerleistungen.

In diesem Heft wird an Beispielen gezeigt, was möglich ist, wenn Schulen ihr pädagogisches Selbstverständnis in eine »andere« Kultur der Leistungsbewertung umsetzen und wie diese – trotz der Zensuren und neben ihnen – vor Ort entwickelt werden kann. Die Schulen sind sehr unterschiedlich, stimmen aber darin überein, dass sie sich eben diese Aufgabe zum Programm machen. Viele von ihnen fühlen sich einem Ethos der Inklusion verpflichtet, wollen also die Verschiedenheit der Schülerinnen und Schüler nutzen, um eine Didaktik zu entwickeln, die Individualisierung mit Systematik verbindet und alle Schülerinnen und Schüler »mitzunehmen« ermöglicht (v.d.Groeben 2008). Dazu gehören unterschiedliche Entwicklungsschwerpunkte, die in diesem Heft an Beispielen dargestellt werden.

Leistungsbewertung als intersubjektiver Prozess
Individuelle Lernberichte sind wohl die bekannteste Alternative zu Zensuren. Sie erlauben differenzierte Rückmeldungen, ein genaues Eingehen auf den Lernprozess und hilfreiche Empfehlungen. Sie stellen aber auch hohe Anforderungen und sind notwendigerweise subjektiv getönt. Das ändert sich, wenn dieses Verfahren intersubjektiv geöffnet und gesichert wird: Lernberichte werden im Team abgesprochen, sie richten sich an den Einzelnen und seine Lerngruppe und beziehen die Sicht der Schülerinnen und Schüler ein. Wolfgang Vogelsaenger berichtet über Erfahrungen einer Schule, die diese Verfahren ausgearbeitet hat.

Leistungsbewertung im Projektunterricht

Im Projekt ist der Prozess der Aneignung breit und vielfältig angelegt, ermöglicht und erfordert eigene Entscheidungen und eigenes Handeln, selbstständiges, selbst verantwortetes Lernen, Kooperation und ein gemeinsam präsentiertes Produkt. Diese Unterrichtsform stellt Lehrerinnen und Lehrer vor hohe Ansprüche. Das gilt auch für die Leistungsbewertung. »Sollen Projekte zensiert werden oder nicht?« (Bastian et al. 1980) Und wie soll das gehen, wenn alle Unterschiedliches tun und leisten? Sabine Geist zeigt am Beispiel eines Projekts, wie die Leistungsbewertung in das Projekt selbst einbezogen werden kann: durch gemeinsam entwickelte transparente Kriterien, durch das Feedback der Gruppe und individuelle Rückmeldungen der Lehrkraft.

Direkte Leistungsvorlage
Kritik an Zensuren bleibt folgenlos ohne konkrete Alternativen. Rupert Vierlinger hat das in seinem bekannten Buch »Leistung spricht für sich selbst« (1999) beispielhaft vorgeführt. Das Portfolio als Form der direkten Leistungsvorlage hat mittlerweile in vielen Schulen Einzug gehalten. Es betont die Eigenverantwortlichkeit der Schülerinnen und Schüler, macht Leistungsanforderungen und Rückmeldungen transparent. Das kann nur gelingen in einem Kontext veränderten Lernens. In einem Gespräch zwischen Felix Winter und Ulrike Michalsen-Burkardt wird sichtbar, wie ein Entwicklungsprozess verlaufen kann, wenn eine Schule sich auf diesen Weg begibt.

Beteiligung von Schülerinnen und Schülern an der Leistungsbewertung
Wenn wir zu Selbstständigkeit, Mündigkeit und Verantwortung erziehen wollen, muss das Folgen für die Unterrichtsgestaltung haben. Vor allem können wir den so wichtigen Bereich der Leistungsbewertung nicht aussparen. Renate Buschmann zeigt in ihrem Beitrag, wie Schülerinnen und Schüler sich zunehmend bewusst und nach transparenten Kriterien um einen gerechten und fairen Umgang mit Leistungen bemühen, wenn ihnen diese Verantwortung zugestanden und zugemutet wird.

Individuelle Förderung und Leistungsbewertung
Schülerinnen und Schüler mit besonderen Lernproblemen können erfolgreich in »normale« Lerngruppen integriert werden, wenn sie besondere Hilfen bekommen. Wie aber sollen ihre Leistungen bewertet werden? Sie möchten »ganz normal« behandelt werden. Normal sind Zensuren. Die aber verdecken entweder ihre Lernprobleme oder entmutigen die Schülerinnen und Schüler. Wie können Lehrerinnen und Lehrer mit diesem Konflikt umgehen? Der Beitrag von Martina Löser zeigt, warum eine konsequente Individualisierung eigene Formen der Bewertung nach sich ziehen muss.

Prozessorientiertes Lernen und Bewerten
Der Hintergrundbeitrag von Thorsten Bohl, Margarete Dieck und Andreas Papenfuß zeigt an Unterrichtsbeispielen, wie sich Prioritäten der Bewertung ändern, wenn Lernprozesse auf konstruktive Problemlösungen angelegt sind und nicht auf Reibungslosigkeit. Der Begriff Transparenz erfährt dabei eine neue Konkretisierung: Schülerinnen und Schüler reflektieren diesen Prozess nach transparenten Kriterien. Ein Überblick über aktuelle Forschungsbefunde ergänzt diese Beispiele. Es wird deutlich, dass alternative Formen der Leistungsbewertung einer anspruchsvollen Fachdidaktik, die auf problemlösendes Denken zielt, nicht abträglich sind, sondern im Gegenteil zur Gelingensbedingung eines solchen Unterrichts werden.

Fazit: Lob der Vielfalt

In der Frage der Leistungsbewertung scheint die Zeit des Schwarz-Weiß-Denkens (hier: traditionelles Pauken und Zensuren – dort: neue, offene Lernformen und pädagogische Alternativen zu Zensuren) vorüber zu sein. Gefragt sind Individualisierung und Systematik, hohe Leistungsanforderungen und Vielfalt der Lernwege, transparente Kriterien der Leistungsbewertung und individuelle Rückmeldung, Diagnostik und Beratung.

Die Praxis ist reich an solchen Formen, die Schulforschung bestätigt ihre Notwendigkeit, ihre Anwendung reicht mittlerweile bis zu den offiziellen Abschlussprüfungen (Beispiel: Projektprüfungen). Noch sind das nur vereinzelte Beispiele, noch sind die vorherrschenden Formen der Leistungsbewertung und Evaluation im Vergleich zur pädagogischen Praxis starr, einseitig produktorientiert und auf Zahlen fixiert. Ob und wie sich das ändert, ob und wie unser Schulsystem lernen kann, bleibt abzuwarten.

Literatur

  • Arbeitsgruppe Primarstufe (2006): Sind Noten nützlich und nötig? Ziffernzensuren und ihre Alternativen im empirischen Vergleich. Grundschulverband e. V. Frankfurt
  • Bastian, J./Petram, E./Affelt, M./Gessert, R. (1980): Sollen Projekte zensiert werden oder nicht? Lehrer diskutieren. In: Westermanns Pädagogische Beiträge H. 3/1980, S. 116 – 119
  • Baumert, J.: Was wissen wir über die Entwicklung von Schulleistungen? In: PÄDAGOGIK H. 4/2006, S. 40 – 46
  • Bohl, T. (2004): Prüfen und Bewerten im Offenen Unterricht. Weinheim/Basel
  • von der Groeben, A. (2008): Verschiedenheit nutzen. Besser lernen in heterogenen Gruppen. Berlin
  • Lehmann, F. H. et al. (1997): Aspekte der Lernausgangslage von Schülerinnen und Schülern der fünften Klassen an Hamburger Schulen. Hamburg
  • Vierlinger, R. (1999): Leistung spricht für sich selbst. Direkte Leistungsvorlage (Portfolios statt Ziffernzensuren und Notenfetischismus). Heinsberg
  • Weinert, F. E. (Hg.) (2001): Leistungsmessung in Schulen. Weinheim/Basel
  • Winter, F. (2000): Die »Gretchenfrage«. Wie halten wir es mit der Leistungsbewertung? In: Böttcher, W./Philipp, E. (Hg.): Mit Schülern Unterricht und Schule entwickeln. Weinheim/Basel

Dr. Annemarie von der Groeben, Jg. 1940, war bis 2006 didaktische Leiterin der Bielefelder Laborschule. Sie ist Mitglied der Redaktion von PÄDAGOGIK und unter anderem für den Bildungsverein Tabula e. V. tätig.
Adresse: Ellerstr. 29, 33615 Bielefeld
E-Mail: annemarie.groeben(at)uni-bielefeld.de


Aus: Pädagogik 6/2009