Ein neues Konzept für Prüfungen (Artikel vom Mai 2003)

Einleitung

Nachdem man aus der Schulzeit im Großen und Ganzen an mehr oder minder objektive Prüfungen gewöhnt war, bei denen die Bewertung nach vorher bekannten Schemata erfolgt (Punktesystem oder Anzahl der Fehler), wird man, sobald man an die Uni kommt, mit ganz verschiedenen Prüfungsstilen konfrontiert. Da gibt es einerseits wie in der Schule die schriftlichen Tests, die nach ähnlichen Schemata beurteilt werden; und andererseits die mündlichen Prüfungen, bei denen leider Gottes nicht alles ganz so objektiv zugeht.

Bei mündlichen Prüfungen an der Universität werden für gewöhnlich die Antworten auf die einzelnen Fragen mit den Noten 1 bis 5 beurteilt; das heißt, es kommt nicht nur darauf an, ob man richtig oder falsch antwortet, sondern auch, wie man sich dabei präsentiert. Gewöhnlicher Weise wird die Gesamtnote als arithmetisches Mittel der Noten auf die einzelnen Antworten berechnet. Diese Regel gilt jedoch nicht immer: denn es kann vorkommen, dass der Prüfer eine bestimmte Falschaussage oder auch ein Fehlverhalten (Beispiel: falsche Handhabe des Mikroskops) dem Kandidaten so übel nimmt, dass er dessen Note um einen oder mehrere Grade herabsetzt oder gar die Prüfung abbricht, was bedeutet, dass der Prüfling zu einem späteren Termin noch einmal antreten muss.

In jedem Fall ist eine mündliche Prüfung mit einer schriftlichen nicht zu vergleichen. Denn bei einem schriftlichen Test hat der Kandidat Zeit: Er kann sich in Ruhe alle Fragen ansehen, dann zuerst diejenigen beantworten, zu welchen ihm die Antwort sofort einfällt, und daraufhin die restlichen. Zudem hat er zu jeder Zeit die Möglichkeit, Korrekturen zu tätigen, falls er erkannt haben sollte, dass er sich geirrt hat.

In einer mündlichen Prüfungssituation steht der Kandidat hingegen ständig unter Zeitdruck. Er ist gezwungen, möglichst rasch und mit sicherem Auftreten, ohne zu stottern oder zu stammeln, auf die Fragen zu antworten, sind doch Zögerlichkeit und Zaghaftigkeit die hauptsächlichen Faktoren, die zu einer schlechteren Beurteilung führen. Wenn man sich unsicher ist, muss man abwägen, ob es besser sei, eine Weile nachzudenken und dann vielleicht die korrekte Antwort zu präsentieren (mit dem Risiko, dass der Prüfer wegen der Wartezeit verärgert sein und daher trotz richtiger Antwort die Note herabsetzen könnte), oder lieber sofort zu antworten, mit dem Risiko, dass die Antwort fehlerbehaftet sein könnte.

Aus diesen Überlegungen geht hervor, dass die Note, die jemand auf eine Prüfung bekommt, eben nicht nur vom Wissen und Können des Kandidaten abhängig ist, sondern auch von der Art der Prüfung. Ja, es ist durchaus vorstellbar, dass ein Student, der auf einen schriftlichen Test ein "Sehr gut" mit maximaler Punktezahl bekommen hat, durchgefallen wäre, wenn ihm dieselben Fragen im Rahmen einer mündlichen Prüfung gestellt worden wären (oder umgekehrt)!

Ich bin daher der Meinung, dass die Art und Weise, wie mündliche Prüfungen abgehalten und bewertet werden, überdacht werden sollte. Es sollte weniger das Auftreten des Kandidaten als sein tatsächliches Wissen und Können bewertet werden.

Ein weiteres Argument, warum das mündliche Prüfungswesen an den Universitäten in meinen Augen einer Reform bedarf, ist die Tatsache, dass es ineffizient ist. Man denke nur daran, wie oft es vorkommt, dass ein Professor einen Kandidaten mehr als eine Stunde lang prüft und ihn dann erst recht durchfallen lässt, weil es sich herausgestellt hat, dass er zwar viele Fragen beantworten kann, aber er in einigen essentiellen Belangen Wissenslücken aufweist. Wie viel Zeit dies doch sowohl den Professor als auch den Prüfling kostet, welche man für andere Zwecke (z.B. Forschen bzw. Studieren) verwenden könnte! Warum stellt man dem Kandidaten denn nicht gleich als Erstes die "Kardinalfragen", die er unbedingt richtig beantworten muss, und bricht die Prüfung nicht sofort ab, sobald sich zeigt, dass er dazu nicht im Stande ist?

Im Folgenden möchte ich mein Konzept für eine gerechtere und effizientere Gestaltung der mündlichen Prüfungen darstellen.

Konzept

Die Prüfung bestehe aus n Fragen. Es soll zwei Arten von Fragen geben: zum einen so genannte Kardinalfragen. Diese muss der Kandidat richtig beantworten, wenn er die Prüfung bestehen will. Die andere Art bezeichne ich als "reguläre Fragen". Zu ihnen gehört die Mehrzahl der Fragen, die in Prüfungen gestellt werden: Kann der Kandidat eine solche Frage beantworten, so ist dies ein Pluspunkt für ihn; kann er es nicht, so ist das aber nicht gleich Grund, ihm auf die Prüfung ein "Nicht genügend" zu geben. Der Kandidat soll auf die Antwort auf jede reguläre Frage eine Note erhalten; das arithmetische Mittel dieser Noten ergibt dann die Gesamtnote.

Die Prüfung soll mit einer Kardinalfrage K1 beginnen; wenn der Kandidat sie nicht korrekt beantwortet, soll die Prüfung sofort abgebrochen werden. Hat er jedoch die richtige Antwort gegeben, so soll ihm die nächste Kardinalfrage K2 gestellt werden usw. Erst nach der letzten Kardinalfrage sollen die regulären Fragen folgen.

Somit ist also bereits klar, warum mein Vorschlag effizient ist: Das Wissen über die wichtigsten Fakten oder Zusammenhänge wird zuerst überprüft; wenn es sich herausstellt, dass der Kandidat hier Mängel aufweist, so kann die Prüfung bereits nach nur wenigen Minuten abgebrochen werden.

Die Gerechtigkeit dieses Prüfungsmodus hängt nun von drei Parametern ab:

1. von der Anzahl der Fragen (n),

2. vom Verhältnis der Anzahl der Kardinalfragen zur Zahl der regulären Fragen (v = k / [n - k]) und

3. von der Notenskala, nach der die regulären Fragen beurteilt werden.

Ich möchte für einen speziellen Fall zeigen, dass mein Modus bei richtiger Wahl der Parameter das Kriterium der Gerechtigkeit erfüllt (das heißt, dass die Kandidaten die Note bekommen, die ihnen auf Grund ihres bei der Prüfung dargestellten Wissens und Könnens zusteht, und dabei das Auftreten eher im Hintergrund steht).

Beweis

Die Parameter seien folgendermaßen festgelegt:

n := 5
v := 2 / 3

Es gebe nur drei Noten: "Sehr gut" (1) für den Fall, dass der Kandidat die Frage umfassend und fehlerfrei beantwortet hat; "Gut" (2), falls der Kandidat die Frage im Großen und Ganzen richtig beantwortet hat; und "Nicht genügend" (5), wenn der Kandidat die Frage nicht zufrieden stellend beantworten konnte.

Daraus folgt, dass es insgesamt nur 12 mögliche Prüfungsverläufe gibt:

K1 falsch
=> 5 (Nicht genügend)

K2 falsch
=> 5 (Nicht genügend)

5, 5, 5
=> 5 (Nicht genügend)

5, 5, 2
=> 4 (Genügend)

5, 5, 1
=> 4 (Genügend)

5, 2, 2
=> 3 (Befriedigend)

5, 2, 1
=> 3 (Befriedigend)

5, 1, 1
=> 2 (Gut)

2, 2, 2
=> 2 (Gut)

2, 2, 1
=> 2 (Gut)

2, 1, 1
=> 1 (Sehr gut)

1, 1, 1
=> 1 (Sehr gut)

Wenn man sich die Bedingungen ansieht, unter denen ein Prüfling die Noten "nicht genügend" bzw. "genügend" bekommt, so sieht man, dass eine in der Mittelschule allgemein gültige Regel erfüllt ist: Man muss mindestens die Hälfte der Fragen richtig beantwortet haben, um eine positive Note zu erhalten (zwei Kardinalfragen sowie eine reguläre Frage). 

Die Wahrscheinlichkeitswerte, bestimmte Noten zu bekommen, lauten nun wie folgt:

5 (Nicht genügend):
3 / 12
= 0.25

4 (Genügend):
2 / 12
= 0.17

3 (Befriedigend):
2 / 12
= 0.17

2 (Gut):
3 / 12
= 0.25

1 (Sehr gut):
2 / 12
= 0.17

Die Wahrscheinlichkeit, die Prüfung mit einer bestimmten Note abzuschließen, ist also nicht für jede Note gleich groß. Das ist in der Mittelschule nicht anders, ist doch die theoretische relative Häufigkeit eines "Nicht genügend" stets höher als die irgend einer bestimmten anderen Note. Dass die Wahrscheinlichkeit eines "Gut" etwas höher ist als die eines "Genügend", "Befriedigend" oder "Sehr gut", ist meiner Meinung nach kein Schönheitsfehler, sondern eine für (ehrgeizige) Studierende sehr angenehme Sache. Immerhin gibt es ja an den hiesigen Universitäten die Möglichkeit, mit Auszeichnung (summa cum laude) zu promovieren; die Bedingung hierfür ist allerdings, dass man einen Notendurchschnitt von 1.5 oder besser hat, wobei man auf keine Prüfung eine schlechtere Note als ein "Gut" haben darf. Daher sind "Streber" darauf erpicht, Dreier und Vierer nach Möglichkeit zu vermeiden, und werden sich über ein Prüfungssystem freuen, in dem die Wahrscheinlichkeit, einen Zweier zu bekommen, relativ hoch ist. Dass die Wahrscheinlichkeit eines "Sehr gut" aber wieder etwas geringer ist, ist durchaus gerecht; denn mit dieser Note sollte sparsam umgegangen werden, suggeriert sie doch, dass der Student im jeweiligen Fach absolut kompetent sei.

Aus obigen Wahrscheinlichkeitsangaben ergibt sich folgender Erwartungswert:

1 / 12 * (3 * (5 + 2) + 2 * (4 + 3 + 1))
= 37 / 12
= 3.083

Nach den Regeln der Stochastik darf also ein durchschnittlicher Student die Note "Befriedigend" erwarten. Dies ist absolut gerecht, ist doch diese Note an sich eben für durchschnittliche Studierende vorgesehen.

Schlussbemerkungen

Dies war also die Idee, die mir in den letzten Tagen durch den Kopf gegangen ist. Ich bin schon gespannt, welche Reaktionen sie hervorrufen wird und ob sie an irgend einer Hochschule umgesetzt werden wird. Freilich habe ich nur für einen Spezialfall (für fünf Fragen) bewiesen, dass mein Vorschlag nicht nur effizient, sondern auch gerecht ist. Es ist mir klar, dass nicht der Stoff jeden Faches an Hand von nur fünf Fragen umfassend abgeprüft werden kann. Daher wird es notwendig sein, für jede mögliche Anzahl n der Fragen eine entsprechende Zahl von Kardinalfragen k (und damit Verhältnis v) sowie eine geeignete Notenskala zu finden, so dass die drei Bedingungen erfüllt werden, die einen gerechten Prüfungsmodus auszeichnen:

Mindestens die Hälfte der Fragen muss korrekt beantwortet werden, um eine positive Note zu erhalten.

Die Wahrscheinlichkeit, eine bestimmte Note zu bekommen, sollte für jede Note ungefähr gleich sein; für die Note "Nicht genügend" darf sie etwas höher als der Schnitt sein; auch für die Note "Gut" wäre eine etwas höhere relative Häufigkeit durchaus sinnvoll.

Der Erwartungswert solle rund 3.0 betragen.

Man könnte das Finden der besten Variablen mit Hilfe eines Computerprogramms leichter bewerkstelligen, welches an Hand der manuell eingegebenen Werte die Wahrscheinlichkeitswerte für die einzelnen Noten sowie den Erwartungswert errechnet. Falls Interesse besteht, könnte ich ein solches Programm erstellen.

Vielleicht findet sich aber auch ein Mathematiker, der allgemein gültige Formeln entwirft, nach welchen man die zu jedem beliebigen n am besten passende Zahl k sowie eine geeignete Notenskala errechnen lassen. (Falls ich Zeit finde, werde ich mich möglicherweise selber mit dieser Aufgabe beschäftigen.)

Was ich jedenfalls für sinnvoll hielte, wäre, wenn sämtliche Fragen aus einem vorher definierten und am besten sogar öffentlich zugänglichen Fragenpool gestellt würden. Dies wäre besonders in Hinblick auf die Kardinalfragen wichtig. Denn so würden die Studierenden motiviert werden, die hier abgeprüften essentiellen Fakten und Zusammenhänge genau zu lernen.

Nach dem derzeitigen System könnte es nämlich leider Gottes sehr wohl passieren, dass Studenten ganz bestimmte wichtige Dinge einfach nicht lernen, weil es nicht oder nur selten bei Prüfungen verlangt wird. Und dies könnte später, in der Praxis (besonders in kritischen Bereichen wie der Medizin!) fatale Auswirkungen haben.

Als Beispiel möchte ich eine Gegebenheit schildern, bei der ich selbst Zeuge war. Es handelte sich um eine Teilprüfung zum 1. Rigorosum nach dem Studienplan Medizin A201 an der Universität Wien; das Prüfungsfach war Anatomie. Die Kandidaten war für einen Ordinarius ausgeschrieben, von dem bekannt war, dass er besonders viel Wert auf die Anatomie des Nervensystems legte. Deshalb hatte sich die Rigorosandin zur Prüfungsvorbereitung entsprechend gründlich mit Neuroanatomie beschäftigt. Im Gespräch unmittelbar vor der Prüfung hatte ich den Eindruck, dass sie sich auf diesem Gebiet tatsächlich sehr gut auskannte und auch recht komplizierte Zusammenhänge erklären konnte.

Nun war es aber so, dass der Ordinarius an diesem Tag verhindert war und vertretungsweise ein junger, außerordentlicher Professor die Prüfungen abhalten sollte, auf den die Kandidatin freilich nicht eingestellt war. Und dieser stellte ihr tatsächlich keine einzige Frage aus Neuroanatomie, prüfte sie aber ganz wichtige Fakten von großer klinischer Relevanz ab: In welcher Vene fließt das Blut aus Schädel und Gehirn ab? Woher beziehen die Venen, welche in die Pfortader münden, die Nährstoffe? In welches Gefäß mündet die Vena umbilicalis? Da die Kandidatin unvermögens war, diese Fragen zu beantworten, wurde die Prüfung abgebrochen. Wer weiß, wie sie abgeschnitten hätte, wenn der Ordinarius an diesem Tag nicht verhindert gewesen wäre: Vielleicht hätte sie fast ausschließlich Fragen aus der Neuroanatomie bekommen und ein "Sehr gut" bekommen! Man stelle sich aber eine klinisch tätige Ärztin vor, die nicht weiß, welches Gefäß blockiert sein muss, wenn es bei einem Patienten zu einer intrakraniellen Blutstauung kommt, und daher nicht im Stande ist, geeignete Maßnahmen zu treffen, weil sie das Anatomie-Rigorosum bestanden hat, ohne gelernt zu haben, dass das Blut aus dem Kopf über die an der lateralen Seite des Halses verlaufende Vena jugularis interna in die Vena cava superior und damit ins Herz abgeleitet wird.

Ich jedenfalls würde, sollte ich je in die Situation kommen, Prüfungen abnehmen zu müssen, sämtliche Fragen den Studenten per Internet zugänglich machen; natürlich müsste der Fragenpool sehr groß sein (mindestens 1000 Fragen) und den ganzen Stoff abdecken, damit die Studenten angehalten werden, sich mit der Materie gründlich zu beschäftigen. Das wäre insbesondere sinnvoll, um sicher zu stellen, dass sich die Studierenden auf die Kardinalfragen vorbereiten würden. (Es würde vermutlich auch die Effizienz des Studien- und Prüfungswesens erhöhen, weil dann die Anzahl der Studierenden, die bei einer Prüfung durchfallen, weil sie in den essentiellen Wissensgebieten Mängel aufweisen, wahrscheinlich abnehmen würde.)

Natürlich bestünde die Gefahr, dass irgend ein Student die Fragen schriftlich beantworten und das Ergebnis seiner Arbeit in Form einer ausgearbeiteten Fragensammlung veröffentlichen würde, woraufhin etliche Studenten dazu übergehen würden, lediglich diese vorgefertigten Antworten auswendig zu lernen, anstatt sich den Stoff selbständig zu erarbeiten. Um dem vorzubeugen, würde es notwendig sein, regelmäßig neue, zusätzliche Fragen zu erfinden und die Website zu ergänzen.

Bei der Prüfung könnte der Prüfer dann mit einem Computerprogramm arbeiten, welches zuerst die Kardinalfragen, dann die regulären Fragen per Zufallsgenerator auswählt und auf dem Bildschirm anzeigt. Der Prüfer würde sich die Antworten des Kandidaten anhören und dem Programm per Mausklick mitteilen, ob sie korrekt waren bzw. welche Note er dem Prüfling auf die jeweilige Frage geben würde. Das Programm würde schließlich vollautomatisch die Gesamtnote berechnen und anzeigen.

Damit bestünde der einzige subjektive Faktor darin, wie der Prüfer die Antworten auf die einzelnen Fragen bewertet. Wenn es für die Kardinalfragen lediglich die Optionen "richtig" und "falsch" sowie für die regulären Fragen ebenfalls nur wenige Abstufungen gibt, z.B. wie im oben diskutierten Spezialfall "sehr gut", "gut" und "nicht genügend", dann wären der subjektive Faktor auf ein Minimum reduziert und die mündlichen Prüfungen wesentlich gerechter, als dies heute der Fall ist.

Kommentare

Beliebte Posts aus diesem Blog

The Demoscene

Digital Art Natives

Autobiographical Sketch