In dieser Woche werden wir den Begriff des kardinalen Nutzen (bzw. des „Neumann-Morgensternschen“ Nutzens) einführen und einige weitere Entscheidungsregeln kennen lernen, die auf diesem Nutzenkonzept beruhen. Aus didaktischen Gründen wird erst ein Beispiel besprochen, in dem bereits der kardinale Nutzen
Von den bisher besprochenen Entscheidungsregeln ist die Maximin-Regel wahrscheinlich die einleuchtendste und sinnvollste, aber wir haben auch schon ein Beispiel kennen gelernt, bei dem ihre Anwendung möglicherweise nicht sinnvoll wäre, und man kann weitere Beispiele konstruieren, bei denen das noch deutlicher der Fall ist, z.B. das folgende:
Nach der Maximin-Regel müsste die Entscheidung zugunsten der Handlung \(A_1\) ausfallen. Aber ist es sinnvoll, sich die Chance auf € 50.000 entgehen zu lassen, nur um einen möglichen Verlust von 25 Cent zu vermeiden? Wenn man nicht gerade eine Geschichte erfindet, bei der von diesen 25 Cent Leben und Tod abhängen, erscheint das mehr als zweifelhaft. Um Situationen wie dieser gerecht zu werden, gibt es eine Regel, die darauf zielt, „verpasste Chancen“ zu vermeiden. Diese Regel ist die Minimax-Bedauerns-Regel (wohlbemerkt: diesmal heißt es „Minimax“ nicht „Maximin“!). Bei dieser Regel leitet man von der ursprünglichen Tabelle zunächst eine Bedauernstabelle ab, die für jede Entscheidung und jedes möglicherweise eintretende Ereignis (bzw. jeden möglichen Weltzustand) die Größe der verpassten Chance beziffert. Dann wählt man diejenige Entscheidung aus, bei der die größtmögliche verpasste Chance am kleinsten ist. Die Einträge in der Bedauernstabelle erhält man, indem man jeden Wert in der Tabelle vom Maximalwert derselben Spalte abzieht. Für das Beispiel von eben würde die Bedauernstabelle dann so aussehen:
\(S_1\) | \(S_2\) | |
\(A_1\) | € 0 | € 49.998‚50 |
\(A_2\) | € 0‚25 | € 0 |
Das maximale Bedauern für die Handlung \(A_1\) würde also mit € 49.998‚50 zu beziffern sein, während bei der Wahl von \(A_2\) schlimmstenfalls ein Verlust von 25 Cent verschmerzt werden müsste. Um das maximale Bedauern zu minimieren, muss nach der Minimax-Bedauernsregel also die Handlung \(A_2\) gewählt werden.
Ähnlich wie die die Maximin-Regel kann man die Minimax-Bedauernsregel auch lexikalisch mehrfach hintereinander anwenden, wenn nicht gleich bei der ersten Anwendung eine eindeutige Entscheidung getroffen werden kann.
An dieser Stelle könnte jedoch ein Einwand erhoben werden: Beim Übergang von der Entscheidungstabelle zur Bedauernstabelle haben wir bestimmte Einträge in der Tabelle voneinander subtrahiert. Da es sich um Geldbeträge handelte, war das denkbar unproblematisch, denn jeder wird zugeben, dass man mit Geldbeträgen rechnen kann, und dass man sinnvollerweise davon sprechen kann dass € 3 dreimal so viel Wert sind wie € 1. Aber was ist, wenn wir es nicht mit Geldbeträgen, sondern wie zuvor mit ordinalen Nutzenwerten zu tun? Den vergleichsweise voraussetzungsarmen Begriff des ordinalen Nutzens haben wir ja gerade deshalb eingeführt, weil man mit anderen Werten als Geldbeträgen nicht unbedingt Rechnungen durchführen kann, selbst wenn sich die Größe des Wertes noch unterscheiden lässt. (Beispiel: Die meisten Menschen würden wohl zustimmen, dass Bier und Würstchen leckerer sind als Brot und Wasser, aber es wäre Unsinn zu sagen, sie sind genau dreimal so lecker.) Wenn wir eine Bedauernstabelle mit ordinalen Nutzenwerten berechnen würden, dann würde sich das Ergebnis, das bei der Anwendung der Minimax-Bedauerns-Regel herauskäme ändern, wenn wir die Nutzenwerte durch ordinal transformierte Nutzenwerte ersetzen, was bei einer robusten Entscheidungsregel nicht vorkommen sollte. Daher müssen wir entweder auf die Anwendung der Minimax-Bedauerns-Regel verzichten, oder wir dürfen sie nur dort anwenden, wo wir einen stärkeren Nutzenbegriff vorausetzen dürfen, wie er z.B. implizit den in den vorhergehenden Beispielen verwendeten Geldwerten zu Grunde liegt. Der schwächstmögliche stärkere Nutzenbegriff (stärker im Vergleich zum ordinalen Nutzen), der es uns erlaubt die Minimax-Bedauerns-Regel anzuwenden, ist der Begriff des kardinalen Nutzens.
Bevor wir jedoch auf den Begriff des kardinalen Nutzens eingehen, soll aber noch auf eine besondere Eigenschaft der Minimax-Bedauerns-Regel hingewiesen werden, die unter Umständen auch als ein Einwand gegen diese Regel begriffen werden kann: Die Minimax-Bedauerns-Regel verletzt nämlich – ebenso wie übrigens auf die Rangordnungsregel aus Kapitel – das Prinzip der paarweisen Unabhängigkeit oder auch „Unabhängigkeit von dritten Alternativen“.
Entscheidungstabelle | „Bedauerns“-tabelle | |||||||
\(A_1\) | 0 | 10 | 4 | \(A_1\) | 5 | 0 | 6 | |
\(A_2\) | 5 | 2 | 10 | \(A_2\) | 0 | 8 | 0 |
\(A_1\) | 0 | 10 | 4 | \(A_1\) | 10 | 0 | 6 | |
\(A_2\) | 5 | 2 | 10 | \(A_2\) | 5 | 8 | 0 | |
\(A_3\) | 10 | 5 | 1 | \(A_3\) | 0 | 5 | 9 |
Quelle: Michael D. Resnik: Choices. An Introduction to Decision Theory, Minnesota 2000, S. 31.
Die Alternative A3 hat nach der Minimax-Bedauerns-Regel keine Chance gewählt zu werden. Dennoch übt ihre Präsenz Einfluss darauf aus, welche der beiden anderen Handlungsalternativen nach der Minimax-Bedauerns-Regel gewählt wird. Ist die Alternative A3 abwesend, so ist die Handlung A1 nach der Minimax-Bedauerns-Regel die beste Handlung. Fügt man die Alternative A3 hinzu, so ist A2 die beste Handlung.
Sollte man die Abhängigkeit von dritten Alternativen als eine Schwäche der Minimax-Bedauerns-Regel ansehen? Das hängt wiederum sehr davon ab, in welchem Zusammenhang die Entscheidungsregel angewandt wird. Da das Prinzip besonders in der Sozialwahltheorie eine große Rolle spielt, dazu einige Beispiele:
Ihre Wahl zwischen Porsche und Mercedes ist also nicht unabhängig von dritten Alternativen, auch diese für Frau Schmitt sowieso nicht in Frage kommen, wie in diesem Fall der Rolls Royce.
Wenn man diese Argumentation akzeptiert, dann zeigt das Beispiel einmal mehr, dass die Annahme der Unabhängigkeit von dritten Alternativen, z.B. auf Grund solcher psychologischen Faktoren wie des Bedauerns, nicht immer zwingend oder auch nur glaubwürdig ist. Oder gäbe es vielleicht eine Möglichkeit, das Beispiel durch eine entsprechende Problemspezifikation, z.B. durch Einbeziehen des Bedauernsfaktors in die Konsequenz der Entscheidung, doch noch mit der Theorie zu vereinbaren? (Aufgabe !)
Vorgreifend auf die Sozialwahltheorie sei zur Illustration der möglichen Relevanz der Rangordnung von Präferenzen und damit auch der Relevanz von dritten Alternativen folgendes Beispiel diskutiert: Angenommen Napoleon habe die Präferenzen \(b \succ a \succ c \succ d \succ e\) und Josephine \(a \succ b \succ c \succ d \succ e\). Es sei weiterhin angenommen, dass Napoleon und Josephine sich darauf einigen müssten, ob sie gemeinsam \(a\) oder \(b\) wählen wollen, und dass Napoleon sich nach langwierigen Diskussionen schließlich durchgestezt habe sie gemeinasm \(b\) wählen.
Nun erhält Josephine eine Nachricht, die dazu führt, dass sie ihre Präferenzen dergestalt abändert, dass die Alternative \(b\) nun für sie an die letzte Stelle rückt, so dass sie nun die Präferenzen \(a \succ c \succ d \succ e \succ b\) hat.
Josephine teilt dies Napoleon mit, und bittet darum, auf Grund der geänderten Umstände die gemeinsame Entscheidung noch einmal zu überdenken. Napoleon antwortet ihr jedoch mit dem Hinweis auf das Prinzip der Unabhängikeit von „irrelevanten“ Alternativen, dass dies nicht erforderlich sei, da sich Josephines Präferenzen bezüglich \(a\) und \(b\) duch die neu eingetretenen Umstände nicht geändert hätten, so dass sie die Entscheidung zwischen \(a\) und \(b\) gar nicht beeinflussen dürften.
Sofern man Napoleons Antwort als unverschämt empfindet, ist dieses Beispiel ein Gegenbeispiel gegen die generelle Gültigkeit des „Prinzips des Unabhängigkeit von dritten Alternativen“. Das Beispiel zeigt, dass das Prinzip der Unabhängkeit von dritten Alternativen uns zwingt, von der Information über die Rangordnung der beiden zur Entscheidung anstehenden Alternativen innerhalb einer größeren Menge von Alternativen zu abstrahieren. Aber unter Umständen könnte diese Information wichtig sein, z.B. indem sie die Intensität einer Präferenz ausdrückt und sofern man der Ansicht ist, dass die Intensität der individuellen Präferenzen bei der Diskussion über gemeinsame Entscheidungen wie der von Napoleon und Josephine mitberücksichtigt werden sollte.
Man kann es auch so formulieren: Eine dogmatische Festlegung auf das Prinzip der Unabhängikeit von dritten Alternativen würde Entscheidungsprobleme wie das von Napoleon und Josephine aus dem Anwendungsbereich der Entscheidungstheorie ausschließen.
Wie man sieht können dritte Alternativen sehr wohl relevant für die relative Bewertung der anderen Alternativen sein. Insofern muss die Abhängigkeit von dritten („irrelevanten“) Alternativen nicht unbedingt als eine Schwäche der Entscheidungsregel aufgefasst werden. Aber es gibt andere Situationen, wo das durchaus der Fall sein kann, etwa bei Wahlen oder Abstimmungen, deren Ergebnis unter Umständen dadurch manipuliert werden könnte, dass man weitere, scheinbar irrelevante Alternativen zur Abstimmung stellt.
Der Grundgedanke der „Minimax-Bedauerns-Regel“ besteht darin, eine Entscheidung zu finden, bei der der maximal mögliche Verlust (je nach eintretenden Zufallsereignissen) minimiert wird. Da wir diese Regel auf ein Beispiel mit Geldwerten angewendet haben, konnten wir die Verluste relativ bedenkenlos als die Differenz zwischen entgangenem Gewinn und erhaltenem Gewinn bestimmen. Aber wie sollen wir eine solche Regel wie die „Minimax-Bedauerns-Regel“ anwenden, wenn die (möglichen) Ergebnisse eines Entscheidungsproblems keine Geldwerte sind? Die Ihnen zugeordneten Nutzenwerte spiegeln dann – nach dem Konzept des ordinalen Nutzens – nur eine Rangordnung zwischen den möglichen Ergebnissen des Entscheidungsprozesses entsprechend den Präferenzen wieder. Das Ergebnis der Anwendung einer Entscheidungsregel sollte also auch nur von der Rangordnung der Nutzenwerte nicht aber von den – solange die Ordnung erhalten bleibt – willkürlich wählbaren Zahlenwerten abhängen, die diese Ordnung auf einer Nutzenskala wiedergeben. Betrachten wir als Beispiel einmal folgende beiden Nutzenskalen, die den Ergebnissen \(x, y, z\) jeweils einen bestimmten Nutzen zuordnen. (x, y und z sollen dabei irgendwelche möglichen Resultate irgendeines Entscheidungsprozesses sein, z.B. könnten sie für die Resultate frustriert, gelangweilt, erfreut aus dem Beispiel auf Seite stehen.)
x | y | z | x | y | z | |||
Nutzenskala u() | 1 | 2 | 3 | Nutzenskala v() | 1 | 4 | 9 |
Beide Skalen geben offenbar denselben ordinalen Nutzen wieder, da \(u(z) > u(y) > u(x)\) und ebenso \(v(z) > v(y) > v(x)\). Betrachtet man allerdings die Differenzen, so fällt auf, dass \(u(z) - u(y) = u(y) - u(x)\), während \(v(z) - v(y) > v(y) - v(x)\). Würden diese Nutzenwerte bei einem Entscheidungsproblem auftauchen, so könnte es geschehen, dass man bei Anwendung der Minimax-Bedauernsregel je nachdem, ob man die Nutzenfunktion u oder die Nutzenfunktion v zur Darstellung der Präferenzen heranzieht, zu einer anderen Entscheidungsempfehlung kommt. Genau das dürfte aber nicht geschehen, da u und v nur unterschiedliche Darstellungen desselben ordinalen Nutzens sind. Welche Auswege könnte man sich aus dieser misslichen Situation denken:
Das, was wir eben eher intuitiv die „Stärke“ eines Nutzenkonzepts genannt haben, ist dadurch bestimmt, unter welcher Art von Transformationen man zwei Nutzenfunktionen als äquivalent, d.h. denselben Nutzen ausdrückend, betrachtet. (Man kann es also nicht den Nutzenfunktionen also solchen ansehen, ob sie einen ordinalen oder kardinalen Nutzen ausdrücken. Sondern erst durch den Vergleich von Nutzenfunktionen und der Festlegung der Bedingungen ihrer Äquivalenz oder Nicht-Äquivalenz wird dies bestimmt.) Beim ordinalen Nutzen wurden alle Nutzenfunktionen als äquivalent betrachtet, die durch „ordnungserhaltende“ Transformationen ineinander überführt werden können. „Ordnungserhaltend“ sind alle streng monoton steigenden Abbildungen. Der kardinale Nutzen ist nun dadurch definiert, dass zwei Nutzenfunktionen als äquivalent betrachtet werden, wenn man sie durch positive lineare Transformationen ineinander überführen kann. Positive lineare Transformationen sind alle Transformationen der Form:
\[u(x) = ax + b, \qquad a > 0 \]Man betrachte unter diesem Gesichtspunkt einmal die folgenden, in Tabellen dargestellten Nutzenfunktionen:
x | y | z | x | y | z | x | y | z | |||||
u() | 1 | 2 | 3 | v() | 1 | 4 | 9 | w() | 1 | 3 | 5 |
Alle drei Nutzenfunktionen geben denselben ordinalen Nutzen wieder, aber nur die Funktionen u und w geben denselben kardinalen Nutzen wieder, da \(w(x) = 2u(x)-1\). Weiterhin kann man sich leicht überlegen, dass zwei Nutzenfunktionen, die denselben kardinalen Nutzen darstellen, immer auch denselben ordinalen Nutzen repräsentieren, denn positive lineare Transformationen sind immer auch ordnungserhaltende Transformationen. Umgekehrt gilt dasselbe aber nicht, wie die Tabelle oben zeigt. Kardinale Nutzenskalen sind „feinkörniger“ als ordinale Nutzenskalen. Und sie erhalten, wie erwünscht nicht nur die Ordnung der Nutzenwerte sondern auch die Ordnung der Differenzen von Nutzenwerten, denn seien \(x‚y‚z‚w \in \mathbb{R}\) beliebige Nutzenwerte und sei \(u(x) = ax + b\) mit \(a‚b \in \mathbb{R}, a > 0\) eine positive lineare Transformation, dann: x - y & > & z - w
a(x-y) & > & a(z-w)
a(x-y) + b - b & > & a(z-w) + b - b
(ax + b) - (ay + b) & > & (az + b) - (aw + b)
u(x) - u(y) & > & u(z) - u(w) Dasselbe gilt, wenn man statt des Ungleichheitszeichens ein Gleichheitszeichen einsetzt, womit der Erhalt der Ordnung von Nutzendifferenzen unter positiv linearer Transformation bewiesen ist. Positive lineare Transformationen haben darüber hinaus die Eigenschaft, dass sie nicht bloß die Ordnung der Differenzen von Nutzenwerten erhalten, sondern auch die Quotienten der Differenzen:
Diese Eigenschaft wird später noch für uns wichtig werden wird. Erfüllt eine Skala, wie in diesem Fall die kardinale Nutzenskala, diese Eigenschaft, so nennt man sie auch eine Intervallskala. Zur besseren Übersicht sollen im folgenden kurz einige der wichtigsten Skalentypen aufgelistet werden, die in der Wissenschaft von Bedeutung sind.
Skalen dienen dazu abgestufte Größen darzustellen. Nun gibt es unterschiedliche Grade, in denen irgendwelche Größen abgestuft sein können. (Mit dem ordinalen und dem kardinalen Nutzen haben wir schon zwei unterschiedliche Abstufungsgrade kennen gelernt.) Diese unterschiedlichen Abstufungsgrade spiegeln sich in den verschiedenen Skalentypen wieder. Die Skalentypen sind dabei von gröberen zu immer feineren Skalentypen geordnet. (Vgl. zum folgenden [S. 73ff.]schurz:2006)
Das gröbste bzw. „niedrigste“ Skalenniveau, das man sich vorstellen kann, ist das einer Nominalskala. Bei einer Nominalskala wird die gegebene Größe lediglich in eine von mehreren begrifflichen Kategorien eingordnet, ohne dass zwischen diesen Kategorien eine Ordnung des Mehr- und Weniger besteht. Man spricht deshalb auch von „Kategorienskalen“ oder von „qualitativ-klassifikatorischen Begriffen“. Ein Beispiel wäre etwa die Zuordnung von Wirtschaftsunternehmen zu unterschiedlichen Wirtschaftssektoren wie a) Landwirtschaft, b) Handel und Industrie, c) Dienstleistung. Die einzigen Bedinungen, denen eine Nominalskala genügen muss, bestehen darin, dass die Kategorien 1. disjunkt (kein Gegenstand kann unter mehr als eine Kategorie gleichzeitig fallen) und 2. exhaustativ (jeder Gegenstand kann in mindestens eine Kategorie eingeordnet werden) sein müssen. Eine wie auch immer geartete Ordnungsbeziehung muss zwischen den Kategorien aber nicht bestehen. (Man kann ja auch z.B. kaum sinnvollerweise sagen, dass Dienstleistung „mehr“ oder „größer“ ist als Landwirtschaft. Allenfalls könnte man das von der Anzahl der Beschäftigten oder dem erwirtschafteten Umsatz in dem entsprechenden Sektor sagen.)
Das nächsthöhere Skalenniveau stellt die Ordinalskala (auch „Rangskala“) dar. Im Gegensatz zur Nominalskala werden hier die Merkmale bzw. die Objekte des Gegenstandsbereichs in „Ranggruppen“ eingeteilt, zwischen denen eine Höher- und Niedriger-Beziehung besteht. (Für die präzise Definition einer solchen Quasi-Ordnungs-Beziehung siehe Seite ) Außer dem nun schon bekannten ordinalen Nutzen, wäre ein weiteres Beispiel die Mohs-Skala aus der Mineralogie, bei der die Härte von Mineralien danach geordnet wird, welches Mineral welche anderen „ritzt“ [S. 75]schurz:2006.
Auf die Ordinalskala folgt in der Rangfolge die Intervallskala. Intervallskalen verfügen über eine mehr oder weniger willkürlich gewählte Maßeinheit. Weder die Maßeinheit selbst noch der Nullpunkt einer Intervallskala sind in irgendeiner Weise durch den Gegenstandsbereich festgelegt. Voraussetzung ist jedoch, dass die auf einer Intervallskala abgebildete Größe zahlenmäßig empirisch messbar ist. Die Maßeinheit erlaubt es dann, Differenzen und Quotienten von Differenzen der gemessenen Größe zu vergleichen. Beispiele sind denn auch Orts- und Zeitmessungen, denn ob man das Jahr 0 auf Christi Geburt oder auf den Zeitpunkt der Auswanderung Mohammeds nach Medina verlegt, ist eine Sache bloßer Konvention, genauso wie es eine Konvention ist, dass der Nullmeridian in Greenwich liegt. Trotzdem kann man Zeit- und Ortsdifferenzen sowie Quotienten von Differenzen vergleichen (eine Stunde ist solange wie jede andere und drei Stunden sind dreimal solange wie eine Stunde).
Die Verhältnisskala schießlich unterscheidet sich von der Intervallskala dadurch, dass nur noch die Maßeinheit willkürlich festgelegt ist, der Nullpunkt aber durch die Wirklichkeit vorgegeben ist. Beispiele dafür sind etwa Gewichtsskalen oder auch die Temperaturskala nach Kelvin, die den Nullpunkt auf den „absoluten Nullpunkt“ bei 273‚15 Grad Celsius verlegt. Auch Geldwerten liegt eine Verhältnisskala zu Grunde, denn der Nullpunkt (d.h. wenn jemand gar kein Geld hat) ist ja in naheliegender Weise vorgegeben.
Schließlich kann man von allen vorhergehenden Skalen noch die Absolutskala unterscheiden, bei der man verlangen müsste, dass auch die Maßeinheit selbst noch eine zwingende empirische Interpretation hat. Dergleichen ist aber im Grunde nur bei einfachen Zählskalen der Fall. Wenn man also z.B. von „drei Äpfeln“ spricht, dann hat die Zahl drei dabei einen ganz bestimmten empirischen Sinn und es ist nicht eine Frage der Konvention ob man drei oder zwei sagt, wie es eine Frage der Konvention ist, ob man eine Länge in Meter oder Fuß angibt.
Insgesamt ergibt sich also eine Abfolge von fünf Skalentypen:
Nominalskala < Ordinalskala < Intervallskala < Verhältnisskala < Absolutskala
Im Anschluss an diese Auflistung von Skalentypen stellen sich zwei naheliegende Fragen: Erstens: Sind das alle Skalentypen, die es gibt? Und zweitens: Wonach richtet sich, welchen Skalentyp man verwenden kann oder soll?
Was die erste Frage betrifft, so sind die aufgeführten Skalentypen natürlich längst nicht alle denkbaren Skalentypen. Einmal könnte man die Abfolge von Skalentypen sehr wohl noch weiter verfeinern. Dann gibt es, was noch wichtiger ist, neben den hier aufgeführten eindimensionalen Skalen auch mehrdimensionale Skalen. Zu diesen zählen beispielsweise Farbskalen bzw. Farbräume. Im RGB-Farbraum etwa wird jede Farbe durch ein 3-tupel des Rot-, Grün- und Blauwertes angegeben, aus denen die Farbe nach dem Prinzip der additiven Mischung zusammengesetzt ist.
Was die zweite Frage betrifft‚ so richtet sich die Verwendung eines bestimmten Skalentyps nach den empirischen Eigenschaften der auf der Skala abgebildeten Größe und nach den vorhandenen Messmethoden. So kann man die Länge deshalb auf einer Intervallskala messen, weil wir mit dem „Urmeter“ über einen entsprechenden Vergleichsmaßstab verfügen. Bei der Härtemessung von Materialen nach der Mohs-Skala gibt es keinen solchen Vergleichsmaßstab, so dass sie auch nicht auf einer Intervallskala, sondern nur auf einer Ordinalskala angegeben werden kann.
Besonders schwierig gestaltet sich die Suche nach geeigneten Messmethoden und damit die „Metrisierung“ (d.h. die Überführung von komparativen Begriffe in quantitative mittels geeigneter Messmethoden) in den Sozialwissenschaften. Denn während die verschiedenen Zahlenmengen von den natürlichen Zahlen bis hin zu den komplexen Zahlen geradezu dafür geschaffen scheinen, die Zusammenhänge auszudrücken, die die Naturwissenschaften untersuchen (dazu sehr eindrucksvoll Penrose [S. 51ff.]penrose:2004), weshalb man in diesem Bereich recht eigentlich sagen darf, dass die Mathematik die Sprache der Natur ist, lassen sich mathematische Gesetze für die Sozialwissenschaften vielfach nur unter erheblicher Strapazierung der Begriffe einspannen. Diese Schwierigkeiten begegnen uns auch beim Präferenzbegriff, denn während man die Annahme, dass es ordinale Präferenzen (soll heißen: Präferenzen, die durch ordinale Nutzenfunktionen beschrieben werden können) gibt, noch einigermaßen glaubwürdig rechtfertigen kann, und es zumindest vorstellbar erscheint, die Ordnung von Präferenzen durch Befragung oder Verhaltensbeobachtung halbwegs zuverlässig festzustellen, so ist dies bei der Annahme kardinaler Präferenzen nur unter Schwierigkeiten möglich. Wenn man aber annimmt, dass bei solchen Gegenständen, deren Wert sich durch Geld ausdrücken lässt (also bei „Waren“) der kardinale Nutzen einigermaßen mit dem Geldwert korreliert, dann erscheint die Annahme nicht ganz abwegig, dass es so etwas wie kardinale Präferenzen geben könnte.
Eine weitere Schwierigkeit, die mit der Beantwortung der Frage, welche Art von Skala man zur Nutzenmessung verwenden darf, noch gar nicht berührt ist, ist die ob Nutzenbewertungen immer nur jeweils für eine Person gültig sind, oder ob man auch die Nutzenwerte unterschiedlicher Personen untereinander vergleichen darf (intersubjektiver Nutzen). In Bezug auf solche Güter, deren Wert von den meisten Menschen gleich hoch geachtet wird (z.B. Gesundheit, Leben, Wohlstand, Jugend etc.) erscheint ein intersubjektiver Nutzenvergleich nicht abwegig. Ebenso erscheint ein intersubjektiver Nutzenvergleich bei Gütern möglich, für die soziale Institutionen existieren, die solche Nutzenvergleiche hervorbringen, wie das z.B. Märkte für Waren tun. Bei anderen Gütern mag das nicht immer möglich sein. Mit den beiden Unterscheidungen kardinaler Nutzen - ordinaler Nutzen und subjektiver Nutzen - intersubjektiver Nutzen ergeben sich insgesamt vier Arten von Nutzenkonzepten:
Skalentyp | |||
ordinal | kardinal | ||
subjektiver ordinaler Nutzen | subjektiver kardinaler Nuzen | ||
Vergleichbarkeit | intersubjektiver ordinaler Nutzen | intersubjektiver kardinaler Nutzen | |
Spiel- und entscheidungstheoretische Modelle kann man danach einteilen, welche Art von Nutzen sie voraussetzen. Die empirische Anwendbarkeit solcher Modelle hängt dann immer davon ab, ob man in einer gegebenen Anwendungssituation das vorausgesetzte Nutzenkonzept rechtfertigen kann oder nicht (was in der Regel wiederum eine Frage des Vorhandenseins zuverlässiger Bestimmungsmethoden der Nutzenwerte des vorausgesetzten Nutzenkonzepts in der gegebenen Anwendungssituation ist).
Für die Theorie- und Modellbildung ist der kardinale Nutzen deshalb so vorteilhaft, weil er es erlaubt, in einem gewissen Rahmen mit Nutzenwerten zu rechnen. Mit Hilfe des kardinalen Nutzenbegriffs können wir daher nicht nur endlich guten Gewissens die Minimax-Bedauerns-Regel anwenden, sondern gleich auch eine ganze Reihe weiterer Entscheidungsregeln erfinden. Eine davon ist die „Optimismus-Pessimismus“-Regel. Diese Regel funktioniert folgendermaßen: Zunächst legen wir einen Optimismusindex \(a\) fest, der zwischen 0 und 1 liegen muss. Dann wählen für jede Handlung (also aus jeder Zeile der Entscheidungstabelle) das beste und das schlechteste mögliche Ergebnis aus. Das beste Ergebnis können wir der Einfachheit halber mit \(MAX\) bezeichnen, das schlechteste nennen wir \(min\). Nun berechnen wir für jede Handlung eine Bewertung \(R_a\) („R“ wie „rating“) nach folgender Formel:
\[R_a = aMAX + (1-a)min \]Schließlich wählen wir diejenige Handlung aus, für die \(R_a\) am größten ist. Welche Handlung gewählt wird hängt dabei ganz wesentlich von der Wahl des Optimismusindex \(a\) ab. Aber das ist auch gewollt, denn bei dieser Entscheidungsregel geht es darum zuerst festzulegen, wie „optimistisch“ man sein möchte, und dann auf dieser Grundlage die eigentliche Entscheidung zu treffen. Die beiden Grenzfälle \(a=0\) und \(a=1\) entsprechen übrigens haargenau der letzte Woche besprochenen Maximin (\(a=0\)) und Maximax-Regel (\(a=1\)). Die Anwendung der Regel kann an folgendem Beispiel verdeutlicht werden:
S1 | S2 | S3 | |
A1 | 9 | 1 | 2 |
A2 | 5 | 6 | 3 |
Für a = 0.5 ergibt sich: & R_A1 = 0.5 9 + 0.5 1 = 5.0 &
& R_A2 = 0.5 6 + 0.5 3 = 4.5 &
Bei einem Optimismus-Index von 0.5 sollte also die Handlung A1 gewählt werden.
Für a = 0.2 ergibt sich dagegen: & R_A1 = 0.2 9 + 0.8 1 = 2.6 &
& R_A2 = 0.2 6 + 0.8 3 = 3.6 &
In diesem Fall sollte die Handlung A2 gewählt werden.
Die Handlungsempfehlung, die sich aus der Anwendung der Optimismus-Pessimismus-Regel ergibt, hängt wie zu erwarten von der Wahl des Optimismusindex ab. Auch wenn diese Wahl willkürlich ist, stellt sich doch die Frage, ob es ein Verfahren gibt, um die Wahl wenigstens sinnvoll zu treffen, oder anders formuliert: Woher weiss ich eigentlich wie optimistisch ich sein will? Ein Verfahren, das zu Bestimmung des Index vorgeschlagen worden ist, ist dieses (vgl. [S. 33]resnik:1987): Man nehme die folgende einfache Entscheidungstabelle, in welcher in der ersten Zeile die Nutzenwerte 0 und 1 (einer beliebigen kardinalen Nutzenskala) und in der zweiten Zeile in beiden Spalten ein unbekanntes Ergebnis x eingetragen worden ist:
S1 | S2 | |
A1 | 0 | 1 |
A2 | x | x |
Dabei soll diesmal die Frage nicht lauten, welche Handlung gewählt werden soll (um ein möglichst gutes Ergebnis zu erzielen), sondern es soll vielmehr schon vorgegeben sein, dass wir zwischen den Handlungen A1 und A2 indifferent sind. Nun müssen wir x genau so groß wählen, dass wir zwischen A1 und A2 tatsächlich indifferent sind. Haben wir x entsprechend gewählt, dann können wir daraus den Optimismus-Pessimismusindex ableiten, denn auf Grund der Indifferenz gilt: R_A1 & = & R_A2
a 1 + (1-a) 0 & = & a x + (1-a) x
a & = & x Was ist damit gewonnen? Wir haben auf diese Weise die Wahl des Optimismusindex aus der Wahl (bzw. Entscheidung im dezisionistischen Sinne) über die Indifferenz zwischen zwei Handlungsalternativen abgeleitet. Wenn man annimmt, dass es leichter ist, anzugeben, ob man zwischen zwei Alternativen indifferent ist, als die Frage zu beantworten, wie hoch man den eigenen Optimismus auf einer Skala zwischen 0 und 1 einschätzt, dann vereinfacht das die Wahl des Optimusmusindex. Wir hätten dann eine Willkürentscheidung auf eine andere zurückgeführt, die zu treffen uns möglicherweise leichter fällt.
Allerdings wirkt dieses Verfahren etwas gezwungen. Vor allem gibt es einen gravierenden Einwand: Die Frage wie optimistisch oder pessimistisch man entscheiden sollte, oder, was auf dasselbe hinausläuft, wie risikofreudig oder risikoavers man sich verhält, dürfte von den meisten Menschen hochgradig situationsspezifisch beantwortet werden. Insofern erscheint es äußerst fragwürdig, einen Optimismusindex, den man durch ein abstraktes Gedankenexperiment bestimmt hat, auf irgendeine konkrete Entscheidungssituation zu übertragen, der man möglicherweise ein ganz anderes Risikoverhalten zu Grunde legen möchte. Dann kann man sich das Gedankenexperiment besser gleich sparen und willkürlich bleibt die Entscheidung über den Optimismusindex ohnehin.
Dieses Willkürelement ist noch aus einem anderen Grund als dem der Schwierigkeit der Festlegung des Optimismusindex problematisch: Wenn eine Entscheidungsregel derartige Willkürelemente enthält, dann lädt sie geradezu dazu ein, zuerst die Entscheidung vollkommen intuitiv zu treffen, und sie erst im Nachhinein durch die Wahl eines geeigneten Index zu „rationalisieren“. Das könnte besonders dann problematisch werden, wenn die entscheidungtreffenden Personen anderen für ihre Entscheidung rechenschaftspflichtig sind, denn es lässt sich dann nicht mehr nachvollziehen, ob die Entscheidung tatsächlich „verantwortlich“ getroffen wurde.
Daneben ist die Optimismus-Pessimismus-Regel mit ähnlichen Schwierigkeiten behaftet, wie die Maximin und die Minimax-Bedauerns-Regel. Da sie jeweils nur zwei Werte jeder Zeile in das Kalkül einbezieht, lassen sich leicht Fälle konstruieren, in denen sie unplausibel erscheint:
\(S_1\) | \(S_2\) | \(S_3\) | … | \(S_{99}\) | \(S_{100}\) | |
\(A_1\) | 2 | 1 | 1 | \(\cdots \) | 1 | 0 |
\(A_2\) | 2 | 0 | 0 | \(\cdots \) | 0 | 0 |
In diesem Fall würde die Optimismus-Pessimismus-Regel immer zur Indifferenz zwischen beiden Handlungen führen, obwohl intuitiv die Handlung A1 sicherlich als die bessere beurteilt werden müsste.
Schließlich existiert noch ein weiterer Einwand, der auf einer etwas raffinierteren Konstruktion beruht, nämlich auf der sogenannten „Mischungsbedingung“ (mixture-condition), die – leicht vereinfacht – besagt: Wenn eine Person indifferent zwischen zwei Handlungsalternativen ist, dann ist sie auch indifferent zwischen diesen beiden Handlungen und einer dritten Handlung, die darin besteht, eine Münze zu werfen und bei „Kopf“ die erste Handlung und bei „Zahl“ die zweite Handlung zu wählen. Betrachten wir die folgende Tabelle:
S1 | S2 | |
A1 | 0 | 1 |
A2 | 1 | 0 |
Nach der Optimismus-Pessimismus-Regel herrscht zwischen beiden Handlunsalternativen völlige Indifferenz, und zwar unabhängig von der Wahl des Optimismusindex a. Fügt man nun die Münzwurfalternative hinzu, dann ergibt sich folgende Entscheidungstabelle:
S1 | S2 | |
A1 | 0 | 1 |
A2 | 1 | 0 |
A3 | \(\frac{1}{2}\) | \(\frac{1}{2}\) |
Angenommen der Optimismus-Pessimismus-Index wäre \(a = \frac{2}{3}\). Dann ergibt sich daraus: R_A1 & = 0 + 1 = & 2/3
R_A2 & = 1 + 0 = & 2/3
R_A3 & = + = Nach der Optimismus-Pessimismus-Regel müssten die Handlungen A1 und A2 der „Münzwurfalternative“ vorgezogen werden, unter Verletzung der Mischungsbedingung. Die Mischungsbedingung lässt sich nur erfüllen, wenn das beste und das schlechteste mögliche Ergebnis genau gleich gewichtet werden, d.h. bei einem Optimismusindex von \(a=\frac{1}{2}\).
Wie auch bei den denkbaren Einwänden gegen die anderen Entscheidungsregeln, lässt sich darüber streiten, ob die Verletzung der „Mischungsbedingung“ ein Nachteil oder, eher im Gegenteil, eine besondere Eigenschaft der Optimismus-Pessimismus-Regel ist. („It’s not a bug, it’s a feature!“) Wenn jemand optimistisch ist, dann besagt das ja gerade, dass die Person eher geneigt ist, an den Erfolg zu glauben als an eine 50:50 Chance von Erfolg und Misserfolg, so dass es nicht verwunderlich ist, dass sie eine Handlung, an deren Erfolg sie glaubt, einem Münzwurf vorzieht, von dem sie weiß, dass die Chancen gleichverteilt sind. Widersprüchlich wäre das optimistische (oder pessimistische) Verhalten bei der gegebenen Entscheidungstabelle aber immer noch insofern, als die Person eigentlich nur entweder an den mehr als 50%-igen Erfolg von S1 oder von S2 glauben dürfte, aber – sofern die Zustände S1 und S2 von den Handlungen unabhängig sind – nicht daran, dass sie in jedem Fall die höheren Erfolgschancen hat.
Wenn wir die Nutzenwerte als kardinale Nutzenwerte interpretieren und daher mit ihnen rechnen dürfen, wie das bei der Optimismus-Pessimismus-Regel der Fall ist, dann besteht eine der naheliegendsten Arten, die unterschiedlichen Handlungsalternativen in eine Rangordnung zu überführen, darin, einfach alle Zahlen in jeder Zeile aufzusummieren und die Handlungsalternative mit der höchsten Zeilensumme zu wählen. An einem Beispiel betrachtet sieht das Verfahren folgendermaßen aus:
\(S_1\) | \(S_2\) | \(S_3\) | \(S_4\) | \(S_5\) | \(\sum \) | |
\(A_1\) | 8 | 2 | -7 | 3 | 3 | 9 |
\(A_2\) | -5 | -3 | 5 | 12 | 4 | 13 |
In diesem Fall würde also die Handlung A2 gewählt werden, weil die Summe der erzielbaren Nutzenwerte größer ist als bei der Handlung A1. Werden die Nutzenwerte einer Zeile einfach aufsummiert, dann bedeutet das, dass sie alle gleich gewichtet werden. Dem Summierungsverfahren liegt damit implizit ein Prinzip zu Grunde, das man auch als das Prinzip der Indifferenz bezeichnet. Es besagt, dass wir alle Ereignisse als gleichwahrscheinlich betrachten sollten, solange wir nicht wissen, mit welcher Wahrscheinlichkeit eines von mehreren Ereignissen eintreten wird.
In diesem Zusammenhang ist noch einmal darauf hinzuweisen, dass ein subtiler Unterschied zwischen dem vom „Prinzip der Indifferenz“ erfassten Fall besteht, in dem wir nicht wissen, mit welcher Wahrscheinlichkeit ein bestimmtes Ereignis eintritt („Unwissen“), und dem vergleichsweise „harmloseren“ Fall, in dem wir bloß nicht wissen, welches Ereignis eintritt, aber über die Wahrscheinlichkeiten der Ereignisse auf Grund unserer Kenntnis des empirischen Vorgangs, um den es geht, genaue Aussagen machen können („Risiko“). Beim Würfeln oder bei einem Münzwurf etwa wissen wir auf Grund unser Kenntnis von Würfeln und Münzen, dass die verschiedenen möglichen Ereignisse gleichverteilt sind. Die Rechtfertigung dafür, dass wir beim Würfeln oder auch beim Werfen einer Münze von einer Gleichverteilung ausgehen, ergibt sich aus dieser Kenntnis. Dem Prinzip der Indifferenz liegt keine vergleichbare Rechtfertigung zu Grunde. Es handelt sich um ein philosophisches oder, wenn man so will, sogar metaphysisches Postulat, dessen Annahme keinesfalls zwingend ist (wohingegen die Annahme der Gleichverteilung von Würfelergebnissen oder Münzwürfen genauso zwingend ist, wie andere Aspekte der alltäglichen physischen Wirklichkeit, wie etwa, dass „morgens die Sonne aufgeht“, dass „dort eine Wand steht“ etc.).
Die auf dem Prinzip der Indifferenz beruhende Entscheidungsregel hat die Eigenschaft (wenn man so will: den Vorzug), dass sie sowohl die Mischungsbedingung erfüllt als auch Unabhängigkeit von irrelevanten Alternativen garantiert und selbstverständlich weiterhin dominierte Alternativen ausschließt. Trotzdem wird man in bestimmten Situation, z.B. in Situationen, in denen es vor allem darum geht, Schaden zu begrenzen, auf andere Entscheidungsregeln wie die Maximin-Regel zurückgreifen. Unter „Unwissen“ gibt es viele je nach Situation mehr oder weniger gute Entscheidungsregeln, aber keine eindeutig beste Regel.
Einwände gegen das Indifferenzprinzip werden häufig daraus abgeleitet, dass sich bei der Anwendung des Prinzips unter bestimmten Bedingungen Paradoxien ergeben. Was es damit auf sich hat, und ob diese Paradoxien ein Problem bei der Anwendung des Indifferenzprinzips bei den hier besprochenen Entscheidungen unter Unwissenheit darstellen, soll nun kurz erörtert werden.
Buch-Paradox: Das erste Paradoxon entsteht folgendermaßen: In der Uni-Bibliothek steht eine Ausgabe von Schopenhauers „Die Welt als Wille und Vorstellung“. Wenn jemand noch nicht in der Bibliothek war, dann weiß sie oder er nicht, ob das Buch einen blauen oder keinen blauen Umschlag hat. Nach dem Indifferenzprinzip müsste die Wahrscheinlichkeit dafür, dass das Buch einen blauen Umschlag hat \(P(blau)\) also 1/2 betragen. Aber mit genau demselben Argument kann gefolgert werden, dass \(P(rot)\), \(P(gelb)\), \(P(lila)\) etc. alle den Wert 1/2 haben. Damit haben wir eine Reihe von sich wechselseitig ausschließenden Alternativen, deren Wahrscheinlichkeiten sich auf eine Zahl größer 1 aufaddieren, was wiederum der Definition der Wahrscheinlichkeit widerspricht [S. 37f.]gillies:2000.
Wie könnte man das Paradox lösen? Denkbar wäre folgender Lösungsansatz: Wahrscheinlichkeiten dürfen nur unteilbaren Elementar-ereignissen zugewiesen werden. Soll heißen: Bevor man das Prinzip der Indifferenz anwendet ist zunächst sicherzustellen, dass sämtliche Ereignisse, auf die man es anwendet (vorbehaltlich unseres Wissens darüber) unteilbare Elementarereignisse sind. Im Fall des Buch-Paradoxons ist das Ereignis „nicht blau“ offenbar kein Elementarereignis, da wir wissen, dass noch andere Farben in Frage kommen. Nun stellt sich aber das weitere Problem, dass wir gar nicht wissen, wie viele andere Farben in Frage kommen. Der Lösungsansatz beinhaltet also, dass wir das Indifferenzprinzip überhaupt nur dann anwenden können, wenn wir zumindest die Menge der Elementarereignisse kennen. Ist das aber der Fall, so hilft uns das Indifferenzprinzip immerhin noch dabei, diesen Elementarereignissen in sinnvoller Weise Wahrscheinlichkeiten zuzuweisen, wenn uns deren objektive Wahrscheinlichkeiten unbekannt sind.
Wasser-Wein-Paradox: Leider funktioniert dieser Lösungsansatz nicht mehr bei den sogennanten „geometrischen Wahrscheinlichkeiten“, bei denen wir es statt mit diskreten (d.h. zählbaren) mit kontinuierlichen Größen zu tun haben, wie uns das Wasser-Wein-Paradox vor Augen führt. Bei diesem Paradox geht es um Folgendes [p. 84]howson:2000: Angenommen wir haben eine Mischung von Wasser und Wein, von der wir wissen, dass das Verhältnis von Wasser zu Wein bei dieser Mischung irgendwo zwischen „halbe-halbe“ und „doppelt soviel Wasser wie Wein“ liegt. Die unbekannte Menge des Wassers \(x\) liegt bezogen auf die gegebene Menge von Wein also irgendwo zwischen \(1\) und \(2\) (die Grenzen eingeschlossen). Und umgekehrt liegt der Mengenanteil des Weins \(w\) im Verhältnis zum Wasser irgendwo zwischen \(\frac{1}{2}\) und \(1\). Nach dem Indifferenzprinzip sollte die Wahrscheinlichkeit, dass die Wassermenge \(x\) zwischen \(1\) und \(\frac{3}{2}\) liegt, sicherlich genauso groß sein, wie die Wahrscheinlichekit, dass sie zwischen \(\frac{3}{2}\) und \(2\) liegt, also jeweils \(1/2\). Da der Weinanteil genau im umgekehrten Verhältnis zum Wasseranteil steht, also \(w = 1/x\), so ergibt sich daraus, dass die Wahrscheinlichkeit, dass \(w\) zwischen \(\frac{1}{2}\) und \(\frac{2}{3}\) bzw. zwischen \(\frac{2}{3}\) und \(1\) liegt, ebenfalls jeweils \(1/2\) betragen muss. Das ist aber mit dem Prinzip der Indifferenz unvereinbar, das ja fordert, dass die Wahrscheinlichkeit für gleich große Intervalle gleich groß sein muss.
Die Lösung dieses Paradoxons ist deshalb schwieriger als die des Buch-Paradoxons, weil die beiden Größen, die hier involviert sind, die relative Menge des Wassers \(x\) und die relative Menge des Weins \(w\) sich anders als „blau“ und „nicht blau“ vollkommen symmetrisch verhalten. Trotzdem ist eine Lösung denkbar, indem man die relativen Mengenangaben durch absolute Mengenangaben ersetzt. Beziehen wir die Wein- und die Wassermenge auf eine konstante Grundmenge von 6 Mengeneinheiten, dann liegt die Weinmenge zwischen 2 und 3 Mengeneinheiten und die Wassermenge zwischen 3 und 4 Mengeneinheiten. Die Schwankungsbreite betrifft dann sowohl für Wein als auch für Wasser ein Intervall von genau einer Mengeneinheit, so dass die Anwendung des Indifferenzprinzips wahlweise auf Wein oder auf Wasser zu keinen Widersprüchen mehr führen kann.
Diese Lösung des Paradoxons setzt allerdings ebenso wie die vorhergehende ein ontologisches Wissen über die Situation voraus, in der wir das Indifferenzprinzip anwenden. Dieses Wissen geht über die bloße Kenntnis der Anzahl der involvierten Parameter (zwei, nämlich \(x\) und \(w\)), ihres möglichen Wertebereichs (\([1, 2]\), \([\frac{1}{2}, 1]\)) und ihrer wechselseitigen Beziehung \(w = 1/x\) hinaus. Insofern ist die gefundene Lösung nicht mathematisch verallgemeinerbar. Wenn wir nur die rein mathematischen Beziehungen zwischen den beteiligten Größen betrachten, dann stehen wir – etwas vereinfacht betrachtet – vor dem Problem, dass wir das Prinzip der Indifferenz nicht gleichzeitig auf das Intervall \([a‚b]\) anwenden können (indem wir gleichgroßen Teilintervallen gleichgroße Wahrscheinlichkeiten zuweisen) und auf das Intervall \([\frac{1}{a}, \frac{1}{b}]\). Haben wir das Prinzip der Indifferenz schon auf das erste Intervall angewendet, dann haben wir automatisch eine Entscheidung damit getroffen, es nicht auf das zweite Intervall anzuwenden und umgekehrt. Rein mathematisch betrachtet, können wir aber gar nicht unterscheiden, ob \(a\) und \(b\) oder ob \(\frac{1}{a}\) und \(\frac{1}{b}\) die Basisgrößen sind, von denen wir auszugehen haben.
Inwiefern sind die hier besprochenen Paradoxien ein Problem für die Anwendung des Indifferenzprinzips auf Entscheidungen unter Unwissenheit? Hier sind zwei Situationen zu unterscheiden: