Skip to content

Latest commit

 

History

History
1578 lines (1342 loc) · 81 KB

arbeit.md

File metadata and controls

1578 lines (1342 loc) · 81 KB

Einleitung

Kitcher verfolgt in seiner Arbeit "Explanatory Unification and the Causal Structure of the World" [@Kitcher1989] das ambitiöse Ziel, den Begriff der Kausalität auf einen von ihm entwickelten Begriff der Vereinheitlichung zurückzuführen. In dieser Arbeit werde ich versuchen, eine konkrete Fassung dieses von Kitcher nur skizzierten Programms zu entwickeln. Eine wichtige Grundlage dieser konkreten Fassung wird die Kausaltheorie der minimalen Theorien sein, wie sie von @Baumgartner2004 beschrieben werden. Es wird sich zeigen, dass diese Kausaltheorie kompatibel ist mit Kitchers Programm, und unter gewissen Annahmen direkt aus Kitchers Ansatz folgt.

Kitchers Programm

Kitcher identifiziert zwei Hauptansätze, um die Probleme von Hempels covering-law-Modell der Erklärung zu lösen. In einem Ansatz wird auf den Begriff der Kausalität zurückgegriffen, im anderen auf den Begriff der Vereinheitlichung [@Kitcher1989, 419, 430]. Im ersten Ansatz ergibt sich eine sehr einfache Lösung zweier wichtiger Probleme Hempels, nämlich des Problems der Asymmetrie und des Problems der irrelevanten Faktoren. Allerdings handelt man sich damit laut @Kitcher1989 [420, 460] den epistemisch problematischen Begriff der Kausalität ein. Im zweiten Fall muss man nicht auf epistemisch problematische Konzepte zurückgreifen, hat aber vorerst einige Mühe, die Probleme der Asymmetrie und der irrelevanten Faktoren angemessen zu behandeln [@Kitcher1989, 420, 459].

Dieses epistemische Problem des Begriffs der Kausalität ist nach Kitchers Beschreibung ein empirisches Problem, in dem Sinn, dass wir beobachtbare, hinreichende und notwendige Bedingungen brauchen, um auf eine kausale Beziehung zwischen zwei Ereignissen schliessen zu können [@Kitcher1989, 460]. Das heisst, entweder der Begriff der Kausalität selbst, oder zumindest eine Methodik des kausalen Schliessens muss auf beobachtbare Konditionen zurückgeführt werden, um dieses epistemische Problem zu lösen.

Kitcher will auf den Begriff der Kausalität verzichten und aufzeigen, wie die Probleme der Asymmetrie und der irrelevanten Faktoren durch das Konzept der Vereinheitlichung gelöst werden können [@Kitcher1989, 430]. Kitcher vermutet jedoch einen engen Zusammenhang zwischen Vereinheitlichung und Kausalität. Er denkt, dass sein Programm der Erklärung durch Vereinheitlichung zur Kenntnis der kausalen Abhängigkeiten der Welt führt:

I have been trying to show that we can make sense of scientific explanation and our view of the causal structure of nature without indulging in the metaphysics. The aim has been to develop a simple, and, I think, very powerful idea. The growth of science is driven in part by the desire for explanation, and to explain is to fit the phenomena into a unified picture insofar as we can. What emerges in the limit of this process is nothing less than the causal structure of the world. [@Kitcher1989, 500]

Weiter vorne im Text erwähnt er eine Möglichkeit, wie dies aussehen könnte, auf die ich mich in meiner Arbeit konzentrieren will:

A successful analysis of explanation might be used directly to offer an analysis of causation -- most simply, by proposing that one event is causally dependent on another just in case there is an explanation of the former that includes a description of the latter. [@Kitcher1989, 420]

These

\label{These}

Aufgrund der gegeben Interpretation von Kitchers Programm, stellen sich direkt die folgenden zwei Fragen, die zum genauen Verständnis der These dieser Arbeit unbedingt unterschieden werden müssen.

  1. Wird in einer kausalen Welt die kausale Struktur tatsächlich durch die am besten vereinheitlichte Theorie erfasst?

  2. Wie sieht eine von der Vereinheitlichungstheorie abgeleitete Regularitätstheorie der Kausalität in dem Fall aus?

Ich werde voraussetzen, dass die erste Frage mit Ja zu beantworten ist, ohne diese Voraussetzung mit Argumenten zu stützen. Das heisst, ich werde davon ausgehen, dass die am stärksten vereinheitlichte Theorie der Welt sämtliche tatsächlich kausal erklärbaren Ereignisse durch die Angabe eines hinreichenden Bündels von Ereignissen erklärt, nämlich des tatsächlichen Ursachenbündels des zu erklärenden Ereignisses. 1

In dieser Voraussetzung inbegriffen sind auch einige generelle Prinzipien über Kausalität, wie sie in @Baumgartner2004 [68ff] beschrieben werden. Es handelt sich dabei nur um eine erste Explikation des Begriffs der Kausalität, in dem Sinn, dass Kausalität im Minimum diesen Prinzipien folgen muss, und noch nicht um eine vollständige Theorie der Kausalität. Es ist der Anspruch von Baumgartner und Graßhoff, dass diese Prinzipien für jede Kausaltheorie gelten müssen, ansonsten handelt es sich nicht mehr um Kausalität im umgangssprachlichen Sinn [@Baumgartner2004, 68]. Ich werde diesen Anspruch hier übernehmen, und betrachte folglich die entsprechenden Prinzipien der Kausalität als bereits in der gemachten Annahme enthalten .

Insbesondere sind also die vorausgesetzten vollständigen Ursachenbündel hinreichend für die zu erklärende Wirkung, und es existieren für sämtliche Instanzen eines kausal erklärbaren Wirkungstyps auch vollständige Ursachenbündel.

Mit Hilfe dieser Voraussetzungen will ich für die zweite Frage folgende These prüfen:

Die Kausaltheorie der minimalen Theorien, wie sie in @Baumgartner2004 [Kapitel 5] beschrieben wird, kann aus Kitchers Vereinheitlichungstheorie abgeleitet werden, indem Ursachen mit erklärenden Ereignissen gleichgesetzt werden.

Minimale Theorien

Die Kausalitätstheorie der minimalen Theorien ist eine Regularitätstheorie der Kausalität. Das bedeutet, Kausalität wird nicht anhand der Eigenschaften einzelner singulärer Ereignissen definiert, sondern anhand logischer Regelmässigkeiten, die zwischen Ereignistypen bestehen [vgl. @Baumgartner2004, 80, 169]. Diese Vorgehensweise hat den Vorteil, eine empirische Definition der Kausalität zu liefern. Deshalb bieten sich Regularitätstheorien der Kausalität auch besonders für ihre Anwendung in Kitchers Programm an, in dem ebenfalls eine empirische Definition von Kausalität angestrebt wird [@Kitcher1989, 460].

@Baumgartner2004 [44ff] identifizieren Koinzidenzen als die wesentliche empirische Grundlage einer Kausaltheorie. Eine Koinzidenz ist eine Konjunktion von logisch unabhängigen Ereignistypen, die gemeinsam, d.h. in geeigneter zeitlicher und räumlicher Nähe, instantiiert sind [@Baumgartner2004, 45]. Sie vermeiden es dabei bewusst, die geeignete zeitliche und räumliche Nähe absolut festzulegen, da diese vom untersuchten kausalen Prozess abhängig ist. Zudem vermeiden Sie, dass die einzelnen Ereignisse eines Ursachenbündels genau zur gleichen Zeit stattfinden müssen. Eine empirisch adäquate Kausaltheorie muss im Minimum kompatibel mit allen beobachteten Koinzidenzen sein, und zudem eine kausale Erklärung von allen beobachteten Ereignissen liefern.

Es ist nicht ganz eindeutig, ob nach Baumgartner und Graßhoff Koinzidenzen nur Mengen von räumlich und zeitlich lokalisierbaren, also singulären Ereignissen bezeichnen, oder ob auch eine blosse Liste von Ereignistypen als "Koinzidenztyp" aufgefasst werden kann. Ich benutze im folgenden den Begriff Koinzidenz immer für Mengen von singulären Ereignissen, die alle in geeigneter räumlicher und zeitlicher Nähe stattfinden. Der von Baumgartner und Graßhoff ebenfalls verwendete Begriff des Ereignisbündels soll für einen "Koinzidenztyp" stehen, das heisst, für eine Konjunktion von logisch unabhängigen Ereignistypen mit der zusätzlichen Bedingung, dass die Instanzen der Ereignistypen in geeigneter räumlicher und zeitlicher Nähe stattfinden müssen.

Eine Koinzidenz ist demnach genau dann eine Instanz von einem bestimmten Ereignisbündel, wenn in dieser Koinzidenz eine Instanz von jedem Ereignistyp im Ereignisbündel in geeigneter zeitlicher und räumlicher Nähe enthalten ist. Ein Ereignisbündel hat ausschliesslich Koinzidenzen als Instanzen. Ein Ursachenbündel ist ein Ereignisbündel, das Ursache einer gegeben Wirkung ist.

Die minimale Theorie einer Wirkung $W$ ist eine Liste von Ereignisbündeln, die folgende zwei Bedingungen erfüllt:

  1. Jedes einzelne Bündel ist minimal hinreichend für die Wirkung $W$. Das heisst, auf jede Instanz des Bündels folgt eine Instanz der Wirkung, und dies gilt nicht mehr sobald ein beliebiger Ereignistyp aus dem Bündel entfernt wird [@Baumgartner2004, 103,104].

  2. Die Liste der Bündel insgesamt ist minimal notwendig für die Wirkung $W$. Das heisst, jeder Instanz der Wirkung $W$ geht eine Instanz mindestens eines Ereignisbündel aus der Liste voraus, und dies gilt nicht mehr, sobald ein beliebiges Ereignisbündel aus der Liste entfernt wird [@Baumgartner2004, 104,105]

Ein Faktor $A$ ist genau dann direkt kausal relevant für eine Wirkung $W$, wenn er in der minimalen Theorie von $W$ enthalten ist. Er ist genau dann indirekt kausal relevant für eine Wirkung $W$, wenn es eine Kette von Faktoren $B_1, ..., B_n$ gibt, so dass $B_i$ jeweils direkt kausal relevant für $B_{i+1}$ ist, wobei $B_1 = A$ und $B_n = W$ ist. Schlussendlich ist ein Faktor $A$ kausal relevant für eine Wirkung $W$, wenn $A$ entweder direkt oder indirekt kausal relevant für diese Wirkung ist [@Baumgartner2004, 105].

@Baumgartner2004 [106ff] führten folgende Notation für die minimale Theorie einer Wirkung $W$ ein: $ABX_1 \vee CDX_2 \vee Y \Ra W$. In diesem Beispiel stehen $A$, $B$, $C$, $D$ und $W$ für bestimmte Ereignisstypen. Die Variablen $X_1, X_2$ sind Platzhalter für ein oder mehrere unbekannte oder uninteressante kausal relevante Faktoren, die zusammen mit den entsprechenden bekannten und im Kontext interessanten kausal relevanten Faktoren auftretten müssen. $Y$ schliesslich ist ein Platzhalter für ein oder mehrere unbekannte oder uninteressante alternative Ursachenbündel von $W$. Insgesamt soll die Schreibweise ausdrücken, dass der Teil links vom Pfeil die minimale Theorie der Wirkung $W$ rechts vom Pfeil ist, wobei die einzelnen minimal hinreichenden Ursachenbündel durch $\vee$ voneinander getrennt sind.

Nach @Baumgartner2004 [181] kann eine uns bekannte Theorie niemals sicher abgeschlossen werden. Dies wird formal durch die Platzhalter ausgedrückt. Da dies eine Konzession an ein epistemisches Problem ist, das in unserem Kontext ignoriert werden kann, werde ich diese Variablen weglassen. Wir gehen also von einem perfekten Wissensstand aus, in dem wir unbekannte weitere kausal relevanten Faktoren ausschliessen können. Alle angegebenen minimalen Theorien in desem Text sind demnach als vollständige minimale Theorien zu verstehen.

In der Kausalitätstheorie der minimalen Theorien können Ereignistypen nicht beliebig extensional definiert werden. Das heisst, man kann nicht einer beliebigen Menge von Ereignistokens einen Ereignistyp zuordnen. Vielmehr muss jedem Ereignistyp eine natürliche Eigenschaft entsprechen [@Baumgartner2004, 38--39]. Wie wir später sehen werden, steht diese Forderung und insbesondere die Notwendigkeit einer solchen Einschränkung in einem engen Zusammenhang mit einer Forderung Kitchers [-@Kitcher1989, 482] an seine Argumentmuster, nämlich, dass nur projizierbare Prädikate verwendet werden dürfen.

Zudem können Ereignistokens nicht beliebige Teilmengen der Welt darstellen, sondern müssen sowohl räumlich als auch zeitlich lokalisierbar sein [@Baumgartner2004, 37]. Diese Einschränkung überträgt sich natürlich auf Ereignistypen, die demnach nur auf räumlich und zeitlich lokalisierbare Ereignisse zutreffen dürfen. Demnach können beliebig weit von einander entfernte Ereignisse, wie z.B. das Senden von Radiosignalen von einer Antenne und das Einschalten eines Radios, nicht unter einem Begriff "Senden und Einschalten" zusammengefasst werden. Der Begriff "Senden oder Einschalten" trifft jedoch sehr wohl nur auf zeitlich und räumlich lokalisierbare Ereignisse zu, nämlich entweder auf ein Senden von Radiosignalen an einem bestimmten Ort zu einer bestimmten Zeit, oder auf das Einschalten eines Radios an einem bestimmten Ort zu einer bestimmten Zeit.

Wie wir gesehen haben, wird in der Kausalitätstheorie der minimalen Theorien zwischen direkter und indirekter Kausalität unterschieden. Diese Unterscheidung ist jedoch relativ zu der begrifflichen Analyse der Situation und entspricht keinem realen Unterschied von direkter und indirekter Kausalität [@Baumgartner2004, 52]. Durch das Prinzip der persistenten Relevanz [@Baumgartner2004, 69] wird sichergestellt, dass der Begriff der Kausalität selber, der sowohl direkte als auch indirekte Kausalität zusammenfasst, wieder unabhängig von der begrifflichen Analyse sein muss. Diese Unterscheidung ist notwendig, da minimale Theorien nur direkte Kausalität erfassen können und indirekte Kausalität deshalb auf direkte Kausalität aufbauend definiert werden muss.

Kitchers Vereinheitlichungstheorie

Kitcher definiert Erklärung relativ zu einem gesamten Wissensschatz $K$. $K$ steht also für sämtliche von einer wissenschaftlichen Gemeinschaft akzeptierten Sätze. Kitcher geht davon aus, dass $K$ deduktiv abgeschlossen und konsistent ist [@Kitcher1989, 431]. Ein Argument ist nach Kitcher eine Erklärung, wenn es zur besten Systematisierung $E(K)$ von $K$ gehört. Eine Systematisierung $S$ von $K$ definiert er dabei als eine Menge von Ableitungen, die relativ zu $K$ akzeptierbar sind. Die beste Systematisierung $E(K)$ von $K$ ist diejenige, die die grösste Vereinheitlichung erzielt. Die wesentliche Idee der Vereinheitlichung ist, die Anzahl der Fakten zu minimieren, die unerklärt akzeptiert werden müssen ("brute facts") [@Kitcher1989, 431]. Diese Charakterisierung von Friedmann suggeriert nach Kitcher eine erste Definition von Vereinheitlichung:

characterize $E(K)$ as the set of arguments that achieves the best tradeoff between minimizing the number of premises used and maximizing the number of conclusions obtained. [@Kitcher1989, 431]

Sowohl diese Definition wie auch Friedmanns eigene Definition haben jedoch technische Schwierigkeiten, die nach @Kitcher1989 [432] in @Kitcher1976 und @Salmon1989 gezeigt wurden. Kitcher schlägt deshalb eine Erweiterung dieser Definition vor:

Die Ableitungen einer Systematisierung $S$ werden in verschiedene Argumentmuster ("argument patterns") klassifiziert. Der Grad der Vereinheitlichung, den $S$ erreicht, wird dann ausschliesslich aus Eigenschaften der Argumentmuster bestimmt. Diese Erweiterung ermöglicht es Kitcher den Fokus von Prämissen und der Konklusion auf die Ableitung selber zu verschieben. Neu sind die Ähnlichkeiten von an sich verschiedenen Ableitungen entscheidend für den Grad der Vereinheitlichung einer Systematisierung $S$ [vgl. @Kitcher1989, 432].

Nach @Kitcher1989 [432] besteht ein Argumentmuster aus drei Teilen:

  1. Argumentschema

    Dies ist eine Menge von schematischen Sätzen. Schematische Sätze sind Sätze in denen einige, aber nicht unbedingt alle, nicht logischen Ausdrücke durch Buchstaben ersetzt wurden.

  2. Ausfüllinstruktionen

    Die Ausfüllinstruktionen bestehen aus Anweisungen zu jedem im schematischen Argument verwendeten Buchstaben, die bestimmen, wie dieser Buchstabe ersetzt werden kann.

  3. Klassifikation des Argumentschemas

    Die Klassifikation des Argumentschemas besteht aus einer Beschreibung der Zusammenhänge der einzelnen Sätze im Argumentschema. Sie bestimmt also unter anderem, welche der Sätze Prämissen und welche Konklusionen sind, sowie, welche Sätze aus welchen und mithilfe welcher Regel abgeleitet werden.

Eine Ableitung fällt unter ein bestimmtes Argumentmuster, wenn die folgenden drei Bedingungen erfüllt sind:

  1. Die Ableitung hat gleich viele Sätze wie das Argumentschema.

  2. Jeder Satz oder Formel aus der Ableitung kann aus dem entsprechenden Satzschema im Argumentschema erhalten werden, unter Beachtung der entsprechenden Ausfüllinstruktionen.

  3. Die Sätze oder Formeln der Ableitung haben die Eigenschaften und stehen in den Beziehungen zueinander, wie dies in der Klassifikation des Argumentschemas angegeben ist.

Da Kitcher Argumentmuster zählt, muss er verhindern, dass man beliebig Argumentmuster kombinieren oder aufspalten kann. Er erreicht dies, indem er die in Argumentmuster verwendbaren Prädikate einschränkt auf solche, die er projizierbar nennt [@Kitcher1989, 482]. Wie wir später sehen werden, steht diese Einschränkung Kitchers in einem engen Zusammenhang mit der bereits erwähnten Einschränkung an Ereignistypen, die @Baumgartner2004 [38-39] vornehmen. Dort werden nämlich Ereignistypen auf solche Klassen von Ereignissen eingeschränkt, die sich durch eine oder mehrere gemeinsame Eigenschaften auszeichnen.

Kitcher gibt keine abschliessende Beschreibung von projizierbaren Prädikaten. Wir wissen jedoch, dass die Unterscheidung von projizierbaren und nicht projizierbaren Prädikaten relativ zu einer bestimmten Sprache $L$ ist [@Kitcher1989, 488], und dass im allgemeinen Konjunkte und Disjunkte von projizierbaren Prädikaten nicht wieder ein projizierbares Prädikat ergeben [@Kitcher1989, 482, 488].

Die Instanzen von Argumentmuster sind deduktive Argumente. Kitcher verteidigt diese Idealisierung, die er deductive chauvinism nennt, gegen verschiedene Vorwürfe [@Kitcher1989, 448]. Insbesondere können statistische Argumente nach Kitcher nur dann erklärend sein, wenn sie als Hinweis auf ein zugrundeliegendes unbekanntes deduktives Argument aufgefasst werden [@Kitcher1989, 449]. Daraus ergibt sich auch, dass aus Kitchers Vereinheitlichungstheorie keine probabilistische Kausaltheorie folgen kann [vgl @Baumgartner2004, 122ff].

Im folgenden werde ich nur ein Ausschnitt von Kitchers Vereinheitlichungsbegriff wiedergeben, und diesen Ausschnitt zudem etwas vereinfachen, da dies für die These dieser Arbeit genügen wird. Im Anhang befindet sich eine genauere Analyse von Kitchers Vereinheitlichungsbegriff und eine Argumentation für meine Interpretation dieses Begriffs.

Kitcher definiert auf allen Mengen von Argumentmustern eine partielle Ordnung2 mit Hilfe des Prinzips (C) [@Kitcher1989, 478, 479] und der exakten Definition eines komparativen Stringenz-Begriffs (T),(R) [@Kitcher1989, 479, 480], die wiederum eine partielle Ordnung aller Argumentmuster festlegt. Für unsere Zwecke reicht es aus, zu wissen, dass laut Prinzip (C) eine Menge von Argumentmustern $U$ besser vereinheitlicht ist als eine weitere Menge von Argumentmustern $V$, falls einer der folgenden Punkte erfüllt ist:

  1. $U$ erklärt mit weniger, mindestens so stringente Argumentmustern die gleiche oder grössere Menge von Konsequenzen als $V$ (C1).

  2. $U$ erklärt mit genau so vielen, aber zum Teil stringenteren Argumentmustern die gleiche oder grössere Menge von Konsequenzen als $V$ (C1).

  3. $U$ erklärt mit mindestens so stringente Argumentmustern eine grössere Menge von Konsequenzen als $V$ (C2).

$U$ erklärt dabei eine Aussage $a$ genau dann, wenn es ein Argumentmuster $p$ in $U$ zusammen mit einer mit $K$ vereinbaren Instanz dieses Argumentmusters gibt, so dass die Aussage $a$ die Konklusion dieser Instanz von $p$ ist.

Die Stringenzbedingungen sind so zu verstehen, dass jedem Argumentmuster in $U$ ein höchstens so stringentes Argumentmuster in $V$ zugeordnet werden muss, wobei jedem Argumentmuster in $V$ höchstens ein Argumentmuster aus $U$ zugeordnet werden darf. Ein Argumentmuster $p$ ist stringenter als ein Argumentmuster $q$, falls $p$ die gleiche Struktur wie $q$ besitzt (also die gleichen schematischen Sätze mit der gleichen Klassifikation) und $p$ weniger Instanzen zulässt als $q$.

Durch das Prinzip (O) [@Kitcher1989, 478] drückt Kitcher die Hoffnung aus, dass mit dieser partiellen Ordnung eine obere Grenze zu je zwei beliebigen Mengen von Argumentmustern existiert. Das heisst, gegeben zwei solcher Mengen $U$ und $U'$, existieren eine oder mehrere Mengen von Argumentmustern $U^$, so dass sowohl $U \leq_C U^$ und $U' \leq_C U^$ gilt, wobei $A \leq_C B$ dafür steht, dass $A$ nach Prinzip (C) höchstens so vereinheitlicht ist wie $B$. Dies ist trivialerweise gegeben, falls $U$ und $U'$ vergleichbar sind, in dem wir $U^ = max(U,U')$ setzen. Falls $U$ und $U'$ jedoch nicht vergleichbar sind, garantiert uns dieses Prinzip die Existenz einer dritten Menge von Argumentmustern $U^*$, zugunsten dessen wir sowohl $U$ als auch $U'$ fallen lassen können.

Die partielle Ordnung $\leq_C$ auf Mengen von Argumentmustern lässt sich auf Systematisierungen (also Mengen von Ableitungen) übertragen, indem die jeweils besten generativen Mengen von Argumentmustern verglichen werden [vgl. @Kitcher1989, 480]. Wenn wir also zwei Systematisierungen $S$ und $T$ von $K$ gegeben haben, bestimmen wir zuerst die nach (C) besten Mengen von Argumentmustern $U$ und $V$, so dass jede Ableitung in $S$ eine Instanz von einem Argumentmuster in $U$ und jede Ableitung in $T$ eine Instanz von einem Argumentmuster in $V$ ist. $S$ ist genau dann besser vereinheitlicht als $T$, wenn $V \leq_C U$ gilt.3

Argumentation

Allgemeine und spezielle Theorien

Sowohl Kitcher wie auch Baumgartner und Graßhoff gehen explizit darauf ein, dass die selben Phänomene auf verschiedenen Ebenen betrachtet werden können. So kennen die meisten Menschen einen direkten kausalen Zusammenhang zwischen dem Einschalten einer Taschenlampe und deren Aufleuchten. Ein Elektroniker dagegen sieht den selben Prozess differenzierter, da er genau weiss unter welchen Bedingungen die LED in der Taschenlampe leuchtet und auch erkennt wie der Schalter diese Bedingungen zusammen mit der Konstruktion der Taschenlampe herstellt. Ein Physiker zuletzt kennt eine noch viel komplexere Beschreibung des selben Vorgangs, die in einer entsprechend komplexen Beschreibung des Leuchtens der Taschenlampe endet.

Entscheidend ist, dass auf all diesen Ebenen wissenschaftliche Methodik und wissenschaftliches Denken anwendbar ist und zu gültigen Kausalschlüssen führt, selbst wenn die allgemeineren Ebenen nicht bekannt sind. Es ist gültig und wissenschaftlich, einen direkten kausalen Zusammenhang zwischen dem Einschalten und dem Leuchten der Taschenlampe festzustellen, ohne die zugrunde liegenden Theorien aus der Elektronik zu kennen. Diese Bedingung wird wahrscheinlich sowohl von Baumgartner und Graßhoff [@Baumgartner2004, 10, 53] als auch von Kitcher [vgl. @Kitcher1989, 436 und 469] akzeptiert, aber auf sehr verschiedene Weise behandelt.

Bei Baumgartner und Graßhoff werden die verschiedenen Ebenen auf denen kausale Schlüsse stattfinden können getrennt behandelt. Es gibt also nach @Baumgartner2004 [53] verschiedene, getrennte minimale Theorien, die die gleichen Ereignisse unterschiedlich detailliert beschreiben. Zum einen können die Begriffe auf den verschiedenen Ebenen nicht beliebig gemischt benutzt werden, da zwischen Ereignisstypen in einer Koinzidenz keine logischen Abhängigkeiten bestehen dürfen [@Baumgartner2004, 45]. Zum anderen wird mit dem Prinzip der persistenten Relevanz [@Baumgartner2004, 69] vorausgesetzt, dass die verschiedenen Ebenen sich nicht widersprechen.

Bei Kitcher dagegen gibt es nur eine beste Systematisierung $E(K)$ von $K$, in der alle Schlüsse auf allen Ebenen enthalten sind. Zudem gibt es auch innere Ähnlichkeiten zwischen spezifischen Argumentmustern, die durch weitere allgemeinere Argumentmuster erfasst werden [vgl. @Kitcher1989, 484]. Wie wir noch sehen werden, erklärt dieser Unterschied einige Diskrepanzen zwischen der Vereinheitlichungstheorie von Kitcher und der Kausalitätstheorie der minimalen Theorien von Baumgartner und Graßhoff. Im folgenden benutze ich deshalb eine weiter vereinfachte Version von Kitchers Vereinheitlichungstheorie, in der der Einfluss von allgemeineren Theorien ausgeschlossen wird.

Logische Struktur von kausalen Argumentmuster

Kitcher hat zum Ziel, den Fokus in seiner Vereinheitlichungstheorie weg von den Prämissen und der Konklusion hin zu der Struktur des Schlusses selbst zu bewegen [vgl. @Kitcher1989, 432]. Im folgenden werden jedoch kausale Argumentmuster beschrieben, die explizit keine weitere Struktur als das angeben von hinreichenden Bedingungen haben. Dies scheint also mit Kitchers Vereinheitlichungstheorie im Widerspruch zu sein und entspricht auch nicht den Beispielen die Kitcher selbst in seiner Arbeit macht.

Der Grund für diese unstrukturierten allgemeinen kausalen Argumentmuster liegt in der Voraussetzung, dass wir eine Regularitätstheorie der Kausalität entwickeln wollen. In dieser Voraussetzung ist mit eingeschlossen, dass es keine Eigenschaften in der Ursache gibt, die für eine Ableitung der Wirkung relevant wären, ausser, dass die Ursache hinreichend für die Wirkung ist [vgl. @Baumgartner2004, 79]. Die Wirkung lässt sich also nicht mit analytischen Methoden aus der Ursache ableiten und es gibt auch keine synthetische Eigenschaft, wie z.B. Energieaustausch, die singuläre Ereignisse als Ursachen und Wirkungen anderer Ereignisse auszeichnet.

Zumindest der letzte Punkt wird durch andere Kausaltheorien in Zweifel gezogen [siehe z.B. @Baumgartner2004, 119; @Kitcher1989 461]. Sollte eine solche alternative Kausaltheorie überzeugen, erreicht man damit natürlich eine sehr stark vereinheitlichte Theorie, da mit ihr im besten Fall ein Argumentmuster ausreicht, um alle kausalen Abhängigkeiten mit Hilfe von projizierbaren Prädikaten zu beschreiben. Das Ziel Kitchers ist jedoch, einen empirischen Begriff von Vereinheitlichung und damit auch von Kausalität zu erreichen. Man kann deshalb davon ausgehen, dass nur empirische Begriffe projizierbar sind. Es gibt aber starke und begründete Zweifel daran, ob diese alternativen Kausaltheorien tatsächlich mit Hilfe von empirischen Begriffen formulierbar sind. Viele davon wurden von Kitcher selbst in seiner Arbeit erläutert [vgl Kitcher1989, 463ff].

Um so mehr erstaunt es also, dass Kitcher zum einen davon ausgeht, dass sich die kausale Struktur der Welt in der am besten vereinheitlichten Systematisierung all unseres Wissens widerspiegelt, auf der anderen Seite aber Vereinheitlichung empirisch und auf der Grundlage von innerer Ähnlichkeiten verschiedener Ableitungen definieren will. Wie im letzten Abschnitt gesehen, gibt es auch nach Kitcher anscheinend keine allgemeine innere Struktur von kausalen Argumentmustern. Die innere Struktur der von Kitcher gemachten Beispielen lässt sich deshalb immer auf eine zusätzliche Vereinheitlichung der kausalen Argumentmuster selber oder auf einen Zusammenhang mit Theorien auf einer allgemeineren Ebene zurückführen. Da wir diesen Aspekt von Kitchers Vereinheitlichungstheorie jedoch weglassen wollen, reduziert sich auch Kitchers Vereinheitlichungstheorie auf die im folgenden entwickelten kausalen Argumentmuster mit einer sehr einfachen logischen Struktur.

Projizierbare Prädikate und natürliche Eigenschaften

Wie wir bereits gesehen haben, lassen weder die Kausaltheorie der minimalen Theorien noch Kitchers Vereinheitlichungstheorie beliebige Prädikate zu. Sie schränken stattdessen beide die erlaubten Prädikate ein, entweder auf solche, die natürlichen Eigenschaften entsprechen bei @Baumgartner2004 [38--39], oder auf so genannte projizierbare Prädikate bei @Kitcher1989 [482]. Während diese Begriffe einen sehr ähnlichen Zweck erfüllen, sie verhindern nämlich dass die entsprechenden Theorien durch geeignete logische Konstruktionen trivialisiert werden können, bauen sie auf komplett verschiedenen Ansichten über wissenschaftliche Erkenntnis auf.

Baumgartner und Graßhoffs Beschreibung von natürlichen Eigenschaften [@Baumgartner2004, 38--39] impliziert die Sichtweise des wissenschaftlichen Realismus. Demnach bezeichnen die von der Wissenschaft verwendeten Prädikate real existierende Dinge in der Welt. Umgekehrt ist ein Prädikat nur dann zulässig, wenn es tatsächlich einer unabhängig davon existierende Eigenschaft in der Welt entspricht. Alte in der Wissenschaft verwendete Prädikate werden aufgegeben, weil ein Erkenntnisgewinn stattfindet, wonach angenommene reale Eigenschaften tatsächlich ohne Inhalt sind. Analog werden neue Prädikate eingeführt, weil neue Aspekte der realen Welt entdeckt werden.

Bei Kitcher dagegen sind projizierbare Prädikate abhängig von einer bestimmten Sprache $L$. Diese Sprache kann und wird von den Wissenschaftler jedoch abgeändert und dadurch ändert sich auch, welche Prädikate projizierbar sind und welche nicht. Begründet wird eine solche Änderung aber nicht als eine Anpassung an die Realität, sondern durch die erklärende Kraft der neuen Sprache und der darin formulierten Theorien [@Kitcher1989, 488]. Im Gegensatz zur Sichtweise des wissenschaftlichen Realismus ist Kitcher anscheinend eher Instrumentalist und demnach strebt nach seiner Sichtweise die Wissenschaft eine empirisch adäquate Theorie an, kann dabei aber eine beliebige Sprache verwenden.

Wesentlich für das Ziel dieser Arbeit ist, dass trotz der komplett verschiedenen Hintergründe dieser Begriffe, dies für die Definition von Kausalität auf der einen Seite und die Definition von Vereinheitlichung auf der anderen Seite nicht benutzt wird. Weder Baumgartner und Graßhoff noch Kitcher greifen in ihren Theorien auf spezifische Eigenschaften der ausgezeichneten Prädikate zurück. Sie benutzen nur, dass es eine Menge von ausgezeichneten Prädikaten gibt, und Konjunktionen und Disjunktionen von diesen Prädikaten im allgemeinen nicht mehr derart ausgezeichnet sind.

Für diese Arbeit gehe ich deshalb davon aus, dass sich diese Begriffe exakt decken. Das heisst, ein Prädikat ist genau dann projizierbar, wenn es einer natürlichen Eigenschaft entspricht. Dies ist deshalb zulässig, weil es immer möglich ist, minimale Theorien anhand von projizierbaren Prädikaten in einer beliebigen Sprache $L$ zu betrachten, respektive Vereinheitlichung in einer ausgezeichneten Sprache $L_N$, in der genau projizierbare Prädikate für alle natürlichen Eigenschaften existieren.

Kausale Argumentmuster

Um Kitchers Theorie der Vereinheitlichung auf kausal erklärbare Ereignisse anzuwenden, ist es entscheidend, die dazu benutzten Argumentmuster festzustellen. Die erste und für alle weiteren Argumente entscheidende These ist demnach die folgende:

Ein Argumentmuster, das benutzt wird um kausal erklärbare Ereignisse zu erklären, besteht aus der Angabe von genau einem vollständigen Ursachenbündel für diesen Ereignistyp und der Aussage, dass dieses Ursachenbündel hinreichend für den zu erklärenden Ereignistyp ist.

Ein spezifisches kausales Argumentmuster könnte also in etwa so aussehen:

Jede funktionierende LED, an der eine genügend grosse Spannung mit der richtigen Orientierung angeschlossen ist, leuchtet. In der Situation $\alpha$ sind diese Bedingungen erfüllt. Also leuchtet die LED in $\alpha$. 4

Dies ist nicht die einzige mögliche Ursache, für das Leuchten der LED, und demnach gib es auch ein alternatives Erklärungsmuster um Aufleuchten von LEDs zu erklären:

Jede LED, auf die ein genügend starkes Licht in einem geeigneten Winkel auftritt, leuchtet. In der Situation $\alpha$ sind diese Bedingungen erfüllt. Also leuchtet die LED in $\alpha$.

Instanzen dieser beiden Argumentmuster sehen dann z.B. so aus:

An der roten LED an der Frontseite meines momentan eingeschalteten Monitors liegt eine genügend grosse Spannung mit der richtigen Orientierung. Die LED leuchtet also.

Die Sonne scheint direkt, in einem geeigneten Winkel auf die ausgeschaltete LED Taschenlampe auf meinem Pult. Die LEDs in der Taschenlampe leuchten also.

Dass diese Beispiele korrekt sind, und nach Kitchers Vereinheitlichungstheorie mit unseren Voraussetzungen kausale Argumentmuster so und nicht anders aussehen müssen, will ich im folgenden zeigen. Insbesondere will ich diese Lösung gegenüber folgenden falschen Varianten abgrenzen:

Jede LED, auf die ein genügend starkes Licht in einem geeigneten Winkel einfällt, oder an der eine genügend grosse Spannung mit der richtigen Orientierung liegt, leuchtet. In der Situation $\alpha$ sind diese Bedingungen erfüllt. Also leuchtet die LED in $\alpha$.

Jede funktionierende rote LED an der eine genügend grosse Spannung mit der richtigen Orientierung liegt, leuchtet. In der Situation $\alpha$ sind diese Bedingungen erfüllt. Also leuchtet die LED in $\alpha$.

Manche LEDs an denen eine genügend grosse Spannung liegt, leuchten. In der Situation $\alpha$ ist diese Bedingung erfüllt. Die LED in $\alpha$ kann also leuchten.

Zuerst einmal haben wir im Kapitel 3 vorausgesetzt, dass in der am stärksten Vereinheitlichten Theorie $E(K)$ kausal erklärbare Ereignisse tatsächlich mit der Hilfe ihrer Ursachen erklärt werden. Es ist damit ausgeschlossen, dass die verwendeten Argumentmuster überhaupt nicht auf die Ursachen der zu erklärenden Ereignisse Bezug nehmen. Die folgenden drei Aussagen zeigen dann, dass in diesem Fall die gegebenen Argumentmuster die einzig richtigen nach der Theorie Kitchers sind:

  1. Ein kausales Argumentmuster kann nicht unvollständige Ursachenbündel enthalten.

In einer starken Fassung unserer Voraussetzung folgt diese Aussage direkt. Wenn wir nämlich davon ausgehen, dass es nicht genügt, kausale Beziehungen zwischen einzelnen Ereignistypen aufzuzählen, um die kausale Struktur der Welt vollständig zu erfassen, sondern es dazu vielmehr auch notwendig ist, zusammengehörende Ursachenbündel zu beschreiben.

In unserem Beispiel heisst das, dass die folgenden Aussagen noch nicht genügen, um die vollständige kausale Struktur der Welt zum Aufleuchten von LEDs zu erfassen:

  • Die Grösse der elektrische Spannung ist kausal relevant für das Leuchten von LEDs.

  • Die Orientierung der Spannung ist kausal relevant für das Leuchten von LEDs.

  • Lichteinfall im richtigen Winkel ist kausal relevant für das Leuchten von LEDs.

  • Lichteinfall von genügend grosser Stärke ist kausal relevant für das Leuchten von LEDs.

Vielmehr ist es ein Teil der kausalen Struktur, dass jeweils die ersten zwei Faktoren und die letzten zwei Faktoren zusammen auftreten müssen, um eine Leuchten der LED zur Folge haben. In dem Fall müssen Argumentmuster, mit unserer Voraussetzung auch diese Bedingungen enthalten, das heisst, sie müssen auf vollständige Ursachenbündel Bezug nehmen und nicht nur auf einzelne kausal relevante Faktoren.

Selbst wenn wir unsere Annahme in einer schwächeren Form interpretieren, nach der eine blosse Auflistung aller kausal relevanten Faktoren genügt, um die kausale Struktur der Welt zu erfassen, gibt es eine weitere Bedingung Kitchers, die unsere erste Behauptung zumindest nahe legt. Wie wir nämlich bereits gesehen haben, müssen nach @Kitcher1989 [448] alle Instanzen eines Argumentmusters deduktive Ableitungen sein. Da die zu erklärende Wirkung aus einem unvollständigen Ursachenbündel alleine jedoch nicht deduktiv folgt, genügt ein solches nicht für ein korrektes Argumentmuster. So ist auch das Beispiel mit einer unvollständigen Ursache nach Kitcher keine Argumentmuster, da ihre Instanzen keine deduktive Ableitung des zu erklärenden Ereignisses sind.

Als letzte Möglichkeit könnte dieselbe Wirkung mit Hilfe von mehreren Argumentmuster erklärt werden, die sich folgendermassen zusammensetzen:

  1. Mehrere kausal relevante Faktoren, aber nicht unbedingt alle, von mehreren verschiedenen hinreichenden Ursachenbündel zur selben Wirkung.

  2. Weiteren Bedingungen, die nicht als Ereignisse aufgefasst werden können (die also z.B. nicht in Raum und Zeit lokalisierbar sind).

Die zusätzlichen Bedingungen sollen dabei die Instanzen der Argumentmuster deduktiv gültig machen, ohne weitere falsche kausale Beziehungen einzuführen, was im Widerspruch zu unserer Voraussetzung wäre. Zudem enthält jedes Argumentmuster mehr als nur einen kausal relevanten Faktor. Solche Argumentmuster wären also auch in der Lage, zu erfassen, dass zwei kausal relevante Faktoren zusammen auftreten müssen. Um trotzdem noch besser vereinheitlicht zu sein als unser einfacher Vorschlag, muss aber jedes Argumentmuster zusätzlich noch dazu dienen, Aspekte weiterer Ursachenbündel desselben Wirkungstyps zu erfassen. Es ist nicht möglich zum selben Zweck Ursachen von mehreren verschiedenen Wirkungstypen zu kombinieren, da dies im Allgemeinen keine projizierbaren Ausfüllinstruktionen mehr ergibt. Wenn aber nur Ursachen eines Bündels erfasst werden, benötigen wir mehr als ein Argumentmuster pro Ursachenbündel, und erhalten damit eine schlechter vereinheitlichte Theorie.

Es ist sehr unwahrscheinlich, dass eine solche Konstruktion tatsächlich mit projizierbaren Prädikaten möglich ist. Aber sie ist logisch nicht ausgeschlossen und meine Argumentation deshalb an dieser Stelle lückenhaft, falls eine schwache Version unserer Voraussetzung verwendet wird, wonach derartige Argumentmuster tatsächlich die kausale Struktur der Welt erfassen.

  1. Ein Argumentmuster kann neben den tatsächlichen Ursachentypen keine zusätzlichen Voraussetzungen enthalten. Dies betrifft sowohl weitere Ereignistypen als auch andere Begriffe, die nicht in kausalen Zusammenhängen stehen.

@Kitcher1989 [482--484] hat den Anspruch, mit seiner Erklärungstheorie der Vereinheitlichung irrelevante Faktoren ausschliessen zu können. Er unterscheidet folgende Fälle:

Erstens kann es sein, dass die zusätzlichen Voraussetzungen bestimmte Instanzen der Argumentmuster ausschliessen. Durch diese Einschränkung der Anwendbarkeit des Argumentmusters wird mindestens ein weiteres Argumentmuster notwendig. Da die in diesem Argumentmuster verwendeten Prädikate projizierbar sein müssen, kommt dazu aber im allgemeinen nur das ursprüngliche Argumentmuster $p$ in Frage und man erreicht damit eine weniger gut vereinheitlichte Theorie.

Zweitens kann es sein, dass diese zusätzlichen Voraussetzungen immer gegeben sind, wenn auch das vollständige Ursachenbündel instantiiert ist, gerade so wie Salz immer verzauberbar ist. Dadurch ist aber die zusätzliche Voraussetzung leer und für die Stichhaltigkeit des Argumentmusters und ihrer Instanzen ohne Belang. Ein Prinzip der Einfachheit fordert, diese Voraussetzungen zu streichen [@Kitcher1989, 484].

An dieser Stelle bleibt noch offen, ob und wie stark sich diese Argumentation mit derjenigen der minimalen Theorien deckt. Soweit ist also nur gezeigt, dass nach Kitcher irrelevante Faktoren aus den Argumentmustern der am besten vereinheitlichten Systematisierung ausschliessbar sind. Das heisst aber nicht, dass die Kausaltheorie der minimalen Theorien und Kitchers Erklärungstheorie darin übereinstimmen, welche Faktoren denn nun irrelevant sind.

  1. Ein Argumentmuster kann nicht mehrere vollständige Ursachenbündel enthalten.

Dieser Punkt hängt vollständig von der angesprochenen Bedingung ab, dass nur projizierbare Prädikate verwendet werden dürfen. Zuerst einmal formuliert Kitcher seine Argumentmuster derart, dass jeweils immer das ganze Argumentmuster instantiiert werden muss. Das heisst, der folgende Versuch, zwei vollständige Ursachenbündel in einem Argumentmuster zu kombinieren, ist nicht zulässig:

Jede LED, auf die ein genügend starkes Licht in einem geeigneten Winkel einfällt oder an der eine genügend grosse Spannung mit der richtigen Orientierung liegt, leuchtet. In der Situation $\alpha$ fällt ein genügend starkes Licht in einem geeigneten Winkel auf die LED oder in der Situation $\beta$ liegt eine genügend grosse Spannung mit der richtigen Orientierung an der LED. Also leuchtet die LED in $\alpha$ oder $\beta$.

Eine Instanz eines solchen Argumentmusters müsste jeweils sowohl $\alpha$ als auch $\beta$ ausfüllen und nicht nur eines der beiden. Ein solches Argumentmuster wäre also nur auf überdeterminierte LEDs anwendbar, entgegen der Absicht, zwei alternative Ursachen in einem Argumentmuster zu kombinieren.

In einem zweiten Versuch kann man nur eine Variable $\alpha$ benutzen, aber die Ausfüllinstruktionen so formulieren, dass sowohl Lichteinfall von aussen wie auch der Stromkreis einsetzbar sind. Das ergibt das bereits erwähnte folgende Argumentmuster:

Jede LED, auf die ein genügend starkes Licht in einem geeigneten Winkel einfällt oder an der eine genügend grosse Spannung mit der richtigen Orientierung liegt, leuchtet. In der Situation $\alpha$ sind diese Bedingungen erfüllt. Also leuchtet die LED in $\alpha$.

@Kitcher1989 [482] fordert jedoch von den verwendeten Prädikaten, dass diese projizierbar sind. Beliebige logische Verknüpfungen von projizierbaren Prädikaten, also insbesondere eine Disjunktion verschiedener Ursachenbündel, sind im Allgemeinen nicht mehr projizierbar. Dieses Argumentmuster ist deshalb nicht zulässig.

Ein sehr ähnliches Problem stellt sich auch bei der Kausaltheorie der minimalen Theorien. Die minimalen Theorie zum Leuchten von LEDs: $SO \vee LW \Ra W$ könnte man nämlich zu einer kleineren minimalen Theorie $AB \Ra W$ vereinfachen, in dem wir neue Prädikate $A$ und $B$ einführen, die extensional mit $S \vee L$ und $O \vee W$ übereinstimmen. Bezeichnen wir also die Orientierung der Spannung und der Winkel des Lichteinfalls als Wientierung und fassen genügend starken Lichteinfall und genügend starke Spannung unter dem Begriff der genügend starken Lannung zusammen, so leuchten alle LEDs mit einer genügend starken Lannung in der richtigen Wientierung. Die Instanzen beider neuen Prädikate sind immer noch lokalisierbar in Raum und Zeit, da es ja die Vereinigung der Instanzen der beiden zulässigen Prädikate ist.

Trotzdem ist dieser Schritt auch in der Kausaltheorie der minimalen Theorien nicht möglich, da die Prädikate Lannung und Wientierung keiner natürlichen Eigenschaft entsprechen. Hier erkennt man deutlich, warum die Begriffe der projizierbaren Prädikate bei Kitcher und der natürlichen Eigenschaften bei Baumgartner und Graßhoff zusammen fallen müssen, damit die These dieser Arbeit gilt, obwohl die beiden Begriffe auf komplett verschiedenen Anschauungen der Wissenschaft aufbauen. Es ist nämlich genau dies die Bedingung, die den Grad der Vereinheitlichung, respektive der Minimalisierung, überhaupt beschränkt. Sobald man eine Vereinheitlichung/Minimalisierung auf der einen Seite zulässt, auf der anderen jedoch nicht, in dem z.B. Lannung und Wientierung zwar projizierbar sind, aber nicht natürlichen Eigenschaften entsprechen, decken sich die minimalen Theorien einer Wirkung nicht mehr mit dessen Argumentmustern.

Ableitung der Kausaltheorie der minimalen Theorien

Aus der gegebenen Beschreibung der kausalen Argumentmuster und Kitchers komparativen Vereinheitlichungsbegriff ergeben sich alle konstitutiven Bedingungen der minimalen Theorien.

Aus dem komparativen Vereinheitlichungsbegriff von Kitcher folgt direkt, dass die Argumentmuster und damit insbesondere die kausalen Argumentmuster insgesamt minimiert werden müssen. Angenommen $S$ ist eine beliebige Systematisierung, die die komplette Instantiierung einer generierenden Menge von Argumentmustern $U$ ist [vgl @Kitcher1989, 434] und $U$ enthalte die zu der nicht minimalen Theorie $AB \vee CD \vee EF \Ra W$ entsprechenden Argumentmuster. Das heisst, in $U$ sind drei kausale Argumentmuster, die Ableitung von Instanzen von $W$ aus Instanzen der drei verschiedenen Ursachenbündel $AB$, $CD$ und $EF$ generieren. Da nach der Voraussetzung die angegebene Theorie nicht minimal notwendig ist, gibt es eine echte Teilmenge dieser drei Ursachenbündel, die immer noch notwendig für $W$ ist. In unserem Beispiel sei dies $AB \vee CD$. In dem Fall generiert die entsprechende echte Teilmenge der drei kausalen Argumentmuster für jede Instanz von $W$ ein Argument. Gibt es nämlich eine Instanz von $W$, die durch diese Teilmenge von Argumentmustern nicht erklärt wird, dann geht ihr keine Instanz von $AB \vee CD$ voraus, im Widerspruch zu unserer Annahme $AB \vee CD$ sei notwendig für $W$ und $AB \vee CD \vee EF$ keine minimale Theorie von $W$.

Mit diesem Wissen lässt sich aber eine besser vereinheitlichte Systematisierung $S'$ mit einer generierenden Menge von Argumentmustern $U'$ konstruieren, in dem alle Argumentmuster aus $U$ und dessen Instanzen übernommen werden, ausser demjenigen Argumentmuster, das es erlaubt, $W$ aus $EF$ abzuleiten. Diese neue Systematisierung $S'$ ist besser vereinheitlicht nach (C1), da mit weniger genau so stringente Argumentmuster die gleiche Menge von Konsequenzen erklärt wird.

Weniger eindeutig liegt die Lage bei der für minimale Theorien konstitutiven Bedingung, jedes einzelne Ursachenbündel müsse minimal hinreichend sein. Wie wir bereits gesehen haben, müssen nach Kitcher alle Instanzen von Argumentmustern deduktiv gültig sein. Mit diesem Anspruch ergibt sich zuerst einmal ein ähnliches Bild, wie bei der Kausaltheorie der minimalen Theorien. Man versucht eine möglichst breit anwendbare Regel zum Erklären von bestimmten Ereignissen zu erreichen, will dabei aber immer noch deduktiv gültige Argumente erhalten.

Schaut man Kitchers Argumentation jedoch genauer an, ergibt sich ein wesentlicher Unterschied: Kitcher stützt sich stark darauf ab, dass die Versuche, ein Argumentmuster $p$ in zwei Argumentmuster $p_1$ und $p_2$ aufzuteilen, zu nicht projizierbaren Prädikaten führen. Dies mag bei Kitchers Beispiel der Fall sein, in dem ein Prädikat "x is either hexed, or is unhexed and has molecular structure NaCl." [@Kitcher1989, 483] benötigt wird. Aber nehmen wir unser Beispiel mit der roten LED, wir betrachten also die die folgenden $n$ Argumentmuster:

Jede funktionierende rote/blaue/weisse... LED an der eine genügend grosse Spannung mit der richtigen Orientierung liegt, leuchtet. In der Situation $\alpha$ sind diese Bedingungen erfüllt. Also leuchtet die LED in $\alpha$.

Es scheint in diesem Moment schwierig zu behaupten, die Ausfüllinstruktionen in diesen Argumentmustern seien nicht projizierbar, ohne bereits vorauszusetzen, dass nur minimal hinreichende Ausfüllinstruktionen projizierbar sind. Dies gilt insbesondere, weil so ähnliche Argumentmuster notwendig würden, sobald wir die Farbe des Lichts in der Wirkung mit einbeziehen. Die aufgeteilten Argumentmuster sind aber stringenter als das allgemeinere Argumentmuster ohne den irrelevanten Faktor, da jede Instanz von einem $p_i$ auch eine Instanz von $p$ selber ist. Dadurch ergeben sich zwei nicht vergleichbare Systematisierungen von $K$, da eine Systematisierung stringentere Argumentmuster und die andere weniger Argumentmuster benutzt.

Kitcher sieht jedoch ein, dass die Einschränkung auf projizierbare Prädikate noch nicht genügt um alle irrelevanten Faktoren auszuschliessen. So betrachtet er das Argumentmuster, wonach alle verzauberbaren Salze sich in Wasser auflösen. Ein solches Argumentmuster ist genauso stringent und hat damit dieselben Instanzen und erklärt dieselben Konsequenzen wie das gebräuchliche Argumentmuster ohne den Zusatz.

Kitcher erweitert deshalb seine Theorie um das Prinzip, dass aus Gründen der Einfachheit redundante Prämissen oder unnötige Zwischenschritte gestrichen werden müssen. Kitcher wendet dieses Prinzip im Kontext von allgemeineren Theorien an, die Aussagen über die Auflösbarkeit verschiedenster Stoffe in Wasser machen. Ein solches allgemeineres und übergeordnetes Argumentmuster kann nicht direkt die Löslichkeit von verzauberbarem Salz in Wasser erklären, sondern nur indirekt über die Löslichkeit von beliebigem Salz.

In einem letzten Schritt könnte die alternative Erklärung noch überleben, indem man alle allgemeineren Argumentmuster wiederum mit dem Zusatz versieht, dass sie nur verzauberbare Substanzen betreffen. Das Argumentmuster, mit dem das Auflösen von verzaubertem Salz in Wasser erklärt wird, folgt dann wieder direkt aus einer chemischen Theorie über die Löslichkeit verschiedenster verzauberter Stoffe. Nach Kitcher kann aber ein solcher Zusatz nach dem selben Prinzip der Einfachheit gestrichen werden, da er in der ganzen Argumentationskette nicht verwendet wird, also idle ist.

In unserem Kontext schränken wir uns auf eine Ebene von Argumentmustern ein, nämlich kausale Argumentmuster, dessen Instanzen direkt singuläre Ereignisse mit Hilfe von hinreichenden Ursachen erklären. Eingeschränkt auf diese unterste Ebene scheint sich Kitchers Argumentation darauf zu reduzieren, dass die verwendeten Ursachen minimal hinreichend sein müssen. Das Problem mit dem unbenutzten Zusatz in Kitchers Beispiel ist nämlich gerade, dass dieser Zusatz durch sämtliche Ebenen hindurch mitgeführt werden muss, und damit auch auf der allgemeinsten Ebene immer noch als Prämisse steht, ohne dass diese für die Gültigkeit der Argumentation notwendig wäre.

Für kausale Argumentmuster bedeutet das aber, dass nur minimal hinreichende Bündel von Ereignistypen als Ursachen benutzt werden können solange keine übergeordneten, allgemeinere Theorien weitere kausal relevanten Faktoren postulieren. Die Farbe der LED ist in unserem Beispiel nicht relevant für die Gültigkeit der Instanzen des Argumentmusters, weil bereits das kleinere und einfachere Ursachenbündel hinreichend für das Leuchten ist, und das einfachere Argumentmuster ohne diesen Zusatz ist deshalb vorzuziehen.

Demnach benutzt also jedes kausale Argumentmuster genau ein minimal hinreichendes Ursachenbündel, um die zu erklärende Wirkung abzuleiten, solange allgemeinere Theorien nicht zusätzliche kausale Faktoren postulieren. Zudem werden alle Ableitungen von Instanzen von $W$ in der besten Systematisierung $E(K)$ von $K$ durch eine minimal notwendige Menge von kausalen Argumentmustern generiert. Die Definitionen von Ursache nach der Kausaltheorie der minimalen Theorien und nach Kitchers Programm sind also mit unseren Voraussetzungen exakt deckungsgleich.

Folgerungen

Wissenschaftlicher Realismus und Instrumentalismus

Wie wir bereits im Kapitel 6.3 gesehen haben, gehen sowohl Kitcher wie auch Baumgartner und Graßhoff von einer Menge von ausgezeichneten Prädikaten aus, um gewisse logische Spielereien und Trivialisierungen zu vermeiden. Sie begründen diese ausgezeichneten Prädikate jedoch sehr verschieden. Insbesondere behandelt Kitcher gesondert die Möglichkeit, dass durch eine neue wissenschaftliche Sprache $L'$ sich diese Menge verändern kann, respektive, dass mehrere alternative Mengen von ausgezeichneten Prädikaten existieren, und die wissenschaftliche Gemeinschaft sich für eine solche Menge entscheiden muss [vgl. @Kitcher1989, 488ff].

Diese Unterschiede in der Beschreibung der ausgezeichneten Prädikate implizieren eine sehr verschiedene Sichtweise der Wissenschaft und der wissenschaftlichen Sprache. Bei Baumgartner und Graßhoff entsprechen die benutzten Prädikate real existierenden Eigenschaften. Sie gehen demnach vom Standpunkt des wissenschaftlichen Realismus aus, wonach die in den wissenschaftlichen Theorien verwendeten Entitäten und damit auch deren Eigenschaften unabhängig von diesen Theorien existieren. Kitchers Beschreibung der projizierbaren Prädikate und deren Verwendung zum Aufbau einer empirischen Vereinheitlichungstheorie scheinen eher eine instrumentalistische Sichtweise zu implizieren. So kann nach Kitcher eine neue Sprache entwickelt werden, wonach andere Prädikate projizierbar werden und damit andere Argumentmuster gültig. Diese neue Sprache muss nur zu einer besser vereinheitlichten, empirisch adäquaten Systematisierung des gesamten Wissensschatzes $K$ führen, um die alte Sprache zu ersetzen.

Im Kapitel 6.3 war der wesentliche Punkt, dass weder Baumgartner und Graßhoff noch Kitcher die genaue Begründung und Beschreibung der ausgezeichneten Prädikate in ihren Theorien verwenden, und diese deshalb für die These dieser Arbeit gleichgesetzt werden dürfen. Umgekehrt kann man aber auch die unterschiedliche Behandlung der ausgezeichneten Prädikate auf die jeweils andere Theorie übertragen, insofern man in diesen Punkten jeweils nicht mit den jeweiligen Autoren übereinstimmt.

So ist eine Diskussion und Lösung der Probleme von natürlichen Prädikaten für einen wissenschaftlichen Realisten auf Kitchers Vereinheitlichungstheorie übertragbar, falls für diesen Kitchers Behandlung von Sprachwechsel nicht überzeugend ist. Er kann also die Existenz einer natürlichen Sprache $L_N$ postulieren, in der genau natürliche Eigenschaften projizierbar sind und Vereinheitlichung im Sinne Kitchers anhand dieser ausgezeichneten Sprache betrachten.

Auf der anderen Seite kann ein Instrumentalist, der die Existenz oder Erkennbarkeit von natürlichen Prädikaten anzweifelt, trotzdem die Kausaltheorie der minimalen Theorien verwenden, in dem er Kitchers Behandlung von Sprachwechsel auf die in dieser Arbeit entwickelten kausalen Argumentmuster anwendet und damit eine Kausaltheorie der minimalen Theorien aufbauend auf projizierbare Prädikate in einer beliebigen Sprache $L$ entwickelt.

Kettenproblem

Eine wichtige neue Komponente, die durch die Einbettung der Kausaltheorie der minimalen Theorien in Kitchers Vereinheitlichungstheorie entsteht, ist dass hinreichende Ursachenbündel nicht nur relativ zu einer bestimmten Wirkung minimiert werden müssen, sondern insgesamt für sämtliche kausal erklärten Ereignisse.

Dadurch wird die von Baumgartner und Graßhoff vorgeschlagene Lösung des Kettenproblems [@Baumgartner2004, 295ff], nämlich die Regel RIF, wonach Faktorenverschränkungen immer kausal zu interpretieren sind [@Baumgartner2004, 306], in die Kausaltheorie der minimalen Theorien eingebettet.

Baumgartner und Graßhoff definieren verschränkte Faktoren folgendermassen:

Zwei Faktoren $P$ und $Q$ sind genau dann miteinander verschränkt, wenn sämtliche Faktoren minimal hinreichender Bedingungen von $P$ auch in minimal hinreichenden Bedingungen von $Q$ enthalten sind oder wenn sämtliche Faktoren minimal hinreichender Bedingungen von $Q$ auch in minimal hinreichenden Bedingungen von $P$ enthalten sind.

Dieser Fall tritt immer auf, wenn $Q$ durch $P$ respektive $P$ durch $Q$ verursacht wird. Neben der Kausalkette sind jedoch auch verschränkte Epiphänomene, also zwei Wirkungstypen derselben Ursache, die zudem noch verschränkt sind, mit den genau gleichen Koinzidenzen kompatibel. Das heisst, verschränkte Epiphänomene und Kausalketten lassen sich empirisch nicht unterscheiden und sind nach den bisher beschriebenen Bedingungen der minimalen Theorien gleichwertige kausale Interpretationen der beobachteten Koinzidenzen. Dies bezeichnen @Baumgartner2004 [300] als das Kettenproblem.

Sie lösen dieses Problem durch die Regel RIF, wonach Faktorenverschränkungen immer kausal zu interpretieren sind [@Baumgartner2004, 306], also als kausale Kette und nicht als verschränktes Epiphänomen. Das heisst, falls auf sämtliche Instanzen eines Ereignisbündels immer auch eine Instanz sowohl von $P$ als auch von $Q$ folgt, dann ist wenn möglich eine minimale Theorie von $Q$ vorzuziehen, nach der $P$ kausal relevant ist für $Q$, nicht jedoch die Ursachen von $P$. Dies ist genau dann möglich, wenn alle hinreichenden Ursachenbündel von $P$ auch hinreichende Ursachenbündel von $Q$ sind, und die beiden Faktoren $P$ und $Q$ damit verschränkt sind.

Dieses zusätzliche Prinzip ist notwendig, weil in der Kausaltheorie der minimalen Theorien nur die verschiedenen alternativen Ursachenbündel zu einem bestimmten Wirkungstyp minimiert werden müssen. Wird die Kausaltheorie der minimalen Theorien jedoch aus Kitchers Vereinheitlichungstheorie abgeleitet, müssen alle Kausalbeziehungen insgesamt minimiert werden. Das heisst, wie wir bereits gesehen haben, dass alle nicht minimal notwendige Listen von Ursachenbündeln zu einem bestimmten Wirkungstyp ausgeschlossen sind. Das heisst aber auch, dass es ausgeschlossen ist, verschränkte Epiphänomene nicht kausal zu interpretieren.

In der einfachsten Form dieses Problems betrachten wir genau 3 Faktoren $A$, $B$ und $C$, so dass $A$ kausal relevant ist für $B$ und $B$ wiederum kausal relevant für $C$. Daraus ergeben sich die minimalen Theorien $AX_1 \vee Y_B \Ra B$ und $BX_2 \vee Y_C \Ra C$. Die hier als kausale Kette dargestellte Situation ist jedoch empirisch nicht zu unterscheiden von einem verschränkten Epiphänomen mit folgenden ebenfalls minimalen Theorien: $AX_1 \vee Y_B \Ra B$, $AX_1X_2 \vee X_2Y_B \vee Y_C \Ra C$. In dem Fall sind $B$ und $C$ Epiphänomene von $A$ und zusätzlich noch verschränkt, da alle Ursachen in der minimalen Theorie von $B$ auch in der minimalen Theorie von $C$ vorkommen [@Baumgartner2004, 296].

Um diese alternative Situation jedoch in Argumentmuster zu erfassen, benötigt man insgesamt drei Argumentmuster, wenn man die zusätzlichen Variablen für unbekannte Faktoren ausser acht lässt: jeweils ein Argumentmuster, um Instanzen von $C$ aus Instanzen von $A$ oder $B$ abzuleiten, und ein drittes um Instanzen von $B$ aus Instanzen von $A$ abzuleiten. Nach Kitcher ist demnach die erste Beschreibung der Situation vorzuziehen, da mit nur zwei Argumentmuster die gleiche Menge von Konsequenzen erklärt wird, solange wir zwei vergleichbare aber höchstens so stringente Argumentmuster in der zweiten Beschreibung finden. Dies ist möglich, da Stringenz extensional definiert ist und es deshalb genügt, wenn sich die Ausfüllinstruktionen extensional entsprechend überschneiden, selbst wenn dies nicht logisch aus den benutzten Formulierungen folgt.

Da aber immer wenn $B$ auftritt, auch eine Ursache von $B$ auftreten muss, also entweder $AX_1$ oder $Y_B$ gegeben ist, ist das Argumentmuster, das $C$ mit $BX_2$ erklärt, genau so stringent wie das Argumentmuster in der zweiten Beschreibung, das $C$ mit $AX_1X_2$ erklärt. Zudem ist in beiden Varianten dasselbe Argumentmuster enthalten, das $B$ mit $AX_1$ erklärt.

Dies gilt für alle nach dem Algorithmus von @Baumgartner2004 [297,298] umgeformten Kausalgraphen. Das Resultat des Algorithmus wird immer insgesamt mehr kausale Beziehungen beinhalten als der ursprüngliche Graph, der Kausalketten benutzt. Da die beiden Graphen jedoch empirisch äquivalent sind, werden die jeweiligen Argumentmuster jeweils immer nach Stringenz vergleichbar sein und der Graph mit Kausalketten deshalb immer besser vereinheitlicht sind als der entsprechende Graph ohne Kausalketten.

Konklusion

In dieser Arbeit habe ich mehrere starke Ähnlichkeiten zwischen Kitchers Vereinheitlichungstheorie der Erklärung und der Kausaltheorie der minimalen Theorien von Baumgartner und Graßhoff gezeigt. Mit einer geeigneten Interpretation von Kitchers Vereinheitlichungstheorie und einigen Voraussetzungen über Kausalität lässt sich mit Hilfe von diesen Ähnlichkeiten die Kausaltheorie der minimalen Theorien direkt aus Kitchers Vereinheitlichungstheorie ableiten, indem Ursachen mit erklärenden Ereignissen gleichgesetzt werden.

Dadurch wird die von Baumgartner und Graßhoff zusätzlich postulierte Auflösung des Kettenproblems auf dieselbe Grundlage gestellt, wie die minimalen Theorien selbst. In beiden Fällen geht es darum, möglichst wenige kausale Argumentmuster zu verwenden, um möglichst viele bekannte Ereignisse der Welt zu erklären.

APPENDIX

Vereinfachung von Kitchers Vereinheitlichungsbegriff

Im Haupttext wurde eine partielle Ordnung $\leq_C$ auf Mengen von Argumentmustern $U$, $V$ verwendet, die nicht strikt ist. Das heisst für $\leq_C$ und beliebige Mengen von Argumentmuster $U$, $V$ und $W$ gelten folgende Gesetze:

  1. $U \leq_C U$ (Reflexivität)
  2. $U \leq_C V$ und $V \leq_C U \Ra U=V$ (Symmetrie)
  3. $U \leq_C V$ und $V \leq_C W \Ra U \leq_C W$ (Transitivität)

Diese partielle Ordnung unterscheidet sich von einer totalen Ordnung (wie z.B. $\leq$ auf den reellen Zahlen) ausschliesslich dadurch, dass es nicht vergleichbare Elemente geben kann. Es ist also bei unserer partiellen Ordnung $\leq_C$ möglich, dass es zwei verschiedene Mengen von Argumentmustern $U,V$ gibt, so dass weder $U \leq_C V$ noch $V \leq_C U$ gilt.

Kitcher dagegen spricht implizit von einer strikten partiellen Ordnung, da nach ihm sein Prinzip (C) asymmetrisch und transitiv ist [@Kitcher1989, 479]. Im folgenden soll $<_C$ für Kitchers strikte partielle Ordnung (C) stehen. $<_C$ ist also wie auch $\leq_C$ transitiv, im Gegensatz zu $\leq_C$ jedoch asymmetrisch. Das heisst, für $<_C$ und beliebige Mengen von Argumentmuster $U$, $V$ und $W$ gelten folgende Gesetze:

  1. $U \nless_C U$ (Irreflexivität)
  2. $U <_C V \Ra V \nless_C U$ (Asymmetrie)
  3. $U <_C V$ und $V <_C W \Ra U <_C W$ (Transitivität)

Wie die verwendeten Symbole bereits andeuten, ist dies genau der selbe Unterschied der auch zwischen den bereits bekannten totalen Ordnungen $<$ und $\leq$ für die reellen Zahlen besteht.

Der Vorteil von Kitchers Darstellung ist, dass er es vermeidet, Äquivalenzbedingungen für Argumentmuster und darauf aufbauend für Mengen von Argumentmustern festzulegen, wie dies in der folgenden Beschreibung von $\leq_C$ nötig sein wird. Auf der anderen Seite muss er Prinzip (O) und den Stringenzbegriff sehr vorsichtig definieren, um auf diese Äquivalenzbedingungen zu verzichten. Zudem werden die folgenden Beweise für die von Kitcher übernommenen Behauptungen über die Ordnung (C) komplizierter, die ja auf diese Definitionen aufbauen.

Die partielle Ordnung (T),(R)

Kitcher definiert mit Hilfe des Prinzips (T) eine partielle Ordnung auf Argumentmustern mit gleicher Struktur [@Kitcher1989, 479]. Demnach ist ein Argumentmuster $p$ genau dann mindestens so stringent wie ein weiteres Argumentmuster $q$, wenn beide die gleiche Struktur besitzen und die Instanzen von $p$ eine Teilmenge der Instanzen von $q$ sind. $p$ ist genau dann stringenter als $q$, wenn zusätzlich die Instanzen von $p$ eine echte Teilmenge der Instanzen von $q$ sind. 5

Durch (R) erweitert er diese Definition auf Argumentmuster, mit sehr ähnlicher Struktur [@Kitcher1989, 480]. Gegeben zwei Argumentmuster $p$ und $q$, darf nämlich nach (R) das stringentere Argumentmuster $q$ zusätzliche schematische Sätze enthalten, die ein allgemeines Prinzip in $p$, durch logisch gültige Ableitungen ersetzt.

Im folgenden schreibe ich $p \leq_S q$ dafür, dass $q$ mindestens so stringent ist wie $p$. Zudem sollen $I(p)$ für die Menge der Instanzen des Argumentmusters $p$ stehen. $p$, $q$ und $r$ stehen immer für beliebige Argumentmuster. Es handelt sich bei $\leq_S$ um eine partielle Ordnung auf Argumentmustern, wie der folgende Beweis zeigen soll:

  1. $p$ hat trivialerweise die gleich Struktur wie $p$ selber, und es gilt $I(p) \subseteq I(p)$. Nach (T) gilt also $p \leq_S p$ für alle Argumentmuster $p$.

  2. Angenommen, es gilt $p \leq_S q$ und $q \leq_S p$. Demnach ist das Prinzip (R) ausgeschlossen, da nicht sowohl $p$ als auch $q$ zusätzliche schematische Sätze enthalten können. Demnach haben $p$ und $q$ die exakt gleiche Struktur, und es gilt $I(q) \subseteq I(p)$ und $I(p) \subseteq I(q)$. Daraus folgt $I(p) = I(q)$. Bis auf unwesentliche Unterschiede in der Formulierung sind also alle Ausfüllinstruktionen von $p$ und $q$ für unsere Zwecke gleich. Genauer gesagt impliziert die Definition von $\leq_S$ eine extensionale Sichtweise der Ausfüllinstruktionen und aus $p \leq_S q$ und $q \leq_S p$ folgt dem entsprechend, dass die Ausfüllinstruktionen extensional äquivalent sind. Da nun $p$ und $q$ also die gleiche Struktur und extensional äquivalente Ausfüllinstruktionen haben, gilt $p = q$.6

  1. Angenommen, es gilt $p \leq_S q$ und $q \leq_S r$. Daraus folgt nach Definition $I(r) \subseteq I(q) \subseteq I(p)$, woraus auch $I(r) \subseteq I(p)$ folgt. Gilt eine oder beide der Ungleichungen wegen dem Prinzip (R), dann gilt auch $p \leq_S r$ nach (R), da alle schematischen Sätze von $p$ in $q$ und damit auch in $r$ enthalten sind. Wurde in beiden Fällen Prinzip (T) verwendet, hat $p$ die gleiche Struktur wie $q$ und damit auch wie $r$, und es gilt $p \leq_S r$ nach (T).

$\leq_S$ ist also eine partielle Ordnung auf der Menge aller Argumentmuster.

Die strikte partielle Ordnung (C)

Ich werde im folgenden (wie auch Kitcher) $U$, $U'$ und $U^$ für Mengen von Argumentmustern sowie $S$, $S'$ und $S^$ für die entsprechenden kompletten Instantiierungen benutzen. Ausserdem soll $U <_C U'$ dafür stehen, dass nach dem Prinzip (C) von Kitcher $U'$ besser Vereinheitlicht ist als $U$. Kitcher formuliert Prinzip (C) folgendermassen:

(C) Let $U$, $U'$ be sets of patterns and $S$, $S'$ their complete instantiations with respect to $K$. Then $U$ has greater unifying power than $U'$ if one (or both) of the following conditions is met.

(C1) $C(S')$ is a subset of $C(S)$, possibly though not necessarily proper, and there is a one-one mapping $f$ from $S$ to $S'$ such that for each pattern $p$ in $S$, $p$ is at least as stringent as $f(p)$, and such that either $f$ is an injection or $f$ is a surjection and there is at least one pattern $p$ in $S$ such that $p$ is more stringent than $f(p)$.

(C2) $C(S')$ is a proper subset of $C(S)$ and there is a one-one map $f$ from $S$ to $S'$ (either an injection or a surjection) such that for each $p$ in $S$, $p$ is at least as stringent as $f(p)$. [@Kitcher1989, 478]

An mehreren Stellen in seiner Definition von (C) benutzt Kitcher Funktionen zwischen den kompletten Instantiierungen $S$, $S'$ und $S^$, spricht dann aber über diese Funktionen als würden sie Argumentmuster aufeinander abbilden. Insbesondere werden Argumente und Bilder der Funktionen nach ihrer Stringenz verglichen. $S$, $S'$ und $S^$ sind jedoch Mengen von Ableitungen, die nicht mehr nach Stringenz vergleichbar sind. Ich gehe deshalb davon aus, dass dies ein Fehler in Kitchers Text ist, und tatsächlich Funktionen zwischen den Mengen von Argumentmustern $U$, $U'$ und $U^$ gemeint sind. Diese Interpretation ist auch konsistent mit Kitchers Formulierung von Prinzip (O) [@Kitcher1989, 478], in der tatsächlich von Funktionen zwischen den Mengen von Argumentmustern $U$, $U'$ und $U^$ die Rede ist.

Kitcher scheint auch die Begriffe injektiv, surjektiv und bijektiv nicht genau in ihrem normalen mathematischen Sinn zu gebrauchen. Ich wiederhole deshalb im folgenden die normalen mathematischen Definitionen dieser Begriffe, bevor ich meine Interpretation von Kitchers Verwendung darstelle und diese auch begründe.

Eine Funktion $f: A \ra B$, weist jedem Element $a$ aus der Definitionsmenge $A$ ein Element $f(a)$ der Zielmenge $B$ zu. Dieses Element $f(a)$ heisst Bild von $a$ unter $f$.

Eine Funktion $f: A \ra B$ ist injektiv falls jedes Element $b$ aus $B$ Bild von höchstens einem Element $a$ aus $A$ ist, also folgender Zusammenhang gilt: $f(a) = f(b) \Ra a = b$.

Eine Funktion $f: A \ra B$ ist surjektiv falls jedes Element $b$ aus $B$ Bild von mindestens einem Element $a$ ist, also die Bildmenge ${f(a) | a \in A}$ von $A$ unter $f$ gerade ganz $B$ ist.

Eine Funktion $f: A \ra B$ ist bijektiv, falls sie injektiv und surjektiv ist, also jedes Element $b$ aus $B$ Bild von genau einem Element $a$ aus $A$ ist.

Die Verknüpfung $f \circ g: A \ra C$ zweier Funktionen $f: B \ra C$ und $g: A \ra B$ ist die Funktion von $A$ nach $C$ die entsteht, wenn auf ein Element $x \in A$ zuerst $g$ und dann $f$ angewendet wird. Das heisst $f \circ g(x) = f(g(x))$ für alle $x \in A$.

Kitcher definiert diese Begriffe jedoch folgendermassen:

(A bijection is a one-one mapping. A bijection from $A$ to a subset of $B$ is an injection into $B$. A bijection that is onto B is a surjection) [@Kitcher1989, 478]

Übertragen auf den normalen Sprachgebrauch ist diese Definition so zu verstehen, dass eine surjektive Funktion auch bereits bijektiv ist und Kitcher in den folgenden Definitionen immer nur injektive Funktionen betrachtet, was er auch damit zum Ausdruck bringt, dass alle Funktionen immer one-one sind. Ich gehe weiter davon aus, dass Kitcher in seiner Definition von injektiv von einer echten Teilmenge von $B$ spricht. Das heisst eine injektive Funktion $f: A \ra B$ ist nach Kitcher nur eine echte injektive Funktion, in dem Sinn, dass sie keine bijektive Funktion ist, also ein Element $b$ aus $B$ existiert, das nicht Bild von irgendeinem Element $a$ aus $A$ ist. Ich werde deshalb im folgenden die Begriffe echt injektiv und bijektiv Anstatt der von Kitcher verwendeten Begriffe injektiv und surjektiv verwenden. Zudem scheint Kitcher nur endliche Mengen von Argumentmuster in Betracht zu ziehen (die natürlich eine unendliche Menge von Instanzen haben können).

Diese Interpretation stütze ich neben der mehrdeutigen und kurzen Definition der Begriffe von Kitcher, in erster Linie auf folgende Aussage:

It is not hard to show that the comparative relation introduced by (C) has the right features to order sets of patterns with respect to unifying power. It is both asymmetric and transitive. [@Kitcher1989, 479]

Gegeben der normalen Definitionen von injektiv, surjektiv und bijektiv, oder gegeben unendlicher Mengen von Argumentmuster ist diese Aussage falsch. Es sind entweder schwierige Beweise der behaupteten Eigenschaften, oder die behaupteten Eigenschaften stimmen überhaupt nicht. In meiner Interpretation sind diese Eigenschaften jedoch tatsächlich einfach zu zeigen, wie der folgende Beweis zeigt:

  1. Angenommen es gilt $U <_C U'$ und $U' <_C U$ für zwei beliebige Mengen von Argumentmuster $U$ und $U'$. In dem Fall gilt auch $C(S) \subseteq C(S')$ und $C(S') \subseteq C(S)$, woraus $C(S) = C(S')$ folgt. (C2) ist dadurch ausgeschlossen, da weder $C(S)$ eine echte Teilmenge von $C(S')$ ist, noch umgekehrt. Es existieren also zwei Funktionen $f: U' \ra U$ und $g: U \ra U'$, die den Bedingungen von (C1) genügen. Demnach gilt für die Anzahl Argumentmuster $|U|$ in $U$ und der Anzahl Argumentmuster $|U'|$ in $U'$: $|U| \leq |U'|$ und $|U'| \leq |U|$. Daraus folgt aber $|U| = |U'|$ und somit sind $f$ und $g$ bijektiv, da injektive Funktionen zwischen endlichen Mengen mit gleich vielen Elementen immer bereits bijektiv sind.

    Das heisst, $f$ und $g$ sind nicht echt injektiv, und es gibt ein Argumentmuster $p$ in $U'$, so dass dieses echt stringenter als $f(p)$ in $U$ und damit auch echt stringenter als $g \circ f(p)$ in $U'$ ist. Es gilt demnach auch $g \circ f(p) \neq p$. Betrachten wir nun die bijektive Funktion $h := g \circ f$ von $U'$ nach $U'$ sowie die Folge $h^n(p)$ von Argumentmustern in $U'$, die durch wiederholtes Anwenden von $h$ auf $p$ entsteht. Es gilt $h^n(p) \neq h^m(p)$ für beliebige $n > m > 1$, da $h$ bijektiv ist und $h^m(p)$ bereits Bild von $h^{m-1}(p)$ unter $h$ ist. Zudem gilt auch $h^n(p) \neq p$, da $h^n(p)$ echt stringenter als $p$ ist. Also bildet $h^n(p)$ eine unendliche Folge in $U'$. Dies widerspricht der Voraussetzung, dass $U'$ nur endlich viele Elemente enthält.

    Es gilt also nicht $U <_C U'$ und $U' <_C U$, und $<_C$ ist demnach asymmetrisch. Daraus folgt auch $U \nless_C U$ für beliebige Mengen von Argumentmustern $U$. $<_C$ ist also auch irreflexiv.

  2. Angenommen es gilt $U &lt;_C U'$ und $U' <_C U^$ für drei beliebige Mengen von Argumentmuster $U$, $U'$ und $U^$. In dem Fall gilt $C(S) \subseteq C(S') \subseteq C(S^)$ und es existieren Funktionen $f: U' \ra U$ und $g: U^ \ra U'$, die entsprechend den Bedingungen von (C1) oder (C2) genügen. Wir unterscheiden folgende Fälle:

    a. $g$ oder $f$ ist echt injektiv. In dem Fall ist $f \circ g: U^* \ra U$ echt injektiv und es gilt $U &lt;_C U^*$ nach (C1).

    b. $g$ und $f$ sind bijektiv und es existiert ein Argumentmuster $p$ in $U^$, so dass $g(p)$ echt stringenter ist als $p$. In dem Fall ist das Bild $f \circ g(p)$ von $p$ unter der bijektiven Funktion $f \circ g: U^ \ra U$ auch echt stringenter als $p$ und es gilt $U &lt;_C U^*$ nach (C1).

    c. $g$ und $f$ sind bijektiv und $C(S')$ ist eine echte Teilmenge von $C(S^)$. In dem Fall ist auch $C(S)$ eine echte Teilmenge von $C(S^)$ und zusammen mit der bijektiven Funktion $f \circ g: U^* \ra U$ gilt $U &lt;_C U^*$ nach (C2).

    Damit sind alle möglichen Fälle abgedeckt, und $&lt;_C$ ist transitiv.

Würde man die Begriffe injektiv und surjektiv von Kitcher nicht in der hier gegeben Weise interpretieren oder würde man unendliche Mengen von Argumentmustern zulassen, entstünden folgende Probleme:

  1. $&lt;_C$ wäre trivialerweise reflexiv, d.h. $U &lt;_C U$ würde für jede beliebige Menge von Argumentmustern gelten. Es gilt natürlich $C(S) \subseteq C(S)$ und mit der Identität $id: U \ra U$, die einem Element $x \in U$ das selbe Element $id(x) = x$ zuordnet, wäre eine bijektive und damit auch injektive Funktion gegeben, die die Bedingungen von (C1) erfüllt.

    Selbst wenn nur echte injektive Funktionen $f: U \ra U$ zugelassen sind, könnte eine solche für unendliche Mengen $U$ durchaus existieren, genau so wie z.B. die Funktion $f: \mathbb{N} \ra \mathbb{N}$ mit $f(x) = 2x$ echt injektiv ist.

    Eine asymmetrische Relation kann aber nicht reflexiv sein, da ja aus $U &lt;_C U$ dann $U \nless_C U$ folgen müsste.

  2. Der gegebene Beweis für die Asymmetrie von $&lt;_C$ würde nicht funktionieren. Zudem könnte man einfach Beispiele von unendlichen Mengen $U$ und $U'$ konstruieren, so dass sowohl $U &lt;_C U'$ und $U' &lt;_C U$ gilt. $&lt;_C$ wäre also im Gegensatz zu Kitchers Behauptung auch nicht asymmetrisch.

  3. $&lt;_C$ wäre kaum transitiv. Die Verknüpfung $f \circ g$ einer injektiven Funktion mit einer surjektiven muss nämlich dann weder injektiv noch surjektiv sein. Da wir aber im Beweis der Transitivität eine surjektive oder injektive Funktion $h: U^* \ra U$ benötigen, müsste man diese anderweitig konstruieren. Allerdings muss dass Bild $h(p)$ von einem Argumentmuster $p$ mit diesem nach Stringenz vergleichbar sein. Die einzigen Argumentmuster, von denen wir aber wissen, dass sie nach Stringenz vergleichbar sind, sind diejenigen, die durch $f$ und $g$ aufeinander abgebildet werden.

  4. Eine Menge von Argumentmustern $U$, in der ein bestimmtes Argumentmuster $p$ aus $V$ aufgeteilt wird in $p_1$ und $p_2$, so dass $p \leq_S p_1$ und $p \leq_S p_2$ gilt, wäre besser vereinheitlicht als $V$. Die Funktion $f: U \ra V$, die $p_1$ und $p_2$ auf $p$ abbildet, und alle anderen Argumentmuster auf sich selbst, würde dann nämlich den Bedingungen von (C1) genügen. Dies scheint im Widerspruch zu folgender nicht ganz eindeutigen Aussage von Kitcher über genau solch eine Situation:

    Now, of course, it begins to look as though the basis of S' will lose on the paucity of patterns but win on stringency. [@Kitcher1989, 481]

    In dieser Aussage scheint Kitcher davon auszugehen, dass $U$ und $V$ und ihre Instanzmengen $S'$ und $S$ nicht vergleichbar sind, da sich zwei seiner gegebenen Kriterien widersprechen.

Die partielle Ordnung $\leq_C$

Lässt man die Bedingung fallen, dass in (C1) nur echt injektive Funktionen zugelassen sind, und beschränkt sich zudem auf Mengen, die keine nach Stringenz vergleichbare Argumentmuster enthalten7, erhält man die von mir verwendete nicht strikte Ordnung $\leq_C$. $\leq_C$ ist dann nämlich trivialerweise reflexiv, wie wir im Punkt 1 oben gesehen haben, und der selbe Transitivitätsbeweis funktioniert immer noch. Zudem ist $\leq_C$ damit symmetrisch, wie der folgende Beweis zeigt:

Angenommen, es gilt $U \leq_C U'$ und $U' \leq_C U$ für zwei Mengen von Argumentmuster $U$ und $U'$. Wiederum gilt also $C(S) \subseteq C(S')$ und $C(S') \subseteq C(S)$ und damit $C(S) = C(S')$. Damit ist wieder (C2) ausgeschlossen und es existieren Funktionen $f: U' \ra U$ und $g: U \ra U'$, die den Bedingungen von (C1) genügen. Gäbe es ein Argumentmuster $p$ in $U'$, so dass dieses echt stringenter als $f(p)$ ist, dann wäre es auch echt stringenter als $g \circ f(p)$ in $U'$ und daraus würde $g \circ f(p) \neq p$ folgen. $p \in U'$ und $g \circ f(p) \in U'$ sind damit aber zwei verschiedene nach Stringenz vergleichbare Argumentmuster in $U'$, einen Fall den wir ausgeschlossen haben. Es gibt also keine solchen Argumentmuster und $g$ ist die Umkehrfunktion von $f$, d.h. $g \circ f(p) = p$ für alle $p$ in $U'$. In dem Fall haben $U$ und $U'$ genau gleich viele Elemente und es gilt jeweils $p = g \circ f(p) \leq_S f(p) \leq_S p$, woraus $p = f(p)$ folgt. $\leq_C$ ist also symmetrisch.

Es ist klar, dass bei endlichen Mengen die Defintionsmenge einer echt injektiven Funktion echt weniger Elemente enthält als die Zielmenge, da jedem Element aus der Zielmenge höchstens ein Element aus der Definitionsmenge zugeordnet wird. Zudem haben Definitionsmengen von bijektiven Funktionen genau gleich viele Elemente wie deren Zielmengen. Mit meiner Interpretation, dass Kitcher nur endliche Mengen von Argumentmuster und nur injektive Funktionen zwischen diesen Mengen in Betracht zieht, ist also die im Hauptteil verwendete Zusammenfassung von Kitchers Prinzip (C) korrekt.

Literatur

Footnotes

  1. Ich übernehme in dieser Arbeit das Vokabular von @Baumgartner2004 [36--40]. Das heisst Ereignisse werden in einem sehr allgemeinen Sinn aufgefasst, der Zustände und Zustandsveränderungen gleichermassen miteinbezieht. Zudem kann sich je nach Kontext der Begriff Ereignis sowohl auf in Raum und Zeit lokalisierbare, singuläre Ereignisse beziehen, als auch auf Ereignistypen, die auf verschiedene singuläre Ereignisse zutreffen und deshalb nicht in Raum und Zeit lokalisierbar sind. Der Begriff Faktor bezieht sich jedoch ausschliesslich auf Ereignistypen.

    Ein Bündel ist eine Liste mehrerer logisch unabhängiger Ereignistypen, die zusammen eine komplexe Ursache bilden. Das heisst, die Instanzen eines Ursachenbündel sind Koinzidenzen [vgl @Baumgartner2004, 44--46] aller Ereignistypen im Bündel, also Instanzen der gegebenen Ereignistypen, die in geeigneter räumlicher und zeitlicher Nähe zueinander stattfinden.

  2. In der Mathematik ist eine partielle Ordnung definiert als eine Relation $R$ auf einer Menge $M$, so dass die folgenden drei Bedingungen für alle $a,b,c \in M$ erfüllt sind:

    1. $aRa$ (Reflexivität)
    2. $aRb$ und $bRa \Ra a=b$ (Symmetrie)
    3. $aRb$ und $bRc \Ra aRc$ (Transitivität)

    Eine partielle Ordnung unterscheidet sich von den allgemein bekannten totalen Ordnungen (wie z.B. $\leq$ auf den reellen Zahlen) ausschliesslich dadurch, dass es nicht vergleichbare Elemente geben kann. Es ist also bei einer partiellen Ordnung $R$ möglich, dass es zwei verschiedene Elemente $a,b \in M$ gibt, so dass weder $aRb$ noch $bRa$ gilt.

  3. An dieser Stelle verwendet Kitcher eine stärkere Version von seinem Prinzip (O). Er geht nämlich nicht nur davon aus, dass zu zwei beliebigen Mengen von Argumentmustern $U$ und $U'$ mindestens eine obere Schranke $U^*$ besteht, sondern dass zu allen generativen Mengen von Argumentmustern $U_1, U_2, ...$ zu einer Systematisierung $S$ eine eindeutige oberste Schranke $U$ existiert. Dies folgt aus dem Prinzip (O) nur im endlichen Fall. Im unendlichen Fall kann es sein, dass (O) erfüllt ist, es aber zu einer unendlichen Anzahl von generativen Mengen von Argumentmustern $U_1, U_2, ...$ keine eindeutige obere Schranke gibt.

    Nehmen wir als Beispiel das offene reelle Intervall $(0,1)$ und die folgende unendliche Menge $M$ von Zahlen in diesem Intervall: ${1 - 1/n|n \in \mathbb{N}}$ mit der bekannten Ordnung $<$. Obwohl in $(0,1)$ zwei beliebige Zahlen eine obere Schranke haben und damit Prinzip (O) erfüllen, besitzt $M$ selber keine obere Schranke in $(0,1)$, denn das Supremum $sup(M)$ von $M$ ist 1 und liegt nicht mehr im gegeben Intervall. Genauso hat ganz $\mathbb{N}$ selber keine obere Schranke, obwohl zwei beliebige Zahlen aus $\mathbb{N}$ eine obere Schranke besitzen.

  4. In diesem wie in allen folgenden Argumentmustern, bestimmt der erste Satz die Ausfüllinstruktionen. Die nächsten zwei Sätze sind schematische Sätze, wobei der erste Satz die Prämisse und der zweite Satz die Konklusion ist.

  5. Eine echte Teilmenge $U \subset M$ ist eine Menge $U$, die in $M$ enthalten ist, aber nicht bereits ganz $M$ ist. Das heisst, es existiert ein Element $m \in M$, das nicht in $U$ enthalten ist. Im Gegensatz dazu kann eine unechte Teilmenge $U \subseteq M$ auch bereits ganz $M$ sein, so dass kein solches $m \in M$ existiert.

  6. Dieses Eingeständnis ist nötig, um $\leq_S$ und in der Folge $\leq_C$ als partielle Ordnung aufzufassen. Kitcher bezeichnet sein Prinzip (C) als strikte Ordnung und macht keine Angabe über den Stringenzbegriff (der demnach nach Kitcher wohl nur transitiv und reflexiv, aber nicht symmetrisch ist). Er vermeidet damit, Argumentmuster in der Weise gleichsetzen zu müssen, wie das hier geschieht.

  7. Dies ist legitim, weil Mengen von Argumentmuster $U$, die mehrere nach Stringenz vergleichbare Argumentmuster $p \leq_S q$ enthalten, immer weniger gut Vereinheitlicht sind, als die selben Mengen von Argumentmuster $V = U - {q}, in der das stringentere Argumentmuster $q$ weggelassen wird. Die Funktion $f: V \ra U$, die jedes Argumentmuster auf sich selbst abbildet, ist dann nämlich echt injektiv und erfüllt die Bedingungen von (C1). Zudem sind die Instanzen $I(q)$ von $q$ in den Instanzen $I(p)$ von $p$ enthalten, woraus auch folgt, dass die gleiche Systematisierungen $S$ von $U$ und $V$ generiert wird.