Entweder
- zu häufig vorkommende und damit überflüssige Informationen
oder - Redundanz als Backup verstanden.
Name und Nummern zu häufig.
- Schwesternnummer & -name je in Stationsdatei & Schwesterndatei
- Patientenname je in Patientendatei und Ärztedatei
- Medikamentennummer & -name je in Schwesterndatei & Meidkamentendatei
mögliche Probleme daraus:
- irreführende "Verknüpfungen" bei diversen LookUp-Aktionen aus verschiedenen/mehreren Tabellen
- mehr Speicherplatz durch größere Datenmenge benötigt
- Suchoperationen dauern länger, da mehrere Tabellen untersucht/durchsucht werden müssen
siehe Bild
πStadt ((((σWarenname="Muttern"(WAREN)) ⋈Warennr(EINZELBESTELLUNGEN)) ⋈Bestellnr(BESTELLUNGEN)) ⋈Kundennr(KUNDEN))
Ergebnis: Rosenheim & Ulm
πWarennr (σKundennr="C5"(BESTELLUNGEN) ⋈Bestellnr(EINZELBESTELLUNGEN))
Ergebnis: S1
πWaren (σMenge > 150(EINZELBESTELLUNGEN) ⋈Warennr(WAREN))
Ergebnis: Schrauben & Nägel
πBestellnr (σKundenname="Meier"(KUNDEN) ⋃ σKundenname="Müller"(KUNDEN) ⋈Kundennr(BESTELLUNGEN))
Ergebnis: O1 & O2
πWarenname (((σKundenname="Meier"(KUNDEN) ⋃ σKundenname="Müller"(KUNDEN) ⋈Kundennr(BESTELLUNGEN)) ⋈Bestellnr(EINZELBESTELLUNGEN)) ⋈Warennr(WAREN))
Ergebnis: Muttern, Nägel & Schrauben
Das Data Dictionary wird auch "database about the database" genannt. Hierin werden alle Informationen über die logische Struktur der Datenbank gehalten.
Die zwei verschiedenen Arten eines Data Dictionary sind ein "integrated data dictionary" (als Teil des DBMS) und ein "freestanding data dictionary"(third party/kommerzielle Software oder auch simple Datei).
Beim integrated data dictionary ist als Pro zu nennen, dass es immer konsistent mit der eigentlichen Datenbank gehalten wird, da es vom DBMS selbst verwaltet wird.
Als großer Vorteil der freestanding-Variante wird gesehen, dass diese es den Designern der DB erlaubt die DB unabhängig von der eigentlichen Implementierung zu designen. Ein Nachteil hiervon ist aber, dass spätere Änderungen der eigentlichen Implementierung möglicherweise nicht im Data Dictionary mit aufgenommen werden können und es somit keine korrekte Darstellung der DB mehr liefern kann.