Datenmodell
Zur Verwaltung der eingescannten Notenblätter mit ihren Daten wurde eine DB2 Datenbank namens enote erstellt. In ihr werden nicht nur die Notenhandschriften
gespeichert, sondern vorallem ihre zugehörigen bibliothekarischen Metadaten und die Merkmale der Schreibercharateristik in Form von Feature-Vektoren.
Zur logischen Abgrenzung der Daten wurden für die Tabellendefinitionen der enote-Datenbank vier verschiedene Schemata verwendet.
- DICT: Das Schema DICT wird zur Definition von Tabellen verwendet, in denen Handschriftenmerkmale
gespeichert werden. Sie repräsentieren die Feature-Base.
- FEATURES: Die Merkmale bzw. die Resultate von semi-automatischen Analysen werden in den
Tabellen des Schemas FEATURES gespeichert.
- METADATA: Dieses Schema dient zur Definition von Tabellen zur Beschreibung der Quellen bzw.
zur Speicherung der Bibliotheksdaten und der digitalisierten Notenhandschriften.
- IPFV: Die Merkmale der Notenhandschriften (insbesondere der Notenköpfe und Notenzeilen)
werden in den Tabellen des Schemas IPFV gespeichert.
Im folgendem werden die einzelnen Tabellen vorgestellt. Für weitere Informationen empfiehlt sich die Dokumentation zu lesen.
Die Baumstruktur der Feature Base stellt die Charakteristik der Notenhandschriften dar. Die folgenden Tabellen im Datenbankschema DICT repräsentieren diese
Baumstruktur:
- Node_Type gibt an, welche verschiedenen Typen von Knoten (Nodes) es gibt
- Nodes beinhaltet Daten über die Merkmale von Handschriften
- Distances speichert die Distanz (Abstand) zwischen zwei Knoten bzw. zwischen zwei Handschriftenmerkmalen
Für genauere Attributdefinitionen siehe: Relationales Datenmodell des Schemas DICT
Das Schema FEATURES beinhaltet Tabellen, die die Ergebnisse von der Analyse der Handschriften speichern. Das Ergebnis von jeder Handschriftenanalyse ist ein
Feature-Vektor, der eine ausgewählte Menge von Handschriftenmerkmalen vereint. Ein Feature-Vektor kann zu einem oder auch mehreren Musikmanuscripten und auch ein
oder mehrere Scribes zugeordnet werden. In dem Datenbankschema FEATURES sind folgende Tabellen definiert:
- Featurevectors repräsentieren die Feature-Vektoren
- MMS_FV speichert die Zuordnungen zwischen Feature-Vektoren und den Musikmanuscripten
- FVvalues speichert die Werte eines Features und ordnet sie zu den Feature-Vektoren zu
Das Relationale Datenmodell des Schemas FEATURES gibt nähere Informationen zu den Attributdefinitionen.
In diesem Schema sind Tabellen definiert, die Daten zu den Notenhandschriften speichern, wie zum Beispiel: die Bilddateien, allgemeine Informationen zu den einzelnen
Notenblättern aus dem Bibliothekskatalog, die Komponisten und die Kopisten. In dem Datenbankschema METADATA sind folgende Tabellen definiert:
- In Music_Manuscript werden allgemeine bibliothekarische Informationen zu den Musik-Manuscripten gespeichert.
Dabei gilt das RISM-Siegel der Bibliothek, das eindeutig die Bibliothek kennzeichnet und die Bibliothekssignatur der Notenhandschrift als Schlüssel des
Musik-Manuscripts.
- Die Tabelle Music_Work beinhaltet die einzelnen Musikstücke, die in einem Musik-Manuscript vorkommen, inklusive den Titel und die dazu
gehörigen Bemerkungen. Andere Informationen werden in anderen Tabellen gespeichert und per Fremdschlüssel referenziert.
- In der Tabelle Composer werden die Zuordnungen zwischen Komponist und Musikstück gespeichert.
- Die Tabelle Text_Author speichert die Zuordnungen zwischen Musikstück und Textauthor, die den Text zum Musikstück geschrieben haben.
- Incipit speichert die ersten Noten, mit denen ein Musikstück beginnt.
- Manuscript_Section speichert Informationen zu den Notenhandschriftenteilen, wie eine textuelle Beschreibung, Entstehungszeit und -ort.
- In Music_Manuscript_Page werden die Merkmale zu einer Seite gespeichert. Dazu gehören die Eigenschaften des Papiers, wie Höhe, Breite
und Format.
- Page_Images beinhaltet die eingescannten Bilder von den Notenhandschriften, sowie Informationen darüber.
- Music_Manuscript_Scribe speichert die Zuordnungen von den Seiten eines Musik-Manuscripts zu den Schreibern.
- Librariesbeinhaltet die Bibliotheken, die durch ihr RISM-Siegel eindeutig gekennzeichnet werden.
- Music_Score_Collections speichert Informationen zu den Kollektionen von Musik-Manuscripten. Die Kollektion "Beschreibender Katalog" enthält
Handschriften, Werke und Werkgruppen von einzelnen Komponisten. Die Kollektion "Anonymus" enthält Handschriften und Werke von nicht identifizierten
Komponisten.
- Scribes speichert die Schreiber inklusive Informationen über ihre Arbeitsperiode, Aufenthaltsorte und Kontaktpersonen.
- Music_Works speichert allgemeine Informationen zu einem Musikstück, wie Titel, Instrumente und Tonart.
- In Text_Authors sind die Textautoren mit Namen und ihren Aufenthaltsorten gespeichert.
- Composers beinhaltet die Komponisten mit Namen und ihren Aufenthaltsorten.
- in Incipit_Types werden die Typen von Incipits (erste Noten am Anfang des Musikstücks) gespeichert. Momentan existieren die Typen
"Content" und "Paper Description".
- In der Tabelle Tones werden die Tonarten von den Musikstücken gespeichert. Es existieren die Tonarten A, B, C, D, E, F und G.
- Roles beinhaltet die Musikinstrumente, die für die Musikstücke benötigt werden.
- Section_Types speichert die möglichen Typen von Teilen einer Notenhandschrift. Momentan existieren die folgenden Typen: Partitur,
Partiturfragment, Stimme und Umschlag.
Siehe das Relationale Datenmodell des Schemas METADATA.
In diesem Datenbankschema sind die folgenden Tabellen definiert, welche die Komponenten des Notensystems, wie Notenlinien, Taktstriche, Notenköpfe und Notenhälse
speichert:
- Page_Image_ROI speichert die zu analysierenden Bereiche auf dem Notenblatt
- Staff_Lines beinhaltet die Notenlinien auf dem Notenblatt
- Note_Head speichert die Notenköpfe des Notenblattes
- Note_Stem speichert die Notenhälses auf dem Notenblatt
- Bar_Lines beinhaltet die Taktstriche des Notenblattes
Das Relationale Datenmodell des Schemas IPFV gibt nähere Informationen.