DFG-Zwischenbericht vom 11. Mai 2001 zum Projekt HDHS
»Mitteleuropäische Kulturtradition: Möglichkeiten ihrer
digitalen Erschließung im Internet. HDHS (Heidelberger Hypertextserver)«
(DFG-Sachbeihilfe Nr.III N 4-55495(1) Heidelberg BIB46 Hdadw 01-01; Beginn
1. Februar 2001)
1. Personelle Situation und Ausstattung
Die vorgesehenen Mitarbeiterstellen wurden wie folgt besetzt:
2 halbe BAT IIa-Stellen mit dem Germanisten Peter STRÖBEL (seit 1. Februar
2001), der Germanistin Katja LEYHAUSEN (seit 1. März 2001), 1 BAT IIa-Stelle
mit dem Historiker Dr.phil.des. Gerrit SCHENK (seit 1. April 2001), die BAT
V b/IVa-Stelle mit der Diplombibliothekarin Susanne BRECHT (seit 1. Februar
2001). Die für einen EDV-Experten vorgesehene halbe BAT IIa-Stelle wird
ab dem 1. Juni 2001 besetzt werden; damit ist noch eine BAT IIa-Stelle offen.
Entsprechend der personellen Situation wurden 3 Notebooks angeschafft. Die
Mitarbeiter können derzeit Räumlichkeiten nutzen, die der Mitantragsteller
Prof. Dr. Oskar REICHMANN (Frühneuhochdeutsches Wörterbuch: FWB)
bereitstellte. Das Deutsche Rechtswörterbuch (DRW) stellte die notwendigste
Ausrüstung (Büromaterial, Handapparat mit Nachschlagewerken etc.)
zur Verfügung.
2. Arbeitsverlauf und Zeithorizont
2.1. Datenmodellierung: Konzeption, Probleme, Umsetzung
Entsprechend der im Antrag formulierten Konzeption ging es zunächst
darum, für die Erschließung der Quellen Klassifikationskriterien
zu erstellen und am Quellenbestand von DRW und FWB zu erproben. Um die eingesetzten
Kräfte möglichst effizient zu bündeln, wurden dafür zunächst
nur solche Quellen zugrunde gelegt, die sowohl zum Bestand des DRW als auch
des FWB gehören. Da zu diesem Corpus sehr unterschiedliche Quellengattungen
(von Rechtstexten über literarische bis hin zu wirtschaftsgeschichtlichen
Texten) gehören, war darauf zu achten, die Anzahl der Klassifikatoren
überschaubar zu halten und dennoch der Spezifik der jeweiligen Quelle
gerecht zu werden.
Im Verlauf der ersten 3 Monate wurde sehr schnell deutlich, dass bei dieser
Datenmodellierung nur bedingt von einer konkreten Einheit »Quelle«
ausgegangen werden kann. Besonders deutlich wird dies am Beispiel literarischer
Quellen: Das »Nibelungenlied« wird z.B. in den einschlägigen
Fachlexika einerseits als – abstrakt gedachtes – ›Textem‹ verstanden, das
gleichsam als »Idee« der Forscher, Editoren, Rezipienten etc.
existiert und möglicherweise in den Köpfen des Mittelalters eine
wie auch immer geartete Form der Existenz hatte. Andererseits liegen zahlreiche,
im Wortlaut jeweils mehr oder weniger unterschiedliche Handschriften und handschriftliche
Fragmente des »Nibelungenliedes« vor, nämlich die einzelnen
– konkret existenten – ›Textrealisationen‹. Zwischen ›Texten‹ und ›Realisationen‹
kann man theoretisch noch sogen. Fassungen annehmen, was hier aber nicht
weiter verfolgt werden soll. Wissenschaftliche Editionen stellen also ihrerseits
›Texteme‹ des »Nibelungenliedes« dar, die auf der kritischen
wissenschaftlichen Auswertung der einzelnen Handschriften (›Textrealisationen‹)
beruhen. Klassifikationskriterien wie z.B. Entstehungsraum und -zeit, die
dem ›Textem‹ Nibelungenlied zugeschrieben werden können, gelten nicht
notwendig zugleich auch für alle ›Textrealisationen‹. Erschwerend kommt
hinzu, dass die zahlreichen wissenschaftlichen Editionen des Nibelungenliedes
auf einer manchmal recht unterschiedlichen handschriftlichen Basis beruhen.
Dieses Problem begegnet in unterschiedlicher Intensität auch bei anderen
Quellengattungen. Wissenschaftlich vollends problematisch wird eine pauschale
Klassifizierung von Quellen, die auf der zusammenstellenden Arbeit moderner
Editoren beruhen, man denke etwa an die umfangreiche Sammlung von jeweils
verschiedenartigen Weistümern durch Jacob Grimm oder von evangelischen
Kirchenordnungen durch Emil Sehling, wohingegen die zusammenstellende Tätigkeit
zeitgenössischer Autoren, beispielsweise bei Rechtsbüchern, ohne
größere Probleme als Kompilation, Redaktion u.a. klassifiziert
werden kann.
Bei der Lösung dieser Probleme war dreierlei zu berücksichtigen:
Erstens mußte die Klassifikation der Quellen im Sinne der HDHS-Konzeption
eindeutig und präzise bleiben. Zweitens war darauf zu achten, dass bei
der Quellenklassifikation während der ersten Projektphase die erforderliche
Recherchetiefe in einem vertretbaren Verhältnis zum Zeitbudget des HDHS-Projekts
bleibt. Drittens sollte jedoch die Möglichkeit einer Vertiefung und
Ausweitung der Recherche während einer späteren Phase des Projektes
bereits jetzt in der Struktur der Datenmodellierung angelegt werden. Daher
wurde im Datenverwaltungssystem FAUST eine einheitliche HDHS-Dokumentation
mit fünf unterschiedlichen Objektarten eingerichtet, für die jeweils
spezifische Datenmasken angelegt, erprobt und weiterentwickelt wurden:
1. Objektart ›Text‹: Klassifikation der Quellen (›Texteme‹) nach spezifischen
Kriterien, Verknüpfung mit den anderen Objektarten und eventuell vorhandenen
Ressourcen im WWW.
2. Objektart ›Manuskript/Druck‹: Klassifikation der Quellen (›Textrealisationen‹)
nach spezifischen Kriterien, Verknüpfung mit den anderen Objektarten
und eventuell vorhandenen Ressourcen im WWW. Zunächst sollen nur
Leithandschriften in einer einfachen Beschreibung erfaßt werden, die
Recherchebreite und -tiefe kann jedoch später vertieft werden. Die Kriterien
der Beschreibung orientieren sich am DFG-Konzept der Handschriftenerschließung
durch Informationssysteme. Noch ungeklärt ist der Umgang mit Bildern.
Angestrebt werden Lösungen, die sich an der Bilddatenbank »Marburger
Index« ( oder an den Datenbanken des »Instituts für Realienkunde
des Mittelalters und der Frühen Neuzeit, Krems a.d. Donau« ( orientieren.
3. Objektart ›Textsammlung‹: Erschließung wissenschaftlicher Textsammlungen
durch knappe Klassifikation und Verknüpfung mit den übrigen Objektarten.
Die Datenmodellierung hierfür erlaubt bei Bedarf eine geschachtelte
Segmentierung mit Vererbung nach dem parent-child-Muster in objektorientierten
Datenmodellierungen.
4. Objektart ›Raum‹: Diese Objektart befindet sich noch im Aufbau. Möglich
erscheint eine Anbindung an die rechtssprachgeographischen Arbeiten Eberhard
von Künßbergs.
5. Objektart ›Person/Personenkreis‹: Klassifikation der Personen/Personenkreise
nach spezifischen Kriterien, Verknüpfung mit den anderen Objektarten
und eventuell vorhandenen Ressourcen im WWW.
Alle Objektarten wurden mit den bereits vorhandenen DRW-Daten verknüpft.
Für die Erfassungsmasken der Objektarten (Punkte 1–3, 5) wurden Beschreibungen
erstellt, die einerseits die Struktur des entstehenden Informationssystems
dokumentieren sollen, andererseits der internen Normierung bei der Eingabe
der Daten dienen. Die theoretische Unterscheidung von ›Textem‹ und ›Textrealisation‹
bei der Datenmodellierung bietet insgesamt nicht nur einen pragmatischen Ausweg
aus dem geschilderten Dilemma bei der wissenschaftlich tragfähigen Klassifikation
von Quellen und ihrer konkreten Erfassung in Masken des Datenverwaltungssystems
FAUST, sondern stellt auch einen ganz beträchtlichen – und unverhofften
– wissenschaftlichen Mehrwert des Projektes für die Kulturwissenschaften
dar.
2.2. Perspektiven und Zeitplan
Die Datenmodellierung und Maskenerstellung befindet sich überwiegend
im Stand der Erprobung am konkreten (Quellen-)Material, die Objektart ›Text‹
erweist sich dabei bereits als stabil. Die Objektarten ›Handschrift/Druck‹,
›Raum‹ und ›Textsammlung‹ bedürfen jedoch noch der Weiterentwicklung.
Die Anlage einer eigenen Objektart für Bildquellen (illuminierte Handschriften
etc.), ihre Einbindung in die Objektart ›Handschrift/Druck‹ oder gegebenenfalls
auch die Vernachlässigung dieser schwierigen Quellenart muß
noch erwogen werden. Der Abschluss dieser ersten Projektphase (Monate 1–6)
wird für Ende Juli projektiert, wobei nach der Stabilisierung der Masken
eine Revision des gesamten Datenbestandes nach den dann dauerhaft festgelegten,
notfalls aber noch modifizierbaren Kriterien erforderlich sein wird.
Parallel dazu müssen Konzepte für die Integration der vorhandenen
Digitalisate und der Ressourcen der Wörterbücher entwickelt werden,
die in der zweiten Projektphase umgesetzt und erprobt werden sollen. Erst
im Anschluss daran kann HDHS systematisch »gefüllt« und im
WWW verfügbar gemacht werden (3. Phase). Derzeit (Stand 30. April 2001)
werden je Arbeitstag der bisher eingestellten Mitarbeiter (also ohne die
Arbeit des Projektleiters zu berücksichtigen) rund 12 Objekte neu angelegt,
die jedoch keinesfalls als vollständig erschlossen gelten können.
Daher sind Aussagen zum voraussichtlichen Fortschreiten der Arbeit zum derzeitigen
Zeitpunkt weder sinnvoll noch möglich. Es ist jedenfalls schon jetzt
deutlich, dass diese im Rahmen von HDHS zu erfolgende Arbeit durch die Datenerfassung
ergänzt werden kann, welche die im DRW arbeitenden Lexikographen und
Lexikographinnen leisten, so dass hierdurch ein Beschleunigungseffekt entstehen
könnte.
2.3. Präsentation und Kooperation
Das HDHS-Projekt zielt langfristig auf eine möglichst große Akzeptanz
durch die – nicht nur wissenschaftlichen – Nutzer und ist umgekehrt auf eine
möglichst umfassende Kooperation mit Personen und Institutionen angewiesen.
Entsprechend nutzerfreundlich müssen die HDHS-Recherchemöglichkeiten
und ihre Präsentation im WWW gestaltet werden. Die Bedürfnisse und
Vorstellungen der potentiellen Nutzer und die bereits existierenden oder
geplanten Angebote vergleichbarer Art von dritter Seite müssen also
schon während der Planungsphase des Projekts sinnvoll eingebunden werden.
Dazu dient die zunächst passive, später auch aktive Teilnahme an
Fachtagungen, Konferenzen etc.
Die Projektmitarbeiterin Katja Leyhausen vertrat HDHS auf der Tagung »Raumlose
Orte – geschichtslose Zeit. Das Internet und die Geschichtswissenschaften«
am 30./31. März in Basel. Am 17. Mai wird HDHS in dem Hauptseminar »Quellenorientierte
Datenverarbeitung in den Historisch-Kulturwissenschaftlichen Disziplinen«
(Prof. Dr. Manfred THALLER, Universität Köln) den Seminarteilnehmern
vorgestellt. In diesem Hauptseminar werden Möglichkeiten untersucht
und ausprobiert, das DRW (und damit HDHS) z.B. mit anderen unabhängigen
geisteswissenschaftlichen Ressourcen in WWW zu vernetzen und eine XML-basierte
Netz-Präsentation zu erstellen. Am 18. Juni wird HDHS im Rahmen des EDV-Kolloquiums
des »Kompetenzzentrums für elektronische Erschliessungs- und Publikationsverfahren
in den Geisteswissenschaften an der Universität Trier« (Prof.
Dr. Kurt GÄRTNER) vorgestellt, außerdem ist eine Vorstellung auf
dem Deutschen Germanistentag 2001 in Erlangen innerhalb der Sektion 5,II
»Computereinsatz in Forschung, Lehre, Unterricht« (vgl.
angekündigt worden. Schließlich ist eine Teilnahme an der 4. Tagung
der Arbeitsgemeinschaft Frühe Neuzeit »Kommunikation und
Medien in der Frühen Neuzeit« (Augsburg, 13.–15. September) vorgesehen
(vgl. http://www.phil.uni-augsburg.de/phil2/Faecher/GESCHICH/KuM_1.htm).
3. Fazit
Das Projekt HDHS befindet sich mitten in seiner ersten Phase, in der durch
eine geschickte Datenmodellierung die Weichen für die weiteren Phasen
gestellt werden müssen. Die im Antrag formulierte Konzeption hat sich
bisher als tragfähig erwiesen. Wissenschaftlich produktive Probleme
warf die Frage einer geeigneten Klassifikation der Quellen auf, die durch
eine spezifische Strukturierung der Dokumentation in bislang fünf Objektarten
realisiert werden konnte. Diese größere Komplexität der Datenmodellierung
ließ sich mit FAUST gut umsetzen.
Gerrit SCHENK
2002-01-03