Mitteleuropäische Kulturtradition: Möglichkeiten ihrer digitalen
Erschließung im Internet
HDHS (Heidelberger Hypertext-Server)
1. Allgemeine Angaben
Antrag auf Gewährung einer Sachbeihilfe
Neuantrag
1.1 Antragsteller
| Hauptantragsteller: |
Dr. Heino Speer
Forschungsstellenleiter Deutsches Rechtswörterbuch
Forschungsstelle der Heidelberger Akademie der Wissenschaften
Karlstr. 4
D-69117 Heidelberg
Tel.: 06221-543270
Fax: 06221-543355
E-Mail: heino.speer@urz.uni-heidelberg.de
Leitseite DRW: http://www.rzuser.uni-heidelberg.de/~cd2/drw/
|
| Mitantragsteller: |
Prof. Dr. Oskar Reichmann
Germanistisches Seminar
Universität Heidelberg
Hauptstr. 207-209
D-69117 Heidelberg
Tel.: 06221-543236
E-Mail: oskar.reichmann@urz.uni-heidelberg.de
|
|
Universitätsbibliothek Heidelberg
Ansprechpartner:
Dr. Eberhard Pietzsch
Leiter der Abteilung Informationstechnik
Plöck 107-109
D-69117 Heidelberg
Tel.: 06221-542796
Fax: 06221-542623
E-Mail: pietzsch@ub.uni-heidelberg.de |
1.2 Thema
Heidelberger Hypertextserver zur Informationserschließung mitteleuropäischer
Kulturtradition über digitale Wörterbücher und ihre digitalen
Ressourcen
1.3 Kennwort
Heidelberger Hypertextserver HDHS
1.4 Förderungsbereich
Informations-Infrastrukturen für netzbasierte Forschungskooperation
und digitale Publikation
1.5 Voraussichtliche Gesamtdauer
Es handelt sich um ein Langzeitprojekt von internationaler und interdisziplinärer
Relevanz, das von seiner Anlage zeitlich nicht begrenzt werden kann.
1.6 Antragszeitraum
24 Monate
1.7 Termine
Gewünschter Beginn der Förderung: 3 Monate nach Bewilligung
1.8 Zusammenfassung
Es soll eine Institution geschaffen werden, die historische Wörterbücher
im Internet mit ihren digitalen Ressourcen, in erster Linie Quellentexte
(maschinenlesbare Textkorpora und elektronische Faksimiles), aber auch weitere
Ressourcen zur Wörterbuchbasis (z.B. Illustrationen zu Gegenständen,
historische Karten, Grammatiken, Sachlexika usw.) vernetzt. Bei den Wörterbüchern
handelt es sich zunächst aus pragmatisch-arbeitsökonomischen Gründen
um das Deutsche Rechtswörterbuch (DRW) und das Frühneuhochdeutsche
Wörterbuch (FWB). Die Vernetzung der Wörterbuchtexte mit digitalen
Ressourcen erhöht den Informationsgehalt der Wörterbücher
und leistet zugleich eine Sacherschließung dieser Ressourcen über
die Lemmata, Bedeutungserklärungen und Belegtexte der Wörterbücher,
die bisher nur mit hohem zusätzlichem Aufwand erreicht werden konnte.
Eine weitere Sacherschließung erfolgt anhand der Klassifizierung der
Wörterbuchquellen nach Raum, Zeit und Textsorte. Damit wird ein gegliederter
Zugriff auf digitale Quellen möglich, ohne diese nochmals eigens bearbeiten
zu müssen. Das Projekt ist konzeptionell auf die Begründung
einer dauerhaften Einrichtung angelegt, die Vernetzungen mit weiteren digitalen
Wörterbüchern und Ressourcen ausbaut, verwaltet und eventuell die
Funktion einer Clearingstelle für Digitalisierungen übernehmen kann.
2. Ausgangslage, eigene Vorarbeiten
2.1 Ausgangslage
Alles Relevante, was Menschen an Sachgütern, an gesellschaftlichen
Einrichtungen, an Erkenntnissen, Ideologien und sozialen Handlungen vollbringen,
findet seinen Niederschlag im Wortschatz der Sprache dieser Menschen. Wortschätze
sind insofern gleichzeitig Darstellungsmittel von Vorgegebenem wie auch
Systeme der Fixierung des kollektiven Wissens und der kollektiven Normen
einer Sprachgesellschaft sowie sprachliche Handlungsinstrumente. Aus der
Forscherperspektive betrachtet ist der Gesamtwortschatz die vornehmste Quelle
zur sprach- und literaturgeschichtlichen, theologischen, philosophischen,
überhaupt historischen Erschließung aller Kulturbereiche einer
Gesellschaft.
Für historische Stufen einer Gesellschaft, deren Geschichte weitaus
überwiegend in sprachlichen Quellen überliefert ist, ist die Lexikographie
(in Verbindung mit anderen Teildisziplinen der Sprachwissenschaft) sogar
der einzige Zugang zu ihrer Erschließung: Vor jeder geschichtswissenschaftlichen,
theologischen, literaturgeschichtlichen oder sonstigen historischen Aussage
über irgendein Werk der Vergangenheit oder eine historische Epoche steht
das Faktum, dass solche Aussagen nur möglich sind auf der Grundlage
des lexikalischen Verständnisses des Quellentextes und des in dessen
Wortschatz niedergeschlagenen Weltbildes der Zeit, des Autors, seiner Gruppe.
Lexikographie ist zweifellos die fundamentalste aller Disziplinen der historischen
Grundlagenforschung. Dementsprechend hat es im gesamten europäischen
Raum seit dem Beginn wissenschaftlicher Beschäftigung mit der eigenen
Vergangenheit (im 16./17. Jahrhundert) eine vielseitige, intensive, zum Teil
von der Gesellschaft hoch dotierte historische Lexikographie gegeben; es
wird sie in dem Maße weiterhin geben, wie sich die heutigen Gesellschaften
aus der eigenen und aus der Geschichte anderer heraus verstehen [Hausmann
1989; Reichmann 1988].
Allgemeinsprachliche (FWB) oder zur Allgemeinsprache hin offene Wörterbücher
(DRW) liefern insofern den denkbar breitesten Zugriff auf die kulturelle
Tradition, als sie den gesamten Wortschatz, nicht einen fachlich eingegrenzten
Spezialwortschatz darstellen. Dementsprechend basieren allgemeinsprachliche
Wörterbücher auf Quellenkorpora, die das Korpus eines jeden z.
B. theologischen, sozial- und wirtschaftsgeschichtlichen und philosophischen
Fachwörterbuches oder Fachlexikons an Breite übertreffen. Die Quellenkorpora
solcher Wörterbücher bieten damit einen geradezu idealen Zugriff
auf die Gesamtheit der Tradition. Dieser Zugriff erfolgt im Wörterbuch
konkret über die Belegzitate. Diese Zitate aus historischen Quellen
sind ihrerseits nur unzureichend an die Quellen zurückgebunden. Die
Rückbindung erfolgt in der Regel über die Quellensigle, die dazugehörige
Titelaufnahme und eine Bibliothek, die gerade diese Quelle in ihrem Bestand
hält. Sowohl der Lexikograph als auch der Wörterbuchbenutzer können
den Weg vom Belegzitat zur Quelle nur über die klassische Literaturversorgung
der Fachbibliotheken gehen. Es fehlt gänzlich die Anbindung von maschinenlesbaren
Texten und insbesondere von Faksimiles an die digital vorliegenden Wörterbuchzitate.
Umgekehrt sind auch digital vorliegende Quellen in der Regel nicht an die
Belegzitate und die damit verbundenen semantischen Informationen in den Wörterbüchern
rückgebunden.
Darüber hinaus gibt es zur Zeit keine Übersicht über diejenigen
historischen Quellen, die im Internet oder aber in abgeschlossenen elektronischen
Textkorpora maschinenlesbar vorliegen. Wörterbücher sind aber
mit ihrem hohen Quellenbestand (rd. 7.800 Quellen für das DRW, 550 Quellen
für das FWB) die geeigneten Sammelstellen für derartige Informationen
und stellen damit die ideale Grundlage für die Anbindung einer Clearingstelle
dar.
2.2 Eigene Vorarbeiten
2.2.1. Vorarbeiten des Deutschen Rechtswörterbuchs
Das DRW beschreibt den Wortschatz der westgermanischen Rechtssprache im
Hoch- und Niederdeutschen, Altenglischen, Altfriesischen, Mittelniederländischen
und Frankolateinischen vom Anfang der schriftlichen Überlieferung im
5. Jh. bis in das 19. Jh. hinein. Bisher sind die Bände I - IX sowie
die Hefte 1-6 zu Band X erschienen. Dies sind 15.360 Druckspalten mit 78.847
Wörterbuchartikeln zur Strecke Aachenfahrt bis Pflicht. Die Bände
VII-IX wurden in einer lexikographischen Datenbank erstellt, liegen also in
strukturierter Datenform vor [Speer 1995; Lemberg 2000]. Die Bände I-VI
werden zur Zeit im Rahmen des DFG-Förderprogramms Retrospektive Digitalisierung
von Bibliotheksbeständen [AZ.: IIIN2 55922 (1) Heidelberg AdW BIB43
Hdadw 01-01] durch die Eingabe in die Datenbank maschinenlesbar gemacht.
Neben der Fortführung des Druckwerkes erscheint das DRW auch im Sinn
des DFG-Förderprogramms in einer um die Mehrwerte des Mediums angereicherten
Version im Internet [vgl. http://www.rzuser.uni-heidelberg.de/~cd2/drw/].
Für das DRW liegt zur Zeit noch keine einheitliche und vollständige
Quellendokumentation vor. Die insgesamt etwa 7.800 Quellensiglen werden
in einem Quellenheft aus dem Jahr 1912 und vier Quellenergänzungsheften,
deren letztes 1992 erschienen ist, beschrieben. Als Grundlage für die
Vernetzung von lexikographischen und bibliographischen Informationen genügt
der jetzige Zustand der Titelaufnahme allerdings in der überwiegenden
Zahl der Fälle nicht mehr. Eine partielle Neuaufnahme wird neben der
Autopsie der Originalquelle auch zusätzliche Informationen erfassen
müssen, wie etwa die Datierung der Quelle, eventuelle Neueditionen
und ihre Verfügbarkeit sowie relevante Sekundärliteratur (wie sie
beispielsweise im Verfasserlexikon des Mittelalters erfasst ist) [Vgl. hierzu
Abbildung 1 in Anlage 2]. Für die lexikographische Arbeit an sich wären
diese Zusatzinformationen in vielen Fällen verzichtbar, da ein Umlesen
der Archivzettel auf jeweils neuere Editionen bei einem Wörterbuch mit
einer einhundertjährigen Tradition nur bedingt machbar ist. Unter dem
Aspekt der Informationsvernetzung allerdings stellt eine derartige Neuaufnahme
eines bibliographischen Titels den Ansatzpunkt zu einer elektronisch realisierbaren
Editionskonkordanz dar, da zwischen verschiedenen Editionen, die digital als
Faksimile oder Volltextdatei vorliegen, relativ leicht eine Verlinkung hergestellt
werden kann.
Im DRW ist auf Grund der Datenhaltung in dem Dokumentenverwaltungssystem
FAUST eine hochgradig vernetzte interne Informationsstruktur aufgebaut worden,
in der neben den lexikalisch-semantischen Vernetzungen der Wörterbuchartikel
untereinander auch eine Vernetzung der Belegzitate vorgenommen wird. Diese
Vernetzung erfolgt einerseits mit den entsprechenden, lexikographisch
kommentierten und mit Verweisen zur Sachliteratur ergänzten Titelaufnahmen
[vgl. Abbildung 2], und andererseits, mit den bereits vorhandenen maschinenlesbaren
Texteditionen bzw. Imagedateien, gerade von schwer zugänglichen Quellenwerken
des 16. und 17. Jahrhunderts [vgl. Abbildungen 3 und 4].
Diese Vernetzung ist auch Bestandteil des Hypertextualisierungskonzeptes
für das DRW im Internet [vgl. dazu Lemberg/Petzold/Speer 1998; Lemberg
1998], das darauf abzielt, die beiden Pole lexikographisch-historischer Arbeit,
nämlich den Quellenbezug und die Ergebnispräsentation im Wörterbuchartikel
miteinander zu verbinden. Dieser Bereich der Hypertextualisierung ist in der
derzeitigen Online-Fassung noch nicht realisiert. Zur Veranschaulichung des
informationellen Mehrwertes der Rückbindung eines Quellenzitates an
seinen Quellentext sind im Augenblick für den Buchstaben N 17
Quellenzitate der Bambergischen Halsgerichtsordnung von 1507 mit dem von der
Mannheimer Universitätsbibliothek im Rahmen des MATEO-Programms ins
Netz gestellten elektronischen Faksimile des Originaldrucks verlinkt [vgl.
Abbildung 5].
Zur Zeit entsteht im Rahmen eines weiteren, von der DFG geförderten
Projektes LPI [AZ.: SP 600/1-1] eine Dokument-Typ-Definition (DTD) auch für
die Titelaufnahmen des Quellenbestandes, die mit den Richtlinien der Text
Encoding Intitiative (vgl. http:/etext/virginia/edu/) konform ist. Diese
Quellen-DTD kann die Grundlage für eine Quellendokumentation im Rahmen
des hier beantragten Projektes bilden und damit eine soft- und hardwareunabhängige
Datenhaltung in einer SGML-Notation gewährleisten.
Das DRW wird demnächst auch mit Hilfe einer Förderung durch die
DFG im Rahmen der Retrodigitalisierung des Wörterbuchs und in Zusammenarbeit
mit der Universitätsbibliothek Heidelberg über 60 seltenste Drucke
des 16. und 17. Jahrhunderts aus dem Gebiet der Rechtswissenschaft ins Netz
stellen, die dem hier beantragten Projekt unmittelbar zugute kommen.
2.2.2 Vorarbeiten des Frühneuhochdeutschen Wörterbuchs
Das Frühneuhochdeutsche ist diejenige historische Sprachstufe des
Hochdeutschen, die nach dem Neuhochdeutschen von allen weiteren Stufen am
reichhaltigsten belegt ist. Das FWB erfasst den Wortschatz vom 14. bis zum
17. Jh., dem Anspruch nach in allen Textsorten und allen Raumvarianten des
gesteckten Zeitrahmens. Der Umfang des Wörterbuches soll 12 Bände
zu jeweils rund 1000 Seiten umfassen. Herausgeber sind Ulrich Goebel und
Oskar Reichmann.
Bisher sind erschienen: Bände 1; 2: vollständig; Band 3: 1. und
2. Lieferung, 3. Lieferung beim Verlag; Band 4: 1. Lieferung, 2. Lieferung
beim Verlag; Band 8: 1. Lieferung. Die bisher erschienenen Bände und
Lieferungen liegen mit Ausnahme von Lieferung 1 und Teilen der Lieferung
2 des ersten Bandes maschinenlesbar vor.
Die Quellenbasis des FWB wurde im Hinblick auf ihre räumliche, zeitliche
und textsortenspezifische Ausgewogenheit erstellt und vom Herausgeber und
Bearbeiter Oskar Reichmann unter theoretischen Gesichtspunkten der Korpuserstellung
diskutiert sowie im Verzeichnis der Quellen, FWB Bd.1, 165-224 dokumentiert
[vgl. Anlage 3]. Eine weitere theoretische Durchdringung und praktische Realisierung
einer Textsortenklassifizierung für den Bereich des Frühneuhochdeutschen
findet sich im Rahmen der Herausgabe des Frühneuhochdeutschen Lesebuchs
[vgl. Reichmann / Wegera 1988; Reichmann 1996].
2.2.3 Vorarbeiten der Heidelberger Universitätsbibliothek
Der Volltextserver "HELIOS/Medienarchiv" der Universitätsbibliothek
Heidelberg dient der Erfassung und Archivierung von frei zugänglichen
Volltexten und anderen Medien sowie der Herstellung von deren dauerhafter
Zitierfähigkeit. HELIOS/Medienarchiv ist unter der URL "http://archiv.ub.uni-heidelberg.de/"
erreichbar; zwei Gruppen von Materialien können hier archiviert werden:
• Digitalisierte Historische Bestände,
• Hochschulpublikationen, insbesondere Prüfungsarbeiten, Vorlesungsmaterial,
Aufsätze.
Die im Rahmen des vorgeschlagenen Projektes verwendeten Materialien (digitalisierte
Quellen) fallen unter die erstgenannte Gruppe. Unabhängig von der Verwendung
der digitalisierten Materialien im Rahmen des vorgeschlagenen HDHS sorgt die
Universitätsbibliothek für den Nachweis der Materialien u.a. in
• allgemeinen Suchmaschinen im WWW,
• dem Karlsruher Virtuellen Volltextkatalog – KVVK,
• der Verbunddatenbank des Südwestdeutschen Bibliotheksverbund,
• dem lokalen Katalog der Universitätsbibliothek.
Die digitalisierten Quellen sollen in HELIOS/Medienarchiv mittels Strukturinformationen
zusammengefügt werden. Zur buchähnlichen Präsentation der
Quellen wird im Rahmen eines anderen Projektes ein SGML-basiertes Präsentationsmodell
mit folgender Zielsetzung erarbeitet:
• Auch umfangreichere Bestände digitalisierten Materials sollen mit
nur geringfügigem manuellem Aufwand aufgenommen werden können,
• Die physische Struktur der Materialien wird durch ihre Präsentation
nachgebildet,
• Die Präsentation soll unabhängig vom digitalisierten Material
modifizierbar sein,
• Die erforderliche Software und die SGML-Strukturbeschreibungen sollen
frei verfügbar sein.
Dem Benutzer erscheinen die in HELIOS/Medienarchiv aufgenommenen Materialien
als verlinkte, mit HTML-Wrappern zusammengeführte Images.
3. Ziele und Arbeitsprogramm
3.1 Ziele
Mit HDHS soll eine wörterbuchübergreifende Informationsplattform
zur mitteleuropäischen Kulturtradition geschaffen werden. Die in HDHS
integrierten Wörterbücher sind Erschließungswerkzeuge für
digital vorliegende historische Quellen.
Die damit geschaffene Vernetzung der Wörterbuchtexte untereinander
und mit maschinenlesbaren Texten, elektronischen Faksimiles und historischen
Darstellungen soll einerseits den Informationsgehalt der Wörterbücher
erhöhen und damit auch völlig neue Nutzungsmöglichkeiten,
z.B. für begriffsgeschichtliche Fragestellungen schaffen. Andererseits
soll sie eine Sacherschließung der digitalen Ressourcen, insbesondere
von Faksimiles und bildlichen Darstellungen, über die Lemmata, Bedeutungserklärungen
und Belegtexte der Wörterbücher leisten, die bei entsprechenden
Digitalisierungsvorhaben bisher nur mit hohem zusätzlichem Aufwand
erreicht werden konnte. Eine weitere Sacherschließung soll anhand der
Klassifizierung der Wörterbuchquellen nach einem bestimmten Kriterienkatalog
(Raum, Zeit, Textsorte) erfolgen. Damit wird ein zeitlich, räumlich
oder sachlich gegliederter Zugriff auf digitale Quellentexte möglich,
ohne diese nochmals eigens bearbeiten zu müssen.
Dies setzt voraus, dass ein Minimalabgleich der Zugriffsmöglichkeiten
auf Digitalisierungen in den unterschiedlichen Bibliotheken und vergleichbaren
Institutionen vorgenommen wird (so dass beispielsweise gewährleistet
ist, dass jede digitalisierte Seite über eine eindeutige URL adressiert
werden kann). Zugleich kann damit als Nebeneffekt eine Art Clearingstelle
für Digitalisate in dem sachlichen, zeitlichen und räumlichen
Bereich dieser Wörterbücher entstehen, da ein erheblicher Teil
der für Digitalisierungen in Frage kommenden historischen Quellen in
irgendeiner Weise für Wörterbücher genutzt worden ist oder
genutzt werden kann.
3.2 Arbeitsprogramm
3.2.1 Erschließung der Quellen
Für die Realisierung eines Heidelberger Hypertextservers und damit
eines internetbasierten Informationssystems, das über die beiden Wörterbücher
hinausführt und es sich zum Ziel setzt, die im Internet jetzt und zukünftig
verfügbaren kulturhistorischen Ressourcen einzubinden, zu erschließen
und für die historische Traditionsforschung zu fokussieren, müssen
folgende Voraussetzungen erfüllt sein:
3.2.1.1 Quellenklassifizierungen
Wörterbuchtexte sind durch ihre Digitalisierung in einem Stadium angelangt,
in dem sie unter informationswissenschaftlichen Gesichtspunkten aufbereitet
werden müssen. Da es - zumindest für die bereits bearbeiteten
Buchstabenbereiche - keine realisierbare Möglichkeit gibt, jeden einzelnen
Belegtext inhaltlich oder sonstwie zu klassifizieren und damit eine gezielte
Abfrage je nach Benutzerinteresse zu ermöglichen, muss ein anderer Weg
gewählt werden, der über die oben kurz angesprochenen Klassifikationsarten
der Quellen geht. Die bibliographische Erschließung der Kulturtradition
als Voraussetzung hierfür sollte es ermöglichen,
• den Quellenbestand einzelner Projekte nach bestimmten korpusrelevanten
Fragestellungen zu durchleuchten, z. B. Anzahl und Textsorte bairischer Quellen
des 15. Jahrhunderts,
• die Quellenbasis verwandter Projekte miteinander zu vergleichen;
• sie sollte ferner ein sprach- oder kulturnationales Korpus bereitstellen,
auf das neue Projekte zur Verkürzung der auch weiterhin notwendigen
jeweils spezifischen Korpusbildung zurückgreifen können.
Die historischen Quellen des gänzlich oder partiell deutschsprachigen
Teils Mitteleuropas im DRW und FWB werden ergänzt durch viele niederländische,
altfriesische oder altenglische Quellen des DRW, die dessen sprachgeschichtlich
am Westgermanischen orientierten Konzept zu verdanken sind. Als Beispiele
seien hier genannt: Aus dem Mittelniederländischen Wörterbuch
zitiert das DRW 1.967 Stellen, allein aus der willkürlich herausgegriffenen
niederländischen Stadt Dordrecht sind es zusätzlich dazu 404 Belegtexte
oder Fundstellen, etwa 2.500 altfriesische Belegtexte oder Fundstellen und
etwa 1.500 altenglische Belegtexte und Fundstellen werden zitiert. Diese
Zahlen sollen nicht nur die Quellenvielfalt der Wörterbücher dokumentieren,
sondern auch die jetzt schon mögliche Zugriffsstruktur über aussagekräftige
Quellensiglen. Für eine Sacherschließung der digital vorliegenden
Quellen muss bei den Titelaufnahmen der Wörterbücher eine Textklassifizierung
vorgenommen werden. Dies ist integraler Bestandteil des Projekts HDHS und
eine notwendige Voraussetzung für die digitale Erschließung der
Quellen zur mitteleuropäischen Kulturtradition. Der Arbeitsplan hierzu
sieht folgendermaßen aus:
Jede erfasste Quelle wird (sofern dies nicht bereits aus der bibliographischen
Beschreibung hervorgeht) mit einer überschaubaren Anzahl relevanter
Kennzeichnungen versehen; dazu müssten gehören:
a) die Angabe des Entstehungsraumes der Quelle,
b) die Angabe der Entstehungszeit,
c) die Zuordnung zu einer sozialen Schicht bzw. zu einer Gruppe,
d) die Bestimmung der Textsorte der Quelle,
e) ein Hinweis auf die Form der Quelle: Vers oder Prosa,
f) ein Hinweis auf die Wirkungsgeschichte des Quellentextes,
g) eine Angabe zur Überlieferung der Quelle: Anzahl der Handschriften,
Nachdrucke usw.
h) eine Charakterisierung des Textverfassers bzw. der Verfassergruppe hinsichtlich
Stand, Beruf, Konfessionszugehörigkeit usw.
i) die Erfassung der zu diesem Werk im Internet oder anderen digitalen Medien
vorliegenden weiteren Informationen jeglicher Art.
Die unter a) bis i) aufgeführten Quellenkennzeichnungen bedürfen
jeweils einer eigenen Diskussion [Verwiesen wird hier auf die Artikel "Die
Textsorten des ..." zu den jeweiligen Sprachstufen im Handbuch Sprachgeschichte
von Hyldgaard-Jensen, Kästner/Schirck, Kästner/Schütz/Schwitalla,
Sanders und Schwarz, jeweils 1985]. Diese sollte unter der Leitlinie stehen,
möglichst objektive Angaben zu leisten; "Raum" ist demzufolge geographischer
Raum, "Zeit" ist physikalische Zeit. Dies ermöglicht es, den Raum-
und Zeitkoordinaten je nach Benutzerinteresse bestimmte Antworten zu entnehmen,
etwa durch Landkarten sprachhistorischer Entwicklungsstadien oder der Territorialzugehörigkeit
eines bestimmten Ortes zu einer bestimmten Zeit. Bei der Schichten- und
Gruppenangabe, erst recht bei der Textsortenangabe werden die Verhältnisse
diffiziler; für letztere wird man möglicherweise einen Intentionenkatalog
erstellen und diesen als Klassifikationsrahmen benutzen müssen. Kennzeichnungen,
die eigene, zeitaufwendige Untersuchungen voraussetzen, sollten im Interesse
des zügigen Fortgangs der Arbeit offen bleiben. - Alle Informationen
müssen so standardisiert werden, dass der Rezipient sie von möglichst
wenigen Suchbegriffen her auffinden und mit jedem anderen Typ von Information
verbinden kann.
Für die Nutzung bereits bestehender Daten und Korpora auf Seiten der
Benutzer, bedeutet dies, dass technische Routinen geschaffen werden, mit deren
Hilfe ein variables, benutzergesteuertes Abfragesystem die Klassifikationen
der Quellen dazu nutzt, um Recherchen nicht als bloße Volltextrecherche
durchführen zu müssen, sondern gezielt einen zeitlich, räumlich
oder anders bestimmten Klassifikationsbereich durchsuchen zu können.
Die hierzu erforderlichen datentechnischen Routinen sind in FAUST bereits
grundsätzlich angelegt und müssen noch für die besonderen
Anwendungsfälle realisiert werden. Dennoch sollen auch andere Möglichkeiten
der Verwaltung und Nutzung von Hypertext (z. B. LPI und Hyperwave) geprüft
und getestet werden, da es auf Dauer um ein leicht handhabbares und von der
Verfügbarkeit von Einzelpersonen unabhängiges System gehen muß.
Die Zugriffsskizze ist in vorliegender Fassung sehr einfach gehalten. Die
Gründe dafür sind: Wissenschaftliche und damit bibliographische
Unternehmen müssen auf einer klaren persönlichen Motivation der
Verantwortlichen beruhen; sie müssen ferner in ihrem Kern einfach konzipiert
und vom Rezipienten mit einem Schlage erfassbar sein. Insofern stützen
sich die Planenden auf die von ihnen geleiteten Wörterbuchunternehmen;
Ausweitungen sind von dieser Basis her jederzeit möglich (der Leiter
des DRW hat als Vertreter der Heidelberger Akademie der Wissenschaften in
der „Arbeitsgruppe Elektronische Publikation" der Union der deutschen Akademien
der Wissenschaften entsprechende Kontaktmöglichkeiten, die hierfür
genutzt werden können).
3.2.1.2 Erstellung einer gemeinsamen Quellendokumentation
Die im SGML- Format erstellte und im Internet verfügbare Quellendokumentation
zu beiden Wörterbüchern stellt den Kern einer potentiell alle
deutschsprachigen historischen Wörterbücher umfassenden Bibliographie
- wenn man die zusätzlichen Vernetzungen unter diesen Begriff einbeziehen
will - dar. Dabei sollen auch extern vorliegende Titelaufnahmen wie die zu
den digitalen mittelhochdeutschen Wörterbüchern genutzt und eingebunden
werden; dies setzt enge Kontakte und Absprachen zwischen den verschiedenen
Projekten voraus. Ein Quellenverbund mit der Neubearbeitung des Wörterbuchs
von Jacob Grimm ist mit dem Leiter der Göttinger Arbeitsstelle, Herrn
Professor Schlaefer, vorbesprochen worden.
3.2.1.3 Quellenvernetzung
Die Vernetzung der Quellen (Wörterbuchtexte und Textkorpora) mit digitalen
Ressourcen ist zunächst an die jeweiligen Titelaufnahmen gebunden,
wird dann aber auch über jede einzelne Fundstelle der Wörterbücher
aus diesen Quellen hergestellt werden. Dabei kann es ein Weg sein, zu jeder
digital vorliegenden Quelle eine besondere Wortliste anzubieten, über
die ein alphabetischer Zugriff möglich ist. Denkbar ist aber auch eine
Liste der Wortartikel, in denen Belege aus einer Quelle zitiert werden. Die
Art des Zugriffs vom Wörterbuch auf digitale Quellen kann vielfältig
ausgestaltet sein und wird sich letztlich an den Wünschen der Benutzer
ebenso wie an den Wünschen der beteiligten Institutionen ausrichten.
Daher sind abschließende Festlegungen zum gegenwärtigen Zeitpunkt
wenig sinnvoll.
3.2.1.4 Clearingstelle
Die Vernetzungen müssen nicht nur einmal hergestellt, sondern angesichts
der Veränderbarkeit des Netzes ständig gepflegt werden. Dies setzt
einerseits voraus, dass einschlägige Netzadressen und Mailinglisten
in regelmäßigen Abständen überprüft werden und
intensive Kontakte zu potentiellen Anbietern digitaler Ressourcen geknüpft
und gehalten werden. Andererseits aber kann und muss die Verfügbarkeit
digitaler Ressourcen gezielt erweitert werden, wie dies beispielsweise in
der Zusammenarbeit mit der Heidelberger Universitätsbibliothek geplant
ist. Hier soll eine Digitalisierung von gedruckten Rechtsquellen erfolgen,
deren Priorität sich an der Zitierhäufigkeit im DRW bemisst - eine
scheinbar subjektive, aber dennoch in sich stimmige Auswahl, da die Exzerption
im DRW und damit die Häufigkeit der Zitate von rechtshistorisch und
lexikographisch erfahrenen Wissenschaftlern bestimmt wurde. Es ließe
sich relativ leicht aus der Zitierhäufigkeit der Quellen in den Wörterbüchern
allgemein eine Rangliste der Digitalisierungsvorhaben erstellen. Diese wäre
nur vordergründig an dem natürlich auch vorhandenen Interesse der
jeweiligen Wörterbücher an der digitalen Verfügbarkeit ihrer
Quellen orientiert. Wichtiger ist die durch eine lange wissenschaftliche
und lexikographische Tradition bewährte Gewichtung der Quellen, die
sicherlich durch andere Komponenten ergänzt werden müsste (beispielsweise
die Überlieferungs- und Rezeptionstradition des Sachsenspiegels mit
seinen Übersetzungen in andere Sprachen). Daher könnte es Aufgabe
des Projekts HDHS sein, Anregungen für eine Rangliste von Digitalisierungsvorhaben
zu geben, die ja nicht immer im Bereich staatlicher Förderung angesiedelt
sein müssen. Die vielfältigen privaten Initiativen zu bestimmten
Digitalisierungen, die häufig von wissenschaftlichen Projekten ausgehen,
dort aber dann auch verschlossen bleiben, könnten so gebündelt
und Mehrfachdigitalisierungen vermieden werden. Der hier skizzierte Aufgabenbereich
entspricht damit den Aufgaben einer bisher nicht vorhandenen Clearingstelle.
3.2.2 Knoten im Netz
Der wahre Nutzen der Digitalisierung von Wörterbüchern ergibt
sich aus ihrer Bereitstellung im Internet. Hier können die Wörterbücher
einmal untereinander vernetzt werden und zum anderen Knoten im Netz darstellen,
in denen vielfach weiterleitende Informationen in hochgradig verdichteter
Form angeboten werden. So würde beispielsweise von dem Beleg aus einer
bestimmten Quelle ein Hyperlink einerseits zu einer wissenschaftlich überprüften
Titelaufnahme führen, die wiederum einen Hyperlink zu biographischen
Informationen über den Autor enthalten kann - ebenso wie Links zu vergleichbaren
Texten des gleichen Autors oder anderer Autoren oder zu Texten mit vergleichbaren
Inhalten -, oder aber der Hyperlink führt zu einem Faksimile der sonst
nur in klimatisierten Räumen zugänglichen Druckausgabe oder sogar
weiter zu einer als Faksimile vorliegenden Handschrift. All dies bedeutet
nicht nur eine reine Erweiterung der Verlinkungsmöglichkeiten - von denen
es im Web häufig auch zu viele gibt -, sondern vor allem eine „Demokratisierung
von Wissen" [Kuhlen 1995], die alle Interpretationen dieser Quellen in hohem
Grade überprüfbar werden lässt und überdies völlig
neue Möglichkeiten für begriffsgeschichtliche Fragestellungen eröffnet.
Dies soll, zunächst bezogen auf die beiden beteiligten Wörterbücher,
in HDHS realisiert werden. Basis ist zunächst das maschinenlesbar vorliegende
Artikelmaterial beider Wörterbücher sowie deren Quellenbibliographie
und die von den Wörterbüchern bereits integrierten digitalen Ressourcen
(Textarchiv, Faksimiles).
Eher im Hintergrund steht zunächst der Anschluss an LPI, da dessen
Nutzung erst Ende 2001 möglich wäre. HDHS setzt vielmehr auf den
bereits vorhandenen Informationsstrukturen und deren Verwaltung in dem Dokumentenretrievalsystem
FAUST auf. Dies hat sachliche Gründe; diese ergeben sich daraus, dass
LPI auf die Digitalisierung und Vernetzung von Wörterbuchinhalten abzielt:
Eine genuin linguistische Aufgabe, die sich auch in der Komponente eines lexikographischen
Produktionsprozesses niederschlägt. HDHS dagegen hat die Rückbindung
der Wörterbuchinhalte an ihre Quellen und über diese Rückbindung
die informationstechnische Erschließung der Quellen zur Aufgabe. Außerdem
hat der Verzicht auf die unmittelbare Anbindung des Projekts an LPI arbeitspragmatische
Gründe: Das Rechtswörterbuch wird bis März 2001 bereits in
der DRW-eigenen Dokumentationsstruktur von FAUST eingetragen sein - wenn
auch noch nicht in allen Teilen abschließend korrigiert. Damit stehen
etwa 80.000 Wortartikel von A bis P als Erschließungsinstrumente zur
Verfügung, die zum Teil bereits mit digitalen Ressourcen vernetzt sind,
zum Teil aber noch vernetzt werden müssen (z. B. bei Faksimiles, die
erst ins Netz gestellt werden). Das bis auf die erste Lieferung maschinenlesbare
FWB muß aus sequentiellen Textdateien geparst werden, damit die textinternen
Markierungen in eine eindeutige Datenstruktur überführt werden
können und damit der Import in eine Datenbank ermöglicht wird.
Hierfür ist aus pragmatischen Gründen ebenfalls FAUST vorgesehen,
obwohl jede andere Datenbank dies auch ermöglichen würde. Die Entscheidung
für das vom DRW schon genutzte System erübrigt aber zum gegenwärtigen
Zeitpunkt eine aufwendige und zeitraubende Einrichtung einer anderen Datenbank
für diese Zwecke.
3.2.3 Realisierung über einen FAUST-Webserver
Die Softwarefirma Land, die FAUST herstellt, hat 1999 einen Internetserver
für FAUST auf den Markt gebracht, der zwar keine Produktionskomponente
enthält (wie dies bei LPI der Fall sein wird), aber alle Recherchemöglichkeiten
von FAUST zur Verfügung stellt. Damit lassen sich alle bereits vorhandenen
Informationsvernetzungen problemlos im Internet verfügbar machen (vgl.
dazu das beiliegende Informationsblatt FAUST+LIDOS News Nr. 45 vom April
1999). Der Webserver soll aus Sicherheitsgründen über zwei getrennte
Fileserver realisiert werden: einmal über einen Internetserver (vgl.
unten 4.2 a) und dann über den eigentlichen FAUST-iServer (vgl. unten
4.2 b).
3.2.4 Nutzung von Synergieeffekten
Dies hat zur Folge, dass das Projekt in einer über Jahre hinweg erprobten
EDV-Umgebung realisiert werden kann und die Anfangsschwierigkeiten, die
LPI noch zu bewältigen haben wird, kein Verzögerungsmoment darstellen
werden. LPI - mit seiner auch auf dezentrale Wörterbuchproduktion gerichteten
Funktionalität - bedarf zur Realisierung der Adaption einer Datenbank
(vermutlich Oracle8i), mit der die in SGML modellierten Daten verwaltet werden
können. Die Präsentation der in FAUST bereits vorliegenden Daten
des DRW wie auch der Import der Daten des FWB in FAUST führt hingegen
zu rasch vorliegenden Recherchemöglichkeiten im Internet. Zudem steht
inzwischen eine mit der Programmierung von FAUST in FAUST-Basic vertraute
Person zur Verfügung, die außerdem die Strukturen des DRW wie auch
die des FWB so genau kennt, dass sie die Überführung des FWB in
FAUST durchführen kann. Das nicht unkomplizierte Wörterbuchparsing
für das FWB und partiell erforderliche Nachbearbeitungen des Datenbankimports
würden einen Teil des Projekts darstellen. Insgesamt aber würde
die Erschließung digitaler Quellen - insbesondere von Faksimiles - mit
dezentraler Speicherung im Internet auf Grund des bereits vorhandenen Informationspools
relativ schnell erfolgen und somit der Erschließungsgrad einschlägiger
Titel des DFG-Förderprogramms „Verteilte Digitale Forschungsbibliothek"
um ein Mehrfaches gesteigert werden.
Der Nutzung von FAUST zu derartigen Zwecken wird häufig entgegengehalten,
dass es sich hierbei um ein „proprietäres System" handele, bei dem man
sich in eine nicht zu verantwortende Abhängigkeit von einer privatwirtschaftlich
arbeitenden Firma begebe. Abgesehen von der über zehnjährigen guten
und effektiven Zusammenarbeit des DRW mit der Firma Land und der weiten Verbreitung
von FAUST im Bibliotheks- und Archivbereich und bei Großkunden der Wirtschaft
muss dem ein grundsätzlicher Einwand entgegengehalten werden: Jedes
einigermaßen vergleichbare Programm ist in irgendeiner Weise proprietär,
solange es keine Schnittstelle zu einem hard- und softwareunabhängigen
Standard besitzt. Diese Schnittstelle ist in FAUST aber insofern vorhanden,
als jederzeit ein Datenexport in ASCII-Dateien möglich ist, wie er jetzt
schon für die HTML-Dateien des DRW im Internet genutzt wird (vgl. http://www.rzuser.uni-heidelberg.de/~cd2/drw).
Im Verlauf des Projektes soll in FAUST eine entsprechende Exportfunktion
in SGML-Strukturen realisiert werden, die auf der Datenmodellierung für
historische Wörterbücher innerhalb von LPI aufsetzt. Die Exportfunktion,
die in FAUST so gestaltet werden kann, dass nur SGML-konforme Daten exportiert
werden und nichtkonforme Daten als Problemfälle markiert werden, ermöglicht
eine Publikation in anderen Medien und die Interoperabilität mit anderen
Systemen. Ebenso wird weiterhin eine Druckfassung in TeX die kontinuierliche
Publikation des gedruckten Werkes absichern. Nach Ablauf der ersten, zweijährigen
Phase des Projekts kann die Zusammenführung mit LPI in KHS oder beispielsweise
mit Hyperwave auf Grund einer dann realistisch zu beurteilenden Machbarkeits-
und Effizienzuntersuchung ins Auge gefasst werden. Dabei können eventuelle
konzeptuelle Veränderungen hinsichtlich der Annahme des Internetangebots
und der damit möglicherweise verbundenen Performanceprobleme vorgenommen
werden.
Eine weitere Nutzung von Synergieeffekten ergibt sich aus den unter Punkt
2.2. beschriebenen Vorarbeiten.
3.2.5 Wörterbuchpräsenz im Internet
Die hierfür erforderliche Präsenz der Wörterbücher
im Netz wird vermutlich unterschiedlich geregelt werden müssen. Im Fall
des DRW geschieht dies zumindest in einer Grundversion unentgeltlich, wie
dies die Förderbedingung der DFG im Förderprogramm "Verteilte Digitale
Forschungsbibliothek" war, im Rahmen des FWB ist noch eine Abklärung
mit dem Verlag (z. B. Lizenzen für Bibliotheken oder Privatwissenschaftler
usw.) erforderlich. Dabei ist der Verlag de Gruyter grundsätzlich offen
für eine digitale Version des FWB, ist aber, wie andere Verlage auch,
noch unsicher hinsichtlich der damit verbundenen rechtlichen und wirtschaftlichen
Probleme. Es wird eine der Aufgaben der Arbeitsgruppe "Elektronische Publikationen"
der Union der Akademien sein, für solche nicht mehr seltenen Fälle
Lösungsvorschläge zu machen. Sicher ist jedenfalls, dass das Interesse
des Herausgebers des FWB in dem Punkt mit dem Interesse des Verlages und der
gesamten historischen Wissenschaften übereinstimmt, dass eine digitale
Version eines Nachschlagewerkes die Druckversion nicht überflüssig
machen darf. Daher wird hier auch das wirtschaftliche Interesse des Verlages
in die Gestaltung der Internetnutzung des FWB einfließen müssen.
Abrechnungsmöglichkeiten, wie sie hier diskutiert werden müssen,
sind im FAUST-iServer bereits vorgesehen.
4. Beantragte Mittel
4.1 Personalbedarf
Beantragt wird eine Personalausstattung von 3,5 Mitarbeiterstellen nach
BAT IIa und einem Mitarbeiter nach BAT Vb/IVb (Diplombibliothekar) sowie
von 60 Monatsstunden für ungeprüfte wissenschaftliche Hilfskräfte,
jeweils für 24 Monate.
a) 3 wissenschaftliche Mitarbeiterstellen BAT II a (Geisteswissenschaftler)
b) 1/2 wissenschaftliche Mitarbeiterstelle BAT II a (Promotionsstelle EDV/Computerlinguistik)
c) 1 Mitarbeiterstelle BAT Vb/IVb (Diplombibliothekar)
d) 60 Stunden monatlich für ungeprüfte wissenschaftliche Hilfskräfte.
Die Aufgabenbereiche lassen sich folgendermaßen beschreiben:
a) Erfassung der Textklassifikatoren, Erarbeitung einer rechtshistorischen
Textsortenklassifikation, Modifizierung der im Entwurf vorliegenden Klassifikationsschemata,
Klassifikation der Quellen in der Datenbank, Modellierung der Informationsstruktur
auf dem FAUST-iServer, Parsing der Textdateien des FWB, Erschließung
neuer Recherchefunktionen in FAUST für den Internetbenutzer, Verknüpfung
der Wörterbuchtexte mit externen digitalen Ressourcen, Projektmanagment,
Öffentlichkeitsarbeit (Teilnahme an Tagungen, Kontakte zu öffentlichen
Medien usw.). Die Bezeichnung "Geisteswissenschaftler" wurde gewählt,
um deutlich zu machen, dass bei diesem interdisziplinären Projekt eine
Offenheit gegenüber dem Bewerberangebot bewahrt werden muss.
b) Systembetreuung, Datenbankadministration, Pflege des Datenbestandes
von der technischen Seite her, datentechnische Aktualisierung der Projektschnittstelle
zu LPI und zu Projekten wie beispielsweise dem mittelhochdeutschen elektronischen
Textarchiv oder dem Göttinger Akademiethesaurus. Die halbe Promotionsstelle
ist deshalb so ausgewiesen, weil der Bedarf an Systembetreuung und vergleichbaren
Dienstleistungen in einem solchen Projekt zwar einerseits die Kompetenzen
der geisteswissenschaftlichen Mitarbeiter/innen des Projekts übersteigt,
andererseits aber auch innerhalb der bei den Antragstellern vorhandenen
Infrastruktur nicht zu leisten ist. Angesichts des bekannten Engpasses auf
diesem Arbeitsmarktbereich erscheint es als eine Möglichkeit, eine hinreichend
ausgebildete Person zu gewinnen, die dieses Projekt mit einer Promotion begleiten
will.
c) Neuerfassung oder Überprüfung der Titelaufnahmen zu den Quellen
des DRW und FWB nach RAK-WB und durch Autopsie. Bibliographische Erfassung
der dazugehörigen Digitalisate.
d) Die Hilfskraftstunden werden innerhalb des Projekts für Zulieferarbeiten
für den Arbeitsbereich a-c insbesondere bei der Literaturbeschaffung
(z. B. Nachschlagen biographischer Daten in der ADB usw.) benötigt.
Da die beschäftigten Personen an verschiedenen Orten arbeiten (UB Heidelberg,
Germanistisches Seminar usw.), werden auch logistische Probleme zu lösen
sein (Transport von Büchern usw.).
Erläuterung zum Zeitraum
Für die erste, auf DRW und FWB bezogene Arbeitsphase ist ein
Erprobungszeitraum von zwei Jahren anzusetzen. Auf der Basis der Kenntnis,
wie viele Personen pro Jahr wie viele Quellen im angegebenen Sinne bearbeiten
können, wird man in diesem Punkt die Ausweitung realisieren. Dabei muß
Folgendes deutlich werden: Die Intention des Projektes ist nicht auf ein
einmal für einen bestimmten Zeitraum bewilligtes und dann abgeschlossenes
Projekt gerichtet, sondern auf die dauerhafte Einrichtung eines Vorhabens,
das auch in ferner Zukunft die Verwaltung und Bereitstellung digitaler Ressourcen
zur mitteleuropäischen Kulturtradition übernehmen und leisten kann.
Dabei soll die Bewilligung des Projektantrags durch die DFG dazu dienen,
in einer pragmatisch konzipierten und realisierten Eingangsphase die nötigen
Erfahrungen zu sammeln und überzeugende Anfangsergebnisse zu erzielen,
die eine Weiterförderung durch andere Geldgeber ermöglichen. Angesichts
des Sprachraumes, den das DRW mit den Sprachen bzw. Sprachvarietäten
Frankolatein, Altenglisch, Altfriesisch, Althochdeutsch, Mittelhochdeutsch,
Mittelniederdeutsch, Mittelniederländisch und Neuhochdeutsch abdeckt
und der sich auf das gesamte Mitteleuropa (ohne Beschränkung auf den
Herrschaftsbereich des Heiligen Römischen Reiches Deutscher Nation)
erstreckt, dürfte eine Förderung durch die Europäische Union
in Frage kommen - und dies mit offenem Ende und offenen Grenzen.
4.2 Geräte
Die Geräteausstattung sollte folgende Komponenten enthalten:
| a) 1 Fileserver als Internetserver |
|
| b) 1 Fileserver als FAUST-iServer |
|
| c) 2 Eizo F520 Monitore |
|
| d) 5 Notebooks |
|
Es soll auf Grund guter Erfahrungen mit der Firma das Angebot der Firma
CAT angenommen werden.
Alle Mitarbeiter/innen des Projekts müssen einen hohen Grad an Mobilität
bei der Organisation ihrer Arbeit aufweisen. Dies erstreckt sich nicht nur
auf räumlich verteilte Arbeitsplätze innerhalb der Institute der
Antragsteller, sondern beinhaltet insbesondere die auch datentechnische Präsenz
bei Reisen zu Bibliotheken, Archiven und Tagungen. Daher wurde von vernetzten
Workstations abgesehen und auf funktional gleiche transportable Rechner abgestellt.
Diese Geräte können auch nicht als Grundausstattung des Projekts
angesehen werden. Da HDHS vom DRW, einer Forschungsstelle der Heidelberger
Akademie der Wissenschaften, und dem FWB, einem Projekt des Herausgebers,
sowie der Universitätsbibliothek Heidelberg betrieben werden soll, gibt
es nahezu keine Infrastruktur auf dem Gebiet der Büroausstattung, der
Geräte und solcher Kosten, wie beispielsweise für Telephonate, denn
die vorhandene Infrastruktur ist anderen Projekten bzw. institutionalisierten
Zielen zugeordnet und wird dort benötigt.
| e) 1 Netzwerkdrucker HPLaserjet 4050N |
|
4.3 Reisen
Die Reisekosten können zum gegenwärtigen Zeitpunkt nur geschätzt
und pauschal beziffert werden. Das Projekt setzt eine hohe Präsenz
der beteiligten Personen in Einrichtungen unterschiedlicher Art, die als
Beiträger für Digitalisationen in Frage kommen, voraus. Gleichermassen
hoch muss die Präsenz auf Fachtagungen sein, um Personen zu einer Kooperation
mit HDHS bewegen zu können und um Erfahrungen anderer für das eigene
Projekt nutzen und damit unter Umständen Umwege vermeiden zu können.
Überdies wird HDHS nur dann eine zentrale Rolle bei der Vernetzung der
mitteleuropäischen Kulturtradition einnehmen können, wenn es schon
in der ersten Arbeitsphase von zwei Jahren einen hohen Bekanntheitsgrad erreicht.
4.4 Sonstige Kosten
5. Eigenleistungen
5.1 Zusammensetzung der Arbeitsgruppe
Außer den Antragstellern sollen Mitglieder der Arbeitsgruppe sein:
Prof. Dr. Ulrike Haß-Zumkehr (IdS/Leksis), Ingrid Lemberg (DRW), Dr.
Anja Lobenstein-Reichmann (IdS/FWB), Dr. Gisela Weber (stellvertretende Bibliotheksdirektorin
UB Heidelberg). Zu einem späteren Zeitpunkt Prof. Dr. Kurt Gärtner
(Trier) und Prof. Dr. Michael Schlaefer (Göttinger Akademie der Wissenschaften).
Eine personelle Einbindung der Heidelberger Akademie der Wissenschaften über
die Mitarbeiter des DRW hinaus wird mit dieser besprochen werden. Bei einer
- im Projekt angelegten - Institutionalisierung wird ein Leitungs- oder Beratungsgremium
aus Wissenschaftlern der einschlägigen Fachrichtungen eingerichtet werden
müssen.
5.2 Zusammenarbeit mit anderen Institutionen
Eine Zusammenarbeit mit anderen Institutionen ist konzeptuell im Projekt
vorgesehen und kann zum gegenwärtigen Zeitpunkt nur sehr punktuell
und exemplarisch benannt werden. In Frage kommen hier zunächst einmal
das Leksis-Projekt am Institut für Deutsche Sprache in Mannheim, die
Staatsbibliothek zu Berlin mit ihren einschlägigen Digitalisierungsprojekten,
die Universitätsbibliothek Bielefeld mit ihrer digitalen Bibliothek
sowie die Universitätsbibliothek Mannheim mit ihrem MATEO-Projekt. Eine
Erweiterung auf die digitalen mittelhochdeutschen Wörterbücher
und das Deutsche Wörterbuch von Jacob Grimm bzw. auf dessen Neubearbeitung
ist nicht nur denkbar, sondern durch persönliche Kontakte zu den hierfür
verantwortlichen Wissenschaftlern initialisiert worden. Sie steht aus Gründen
der Arbeitsökonomie zunächst noch im Hintergrund, soll aber erst
nach einer Erprobungsphase des Projekts durch eine Anfrage an Herrn Professor
Gärtner (Trier/Mittelhochdeutsche Wörterbücher) und an Herrn
Professor Schlaefer (Göttingen/Neubearbeitung des DWB) wegen ihrer Mitarbeit
in der Arbeitsgruppe zu HDHS realisiert werden.
5.3 Apparative Ausstattung
Eine apparative Ausstattung steht durch die Institutionen der Antragsteller
ebensowenig zur Verfügung wie eine Grundausstattung an EDV-Geräten.
Das Projekt baut allerdings auf den vorhandenen Informationsstrukturen der
beteiligten Wörterbücher auf und kann die in den Wörterbüchern
oder der Heidelberger Universitätsbibliothek vorhandenen Geräte
auch sporadisch nutzen.
5.4 Laufende Mittel für Sachausgaben
Als Eigenleistungen der Antragsteller sind unterschiedliche Komponenten
zu berücksichtigen. Das Projekt beginnt innerhalb einer elaborierten
lexikographischen und auch informellen Infrastruktur und kann die damit vorhandenen
Ressourcen nutzen. Sie müssen nicht erst aufgebaut werden Dazu gehört
beispielsweise die durch das DRW erarbeitete Struktur der Wörterbuchdaten
in FAUST als Ausgangspunkt für das FWB und die Informationsstruktur
im Internet, die Informationsinhalte (das gesamte Wörterbuch). Im Bereich
der Software gehört dazu die Bildarchivversion von FAUST3, zu der lediglich
fünf weitere Lizenzen über die zehn Lizenzen des DRW hinaus erforderlich
sind. Ebenso stellen die bereits vorhandenen digitalen Texte und die ca. 10.000
in FAUST bereits vorhandenen Faksimiles eine Eigenleistung des DRW dar.
Von seiten des FWB kann der Text aller bisher erschienenen Lieferungen (vier
Bände) sowie die Klassifizierung seiner Korpusquellen beigesteuert werden.
6. Erklärungen
6.1
Ein Antrag auf Finanzierung dieses Vorhabens wurde bei keiner anderen Stelle
eingereicht. Wenn ich einen solchen Antrag stelle, werde ich die Deutsche
Forschungsgemeinschaft unverzüglich benachrichtigen.
7. Unterschriften
gez. Dr. Heino Speer (Deutsches Rechtswörterbuch)
gez. Prof. Dr. Oskar Reichmann (Frühneuhochdeutsches Wörterbuch)
gez. Dr. Hermann Josef Dörpinghaus (Universitätsbibliothek Heidelberg)
8. Verzeichnis der Anlagen
Verzeichnis ausgewählter Sekundärliteratur
Abbildungen zur Belegbearbeitung im DRW (Ergänzung zu Teil 2.2.1.
des Antrags)
Diskussion der Zusammenstellung des Quellenkorpus des FWB und Auszug aus
dem Quellenverzeichnis
Prospekt der Firma Land-Software (FAUST)
Angebote zu den EDV-Geräten
2002-01-07