DadAWeb 3.0 - Projektdokumentation
Auf dieser Seite findet sich die laufende Projektdokumentation aller aktuellen DadAWeb 3.0 Projekte (zu.Z. nur DadA-L 3.0). Reverse Gliederung: Also die aktuellen Einträge erfolgen stets oben, so dass der älteste Eintrag an letzter Stelle aufgeführt wird.
ACHTUNG: Hier bitte keine Direktlinks zum INTERNEN Test- und Aufbauportal veröffentlichen! Statt der vollständigen URL am besten nur die in der URL letztgenannte Wiki-Seite benennen. Beispiel:
- statt: www.das-sag-ich-nicht.de/dada-l/index.php/Main_Page
- nur /Main-Page angeben
Inhaltsverzeichnis
- 1 Roadmap und Milestones
- 2 Offene Fragen und Probleme
- 3 Geklärte Fragen / erledigte Probleme
Roadmap und Milestones
Wird bei nächster Gelegenheit auf einer separaten Seite entwickelt
Offene Fragen und Probleme
Seitentitel
Offenes Problem ISBN-Nr. im Seitentitel
Bei einer rein manuellen Erfassung der Titel ist die ISBN-Nummern eher störend und sehr anfällig für Fehler, die dann nur durch Umbenennen der Seite schlecht behoben werden können. Die Daten der alten DadA-L enthalten ohnehin so gut wie keine ISBN-Nummern, d.h. vor einem Import müssten in der Importdatei die ISBN-Nummern ergänzt werden. Wenn jedoch die Erfassung (z.B. über die ZACK-Schnittstelle) überwiegend automatisiert erfolgt und dabei auch der Seitentitel automatisch generiert werden kann, dann macht die ISBN-Nr. im Seitentitel sehr wohl Sinn. Am besten wir schieben das Problem in eine Warteschleife bis geklärt ist, ob und wie der automatisierte Titeldatenimport via Zack möglich ist.--Jochen_S 11:07, 14. Mär. 2010 (UTC)
Aktueller Vorschlag von Jochen (07.03.2010):
Nach einigem Meditieren und Experimentieren würde ich in Ergänzung der am 05.03.2010 besprochenen Lösung die folgende errweiterte Reglung für den (technischen) Seitentitel vorschlagen:
Wir sollten für den Seitentitel in Anlehnung an die Einrichtung des Kurztitels in wissenschaftlichen Arbeiten die folgende Regel/Syntax verwenden:
- Element: Nachname/n (des auf dem Titelblatt erstgenannten Autors bzw. der maximal ersten zwei Autoren, siehe Beispiele: Degen/Knoblauch. Muss noch geklärt werden, ob und wie sich dies automatisiert generieren lässt.)
- Element: Kurztitel (vollständiger Haupttitel, bzw. wenn er aus mehr als 8 Wörtern besteht, auf die ersten 8 Worte abgekürzter Haupttitel des Buches. Mit nachgestelltem Artikel, um die korrekte Sortierung zu garantieren)
- Element: Erscheinungsort
- Element: Verlagsname (in der im Buchhandel gebräuchlichen Kurzform, s. Amazon oder buchhandel.de)
- Element: Erscheinungsjahr
-
Element: ISBN-Nr. (ohne Bindestriche, möglichst ISBN-13, frühere Werke die ISBN-10 bzw. "[ohne ISBN]")- siehe: Offenes Problem ISBN-Nr. im Seitentitel
Beispiele:
- Ach: Anarchismus. München: Verlag: Evangelischer Presseverband für Bayern, 1979. - [ohne ISBN]
- Degen/Knoblauch: Anarchismus. Stuttgart: Schmetterling-Verlag, 2009. - ISBN-13: 9783896575906
- Degen/Knoblauch: Anarchismus 2.0. Stuttgart: Schmetterling-Verlag, 2009. - ISBN-13: 9783896570529
- Catepoel: Anarchismus, Der. München: C.H. Beck, 1979. - [ohne ISBN]
- Eltzbacher: Anarchismus, Der. Berlin: Libertad Verlag, 1987. - ISBN-13: 9783922226116
- Zenker: Anarchismus, Der. Berlin: Libertad Verlag, 1979. - ISBN-10: 3922226094
Nähere Infos zum Kontext, aus dem heraus ich diese Regel abgeleitet habe, siehe im Storyboard.
Kurztitel = Seitentitel
Der als Kurztitel gestaltete Seitentitel hat zudem den Vorteil, das wir damit den Kurztitel als festes Element der Bibliographie einführen. Kurztitel werden für DadA-P ohnehin als Zitier- und Referenztitel benötigt. Ich kann mir gut vorstellen, dass der in der DadA-L benutzte Kurztitel in der wissenschaftlicheh Lteratur als verbindlicher Kurztitel verwendet werden würde, allerdings in seiner klassischen Form (also ohne: Erscheinungsort: Verlag, Erscheinungsjahr.- ISBN-Nr.).
Aus dieser Perspektive betrachtet ergibt sich für die automatische Generierung des Seitentitels (wenn die möglich und nötog sein sollte) eine weitere Alternative. Wenn wir bei der Titelerfassung den klassischen Kurztitel/Zitiertitel (Nachname: Kurztitel) als eigenes Feld abfragen, kann nämlich der (technische) Seitentitel automatisch aus den folgenden bibliographischen Elementen generiert werden:
- Element: klassischer Kurztitel. (Nachname: Kurztitel)
- Element: Erscheinungsort:
- Element: Verlag,
- Element: Erscheinungsjahr.
- Element: .- ISBN-Nr. (wenn nix, dann "[ohne ISBN-Nr.]"
Frage zur Sortierung der Ergebnisliste
Können wir eine Sortierung hinbekommen wie oben in den Beispielen? In dem Fall müsste in der Ergebnisliste nach folgender Regel sortiert werden:
- Sortierkriterium: Titelabkürzung (also allea was nach dem/den Nachnamen und dem Doppelpunkt vor dem den Punkt kommt, der den Kurztitel abschließt.
- Sortierkriterium: Nachname/n des Autors bzw. der ersten zwei Autoren.
Sollte dies zu viel Schwierigkeiten machen, so würde ich vorschlagen, ein Extrafeld Kurztitel bzw. Titelabkürzung einzurichten, das für die Ergebnisliste zusammen den anderen Elementen des Kurztitels mit ausgewertet wird.
Telefonische Absprache zwischen Markus und Jochen am 05.03.2010
Der Seitentitel soll folgende Daten-Elemente enthalten:
- Autor
- Haupttitel inkl. korrekter Sortierung
- Erscheinungsort
- Erscheinungsjahr
Vorteile
Der Seitentitel enthält so bereits alle für die Suchmaschinen wichtigen Daten (wobei der Erscheinungsort und das Erscheinungsjahr nicht unbedingt wichtig sind. Wichtiger wäre dann noch die ISBN-Nummer und evtll auch der Verlagsname)
Nachteile
Einen solchen technischen Titel würde wohl kaum ein Nutzer der DadA-L selber erstellen. Das funkltioniert nur, wenn der technische Seitentitel nach Eingabe der "natürlichen" Daten, also der Daten so wie sie dem Buch(umschlag/Impressum) selbst entnommen werden können, automatisch aus den einzelnen Datenfeldern (Autor, Titel, Erscheinungsort und -jahr) generiert werden würde.
Offene Fragen
- Reicht der von Mediawiki für den Seitentitel zur Verfügung gestellte Platz aus?
- Das Standardprocedere der Seiten/Dokumentenerfassung unter Semtic Forms sieht als erstes vor, dass der Seitentitel eingegaben wird. Mit dem Resultat:
- Gibt es den Seitentitel: So wird die bereits bestehende Seite aufgerufen und das Dokument kann modifiziert werden
- Gibt es den Seitentitel noch nicht: Wird unter dem eingegebenen Titel die Seite angelegt.
- Wir müssten also eine eigene neue Routine für eine vorgelagerte Datenerfassung entwickeln. Macht das Sinn?
Der Seitentitel ist der Dreh- und Angelpunkt sowohl für die Erfassung neuer Titel als auch für die Modifikation bestehender Titel. Bei diesem System muss ich jedoch den genauen Titel kennen, wenn ich ihn auf diesem Weg modifizieren will. Gebe ich z.B. nur "Anarchismus" ein, so zeigt er mir nur den Zenker-Titel, nicht jedoch "Anarchismus und Bürgerkrieg" oder "Anarchismus und Kommunismus". Da müssen wir vermutlich ohnehin das Procedere der kombinierten Titelsuche und Titelerfassung im Sinne des KISS-Prinzips benutzerfreundlicher gestalten. Also grobgesagt:
- Suche, ob es den Titel bereits gibt: Dabei sollte ein Wort oder eine Wortkombination aus dem Titel ausreichen, um alle Titel, in denen diese Begriffe auftauchen, aufzulisten. Die zentrale Volltextsuche (links) ist für die Titelsuche leider nicht geeignet, da sie in allen Datenfeldern sucht.
Als Anzeige des Suchergebnisses wäre hier vielleicht der technische Titel wie angedacht gar nicht schlecht, weil er alle bibliographischen Kerndaten enthalten würde. - Wenn der gesuschte Begriff nicht gefunden wird und dementsprechend kein Titel existiert, dann sollte das Formular für die Titelerfassung aufgerufen werden. Vielleicht kann man in der Formularmaske das Seitentitel-Feld unterdrücken und nur den Originaltitel und die anderen gewünschten bibliographischen Daten abfragen, aus denen dann vielleicht beim Abspeichern der technische Seitentitel generiert wird?
Ich muss darüber mal ein wenig meditieren ... Noch unausgereifte Idee: Vielleicht sollten wir statt eines technischen Seitentitels, der für den gewöhnlichen User vermutlich viel zu kompliziert ist, einfach einen Kurztitel einführen, der nur die folgenden zwei Datenelemente enthält:
- Nachname des (1.) Autors
- Kurztitel: Originaltitel ohne Artikel, bestehend aus den maximal ersten fünf Worten des Haupttitels.
Muster:
- Rübner: Freie Arbeiter-Union Deutschlands steht dann für
- Hartmut Rübner: Die Freie Arbeiter-Union Deutschlands, Berlin: Libertad Verlag, 1994
Solch ein System wäre auch für die händische Erfassung durch normale User vielleicht einfacher zu verstehen als folgender Seitentitel:
Rübner, Hartmut: Freie Arbeiter-Union Deutschlands, Berlin 1994
Was meinst Du? Rübner ist da sicher noch nicht einmal ein besonders passendes Beispiel für die evtl. Schwiergkeiten des Users bei der Seitentitelerfassung. Problematischer dürfte die Erfassung von Titeln, wie dem hier sein:
- Die unsichtbare Front. Bericht über die illegale Arbeit in Deutschland (1937). Von Rudolf Berner (Autor), Andreas G. Graf (Hrsg.) und Dieter Nelles (Hrsg.)
Berlin: Libertad, 1997 (= Archiv für Sozial- und Kulturgeschichte; 7). Gebundene Ausgabe: 158 Seiten, zahlr. Abb. ISBN: 978-3922226239.
--Jochen 11:27, 6 March 2010 (UTC)
Kategorien / Tagging
Markus: Welche Kategorien werden gewählt (bswp. Kategorie: Import, alles weitere händisch, wenn überhaupt)
- Jochen:Ich weiß jetzt nicht so genau, was Du mit Kategorien meinst. Ich vermute mal, Du meinst nicht die ursprünglichen DadA-L Deskriptoren - oder? Am besten Du lotst mich mal durch die Dokumentation und zeigst mir online, was Du meinst.
- Markus: Mit Kategorien meine ich die wiki-Kategorien, wie z.B. bei wikipedia: http://de.wikipedia.org/wiki/Kategorie:Anarchismus
- Jochen:Die würden tatsächlich auch Sinn machen, wenn man z.B. dafür unsere alten DadA-Deskriptoren verwenden könnte. Für die alten DadA-Dokumentationen hatten wir einen sog. hierarchischen Thesaurus entwickelt und die meisten Dokumente sind damit wenigstens grob verschlagwortet worden. So ein hierarchischer Thesaurus ist aber sehr pflegeintensiv und für den Endanwender nach meiner Erfahrung dann meistens doch enttäuschend, weil im konkreten Fall sind dann eben die vorgegebenen Deskriptoren häufig unpassend. Deshalb tendiere ich seit einigen Jahren eher zum anarchischen System des freien Tagging, bei dem die User die Dokumente selber verschlagworten. Ich meine mich zu erinnern, dass es auch für Semantic Forms auch irgendwelche Tagging-Lösungen gibt. Siehe auch zur Nutzung der Kategorien unter Semantic Forms die Projektdoku.
Fazit: Ich würde sagen, wir schieben das Thema Kategorien/Tagging erst mal nach hinten und kümmern uns darum, wenn wir das Problem mit dem Seitentitel gelöst haben. Überlegenswert wäre jedoch, ob wir vielleicht das Feld Arbeitsdeskriptoren (Importdatei: "Anarchismus allgemein") als nichtöffentliches Feld mitlaufen lassen, um später bei Bedarf darazf zurückgreifen zu können.
- Jochen:Die würden tatsächlich auch Sinn machen, wenn man z.B. dafür unsere alten DadA-Deskriptoren verwenden könnte. Für die alten DadA-Dokumentationen hatten wir einen sog. hierarchischen Thesaurus entwickelt und die meisten Dokumente sind damit wenigstens grob verschlagwortet worden. So ein hierarchischer Thesaurus ist aber sehr pflegeintensiv und für den Endanwender nach meiner Erfahrung dann meistens doch enttäuschend, weil im konkreten Fall sind dann eben die vorgegebenen Deskriptoren häufig unpassend. Deshalb tendiere ich seit einigen Jahren eher zum anarchischen System des freien Tagging, bei dem die User die Dokumente selber verschlagworten. Ich meine mich zu erinnern, dass es auch für Semantic Forms auch irgendwelche Tagging-Lösungen gibt. Siehe auch zur Nutzung der Kategorien unter Semantic Forms die Projektdoku.
Systemfragen
Systemperformance
Das System läuft wirklich sehr schleppend. Für das Laden und Speichern von Seiten brauche ich durchschnittlich 10 bis gelegentlich fast 20 Sekunden, wobei die Performance schwankend ist. Also mal gehts (vielleicht Cache bedingt etwas flotter, mal ziemlich schleppend). Man kann damit arbeiten, aber im öffentlichen Betrieb wäre eine solche Performance unakzeptabel. Vielleicht macht es ohnehin Sinn, bald auf den Server des dadaweb.de umzuziehen, um die Entwicklung der Site von Anfang an in der Systemumgebung vorzunehmen, in der auch der spätere Livebetrieb stattfindet? --Jochen 09:39, 6 March 2010 (UTC)
Lokalisierung
Markus, kannst Du vielleicht bei Gelegenheit die deutsche Sprachversion aktivieren? Dann kann ich gleich von Anfang an bei der Entwiclung des User-Frontends das korrekte Wording benutzen.
ToolBox (unten rechts)
Was ist das für eine Toolbox? Also die bunte, die unten rechts aufpoppt, wenn man in den Editmodus der Seite geht. Die kenne ich als Tool noch gar nicht. Ist die jetzt Bestandteil des neuen Mediawiki oder ist das eine Extensions für Semantic Forms? Vielleicht kannst Du mir einen Link zur Dokumentation der Extension geben?
Geklärte Fragen / erledigte Probleme
Property
Markus: Wie wird mit einer Property, die im Seitenlayout erscheinen soll (wie z.B. Verfasser), aber leer ist, verfahren? Unterdrücken (Im moment so realisiert)? Leerzeichen? (Betrifft nur die Darstellung auf der Wiki-Seite)
- Jochen: Genau. So haben wir das damals auch mit der statischen Webversion von DadA-L gemacht. Dort kannst Du mal bei problematischen Titeln schauen, welche Lösung wir gewählt haben.
- Markus: Ok, sieht so aus, als würden diese Felder unterdrückt werden. Dann kann das ja so beibehalten werden.
- JAWOLL!--Jochen 09:46, 6 March 2010 (UTC)
DadA-L Feldstrukturen und Feldfunktionen
Es gilt die Dokumentation: DadA-L goes Web 3.0: Datenstrukturen und Ausgabeformate, Version 1.0.1
Diese nochmal geprüft und für den Bereich Monographien/Sammelwerke in den Feldstrukturen, Feldnamen und im Ausgabeformat (3b) für OK befunden. --Jochen_S 15:29, 15. Jun. 2010 (UTC)
Offene Frage an Markus und Stefan
Unselbständige Literatur
Wie verfahren wir mit der sog. Unselbständigen Literatur. Das sind z.B. Aufsätze in Fachzeitschriften oder Beiträge in Sammelwerken. In der alten DadA-L war diese Gattung mit in der DadA-L Dokumentation integriert. Sie wurde aber auch dort mit eigenen Datenfeldern erfasst. Ließe sich dies ebenso für die neue DadA-L 3.0 durch ein späteres "Draufsatteln" der unselbständigen Literatur auf die Mongraphien so realisieren? Oder macht es mehr Sinn, jede Gatung in einer eigenen DB zu managen und eher ein differenziertes DadAWeb-Suchinterface zu entwickeln, bei dem man auswählen kann, welche Quellen (also Monographien, Unselbständige Literatur und Presse, evt. später auch Biographien) bei der Suche berücksichtigt werden? Was vielleicht die "sauberste" Lösung wäre.
Multimedia Contents
DadA-L sollte sinnvollerweise auch die Möglichkeit bieten, Multimediainhalte mit aufzunehmen. Vor allem natürlich Bilddokumente, wie z.B. die Buchcover und PDF-Dokumente (die von vielen Verlagen online als Leseprobe zu ihren Büchern angeboten werde)n. Perspektivisch evtl. auch MP3-Files mit Autorenlesungen. Das lässt sich sicher "draufsatteln", sollte aber vielleicht jetzt schon mal "mitgedacht" werden.