Taxonomie-/Dokumenttyp-Management
Auf diesen Seiten sind die Arbeitsprozesse und technischen Hintergründe für die Pflege der Taxonomie- und ESV-Dokumenttyp-Metadaten beschrieben, die von der Content-Plattform ESV-Digital zur Filterung der Trefferliste genutzt werden.
Hintergrund
Die Benutzer von ESV-Digital können in der Trefferliste mithilfe sogenannter Such- oder Filterfacetten verschiedene Kriterien festlegen, nach denen die Anzeige der Suchergebnisse gefiltert werden soll. Die Filterfacetten sind über Dropdownlisten bedienbar, die über der Trefferliste angeordnet sind.
- Dokumente: Die Einträge dieser Filterfacette werden aus den Werten der Processing Instruction (PI)
<?esv_dokumenttyp … ?>generiert. - Fachgebiet: Die Einträge dieser Filterfacette werden aus den Werten des XML-Elements
<taxonomie name="ESV-Digital-Taxonomie">generiert.
Management der Metadaten für Filterfacetten
Die Werte für die Filterfacette Dokumente (d. h. die Werte für die PI <?esv_dokumenttyp … ?>) werden den Dokumenten bei der Vorproduktion per Skript (add_doktype_and_sortdate.xquery) anhand bestimmter Metadaten (<esv_instanz@typ>, <esv_instanz/meta/metaeintrag>) automatisch zugewiesen. Infolge dieser Abhängigkeit können keine beliebigen Werte zugewiesen werden, sondern nur die, die im Skript bereits definiert sind. Neue oder geänderte Werte können nur nach einer Anpassung/Erweiterung des Skripts verwendet werden.
Bei den Werten für die Filterfacette Fachgebiete ist das anders. Diese werden über das Element <taxonomie name = "ESV-Digital-Taxonomie"> gesteuert, für das beliebige Werte angegeben werden können. In der Filterfacette werden sie dann eins zu eins angezeigt. Damit jedoch die Benutzer diese Filterfacette sinnvoll zum Filtern von gefundenen Dokumente nutzen können, muss bei der Zuweisung der Werte zu den jeweiligen Dokumenten darauf geachtet werden, dass nur solche Werte verwendet werden, die auf einer vom Lektorat/Produktmanagement kuratierten Liste stehen. Nur so kann eine fachgerechte Klassifikation der Dokumente sichergestellt werden.
Außerdem muss für die Werte eine konsistente Schreibung verwendet werden. Unterschiedliche Schreibungen des gleichen Werts und inkonsistente Verwendung von Leerzeichen führen anderenfalls zu mehrfachen, redundanten Einträgen in der Filterfacette. Wenn z. B. im einen Dokument für das Element <taxonomie name = "ESV-Digital-Taxonomie"> der Wert Compliance-Management verwendet wird und in einem anderen Dokument der Wert Compliance Management, werden in der Filterfacette entsprechend zwei Einträge generiert, obwohl eigentlich nur einer benötigt wird. Das gleich gilt, wenn bei einem Dokument der Wert Nachfolge/Stiftung/Vermögen und bei einem anderen Dokument der Wert Nachfolge / Stiftung / Vermögen verwendet wird. Das kann Benutzer verwirren. Zudem müssen die Benutzer dann zusätzlichen Mausklicks ausführen, um einen Filter zu konfigurieren, der alle gewünschten Dokumente erfasst.
Um zu gewährleisten, dass für die PI <?esv_dokumenttyp … ?> und das Element <taxonomie name = "ESV-Digital-Taxonomie"> nur solche Werte einem Dokument zugewiesen werden, die gültig sind, vom Lektorat/Produktmanagement für das betreffende Werk zugelassen sind und eine einheitliche Schreibung aufweisen, erfolgt die Wertzuweisung durch den Import einer Liste, in der zu jedem Dokument (Instanzdatei) eines Werks die vom Lektorat/Produktmanagement gewünschten Werte angegeben sind.
Die Liste wird initial vom Content-Management-Team in Form einer Microsoft Excel-Datei dem Lektorat/Produktmanagement bereitgestellt. Das Lektorat/Produktmanagement verwaltet in dieser Datei dann die Zuweisungen für das betreffende Werk.
Wenn die Werte für ein bestimmtes Werk vom Lektorat/Produktmanagement abschließend festgelegt worden sind, exportiert das Content-Management-Team den Inhalt der Excel-Datei in eine CSV-Datei und wendet die Werte aus der CSV-Datei mithilfe eines XML-Refaktorierungsskripts auf die betreffenden Instanzdateien des Werks an.
