Bibframe, RDA, MARC, JSON... wir helfen Ihnen, diese Konzepte zu unterscheiden!

Der Austausch von bibliografischen Daten ist eine langjährige Errungenschaft. Wir könnten unsere Analyse mit gedruckten Bibliografien und Verbundkatalogen auf Karteikarten beginnen (Stichwort: Mundaneum / Paul Otlet). Aus pragmatischen Gründen beschränken wir uns jedoch auf das MARC-Format, das den Datenaustausch seit der Informatisierung der Bibliotheken symbolisiert. MARC stammt aus den späten 1960er Jahren – lange vor dem Web – und ist heute noch in Bibliothekssystemen vorherrschend.

Die gemeinsame Nutzung von Daten ist also seit langem Teil der DNA von Bibliotheken. Dies unterscheidet sie auch von Archiven: die Ressourcen sind veröffentlicht, sie befinden sich im Besitz anderer Institutionen und die Beschreibungsarbeit kann daher gemeinsam durchgeführt und geteilt werden. Dieser Kontext ändert sich heute mit den Autoritätsdatensäzten, auf die wir später noch zurückkommen werden.

Wie erfolgt heute der standardisierte bibliografische Austausch in Bibliotheken?

Wir können unsere verschiedenen Standards in Stufen unterteilen:

1. Das Speicherformat: MARC/ISO oder MARC/XML.

Als Beispiel sehen Sie hier eine MARC-Aufnahme im nativen Austauschformat (nach dem ursprünglichen ISO 2709-Standard, der zur Einsparung von Speicherplatz entwickelt wurde)...

00562nz  a2200169n  4500001001400000003000500014005001700019008004100036035001500077039010600092040002600198072000900224110006100233410004500294667003000339999002300369vtls009951124RERO20140816170306.0970318   a z  babn             ana     d  aA009951124 9a201408161703bVLOADc200902131049d9511c200902131048d9511c200406201733dVLOADy200406201021zVLOAD  aRERO vsmatbfrefrero  as1se2 aAssociation des métiers d'art et d'artisanat du Valais2 aMétiers d'art et d'artisanat du Valais  aDescripteur validé RERO  aVIRTUA50         y

... und hier ist sein Äquivalent in MARC/XML (das viel mehr Zeichen verbraucht):

<?xml version="1.0" encoding="UTF-8" ?>
<marc:collection xmlns:marc="http://www.loc.gov/MARC21/slim" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.loc.gov/MARC21/slim http://www.loc.gov/standards/marcxml/schema/MARC21slim.xsd">
    <marc:record>
        <marc:leader>00562nz  a2200169n  4500</marc:leader>
        <marc:controlfield tag="001">vtls009951124</marc:controlfield>
        <marc:controlfield tag="003">RERO</marc:controlfield>
        <marc:controlfield tag="005">20140816170306.0</marc:controlfield>
        <marc:controlfield tag="008">970318   a z  babn             ana     d</marc:controlfield>
        <marc:datafield tag="035" ind1=" " ind2=" ">
            <marc:subfield code="a">A009951124</marc:subfield>
        </marc:datafield>
        <marc:datafield tag="039" ind1=" " ind2="9">
            <marc:subfield code="a">201408161703</marc:subfield>
            <marc:subfield code="b">VLOAD</marc:subfield>
            <marc:subfield code="c">200902131049</marc:subfield>
            <marc:subfield code="d">9511</marc:subfield>
            <marc:subfield code="c">200902131048</marc:subfield>
            <marc:subfield code="d">9511</marc:subfield>
            <marc:subfield code="c">200406201733</marc:subfield>
            <marc:subfield code="d">VLOAD</marc:subfield>
            <marc:subfield code="y">200406201021</marc:subfield>
            <marc:subfield code="z">VLOAD</marc:subfield>
        </marc:datafield>
        <marc:datafield tag="040" ind1=" " ind2=" ">
            <marc:subfield code="a">RERO vsmat</marc:subfield>
            <marc:subfield code="b">fre</marc:subfield>
            <marc:subfield code="f">rero</marc:subfield>
        </marc:datafield>
        <marc:datafield tag="072" ind1=" " ind2=" ">
            <marc:subfield code="a">s1se</marc:subfield>
        </marc:datafield>
        <marc:datafield tag="110" ind1="2" ind2=" ">
            <marc:subfield code="a">Association des métiers d'art et d'artisanat du Valais</marc:subfield>
        </marc:datafield>
        <marc:datafield tag="410" ind1="2" ind2=" ">
            <marc:subfield code="a">Métiers d'art et d'artisanat du Valais</marc:subfield>
        </marc:datafield>
        <marc:datafield tag="667" ind1=" " ind2=" ">
            <marc:subfield code="a">Descripteur validé RERO</marc:subfield>
        </marc:datafield>
        <marc:datafield tag="999" ind1=" " ind2=" ">
            <marc:subfield code="a">VIRTUA50         y</marc:subfield>
        </marc:datafield>
    </marc:record>
</marc:collection>

2. Die interne Struktur von MARC

Diese Strukturen sind standardisiert und beschreiben, welche Inhalte sich in welchen Feldern befinden. Die heute bekanntesten Standards sind UNIMARC (der Titel steht in Feld 200) und MARC21 (der Titel steht in Feld 245). Beide können in MARC/ISO oder MARC/XML gespeichert werden.

3. Die Erfassungsregeln

Diese legen fest, wie der Inhalt der Felder eingegeben werden soll. Beispiele hierfür sind die Informationsquelle für die Eingabe, obligatorische und optionale Elemente, Gross- und Kleinschreibung, Transkription des Textes auf der Ressource, Verwendung spezifischer Abkürzungen, Listen zulässiger Begriffe (Rollen, Inhalts- und Medientypen), usw.

Die heute am weitesten verbreiteten Regeln für die bibliografische Beschreibung heissen RDA (Resource Description and Access).

4. Die Datenmodellierung kann eine Erweiterung, eine vierte Ebene darstellen.

Sehr oft ist diese Ebene eng mit den Katalogisierungsregeln verbunden. Sie definiert die vorhandenen Entitäten und ihre Beziehungen an. Lange Zeit haben Bibliotheken nur Titel-, Bestands- und Exemplaraufnahmen beschrieben. Anfang der 2000er Jahre wurde mit der FRBR-Modellierung (heute LRM) die Katalogisierung in einen breiteren Kontext von Entitäten gestellt: Personen, Werke, Orte, Konzepte, usw. Diese Entitäten sind in der Regel mit den Beschreibungen in Archiven, Museen und im Internet im Allgemeinen identisch und ebnen daher den Weg für eine enorme Erweiterung des Datenaustauschs, für den die Bibliotheken als wichtigste Garanten agieren. Das Projekt GND für Kulturdaten (GND4C) ist ein anschauliches Beispiel dafür.

Wie unterscheidet sich RERO ILS davon?

Bei der Entwicklung von RERO ILS war es eine grundlegende Entscheidung, die Software nicht direkt auf dem MARC-Format aufzubauen. Da RERO ILS auf den Technologien des Invenio 3 Frameworks basiert, haben wir natürlich JSON als Basis für die Daten übernommen. JSON ist ein Format zur Strukturierung von Daten, das nach demselben Prinzip wie XML funktioniert, aber in viele neuere Programmiersprachen integriert ist.

Um das oben erwähnte Prinzip der Ebenen wieder aufzugreifen, schlagen wir Ihnen folgenden Vergleich vor:

Ebene RERO ILS Rest der Welt (mit Ausnahmen) Unsere Bemerkungen
Speicherformat JSON MARC/ISO Es wäre durchaus denkbar, MARC21 oder UNIMARC in JSON zu speichern.
Interne Stuktur Bibframe MARC21, UNIMARC, ... Bibframe definiert, wie JSON-Elemente heissen und welche Art von Daten sie enthalten: haben wir eine hierarchische Struktur wie bei einer russischen Puppe oder haben wir ein einfaches Element mit Text als Wert?
Erfassungsregeln RDA RDA Die noch junge Entwicklung von RDA führt zu unterschiedlichen Implementierungsniveaus in den einzelnen Bibliotheken.
Datenmodellierung LRM (Ziel) LRM (Ziel) Die Modellierung wird unterschiedlich implementiert, je nach Bibliothekssystemen, Katalogisierungsstandards und Suchschnittstellen. LRM ist ein ehrgeiziges Ziel, das nicht so schnell erreichbar ist...

Konkretes Bibframe/JSON-Beispiel

Die Bibframe/JSON-Stuktur wird in beiden Projekten, RERO ILS und SONAR, auf sehr ähnliche Weise verwendet.

Hier ein JSON-Auszug aus dem Dokument "Bulle au pluriel" (siehe die Titelaufnahme im RERO+ Katalog oder die JSON-Daten via die RERO ILS API. Dieser Auszug entspricht dem Autor, nämlich

  • in RDA: ein Akteur (Person), der mit einer Manifestation/Werk (Dokument) in Verbindung steht
  • in MARC21: das Feld 100 oder 700
  • in Bibframe: das Feld contribution
    "contribution": [
      {
        "agent": {
          "$ref": "https://mef.rero.ch/api/agents/idref/254732569",
          "type": "bf:Person"
        },
        "role": [
          "cre"
        ]
      }]

Im Gegensatz zu MARC erlauben Bibframe und JSON die Verschachtelung von Elementen und eine mehrstufige Hierarchie, was die Möglichkeit granularerer und strukturierterer Daten bietet. So verweist in unserem Beispiel der Schlüssel $ref auf den Autor im IdRef-Repository und befindet sich innerhalb des Schlüssels agent, der wiederum innerhalb von contribution liegt. Diese Granularität ermöglicht es, einige Einschränkungen von MARC zu verbessern (für diejenigen, die sich z. B. an die Bindungsunterfelder 245$6 oder 336$8 erinnern).

Warum wird der Name des Autors nicht angezeigt? Wir ziehen den Identifikator vor, so funktioniert Linked Data. Wenn der Name geändert wird, müssen nicht alle verlinkten Dokumente geändert werden. Stattdessen werden diese Dokumente neu indiziert, um eine effiziente Suche auf der Grundlage des neuen Namens zu ermöglichen.

Sagten Sie, dass es RDA gab? Ja, RDA ist an dem Vokabular zu erkennen, das in den Werten verwendet wird, wie dem Code cre (creator) für die Rolle. Der agent-Schlüssel stammt von Bibframe, stimmt aber glücklicherweise mit der RDA-Terminologie. Die vollständige RDA-Schicht wird nur im Editor hinzugefügt und entsprechend der Sprache der Benutzeroberfläche übersetzt, auf Französisch in der untenstehenden Abbildung.

editeur_contribution

Ist RERO ILS interoperabel?

Wir werden nichts anderes sagen! RERO ILS ist mit dem Rest der Welt interoperabel, da es das MARC-Format im Import und Export verwaltet. Was innerhalb des Systems passiert, ist aus Sicht der Interoperabilität nicht wirklich relevant.

Damit Austauschprozesse stattfinden können, verlassen sich Bibliothekssysteme auf Protokolle wie SRU (Nachfolger von Z39.50), welches beschreibt, in welcher Form Daten durchsucht und abgerufen werden können, insbesondere in MARC/XML.

Somit kann RERO ILS in MARC importieren (über die Funktion "Import aus dem Web") und in MARC über SRU exportieren. Siehe zum Beispiel alle Dokumente von Jean Piaget (dessen GND-ID 118594133 ist) über den SRU-Dienst.

Schliesslich könnte man fast sagen, dass RERO ILS natürlich interoperabel ist, da das Projekt Open Source ist.

Warum es nicht wie alle anderen machen?

MARC ist für seine Zeit ein sehr gut durchdachter Standard, und bis zu einem gewissen Grad skalierbar: seine Lebensdauer beweist es! Webtechnologien passen sich jedoch leichter an neue Formate wie XML und JSON an. Dies gilt auch und vor allem für die Menschen, die die heutigen Anwendungen entwickeln: sie interagieren mit Bibliotheksdaten, um institutionelle Websites, mobile Anwendungen, Webdienste, usw. zu entwickeln. Oftmals arbeiten diese Personen nicht nur mit Bibliotheksdaten und bevorzugen daher allgemeine Formate, die in allen Bereichen weit verbreitet sind.

Dies ist eine der Stärken von RERO ILS, das nativ mit bestimmten modernen Standards wie REST-API funktioniert.

Partager