OpenData-Metadatenstruktur

Klassifikation
Dimension Wert
Abdeckungsgrad im Standardisierungsvorhaben
  • Standardisierung von Strukturen
  • Adressierte Austauschpartner
  • Verwaltungen
    • Verwaltungen
      • International
      • Bund
      • Kommune
      • Land
    Adressierte/Referenzierte Richtlinien und Verordnungen (sofern gegeben)
  • Europäische Richtlinien
  • Durchdringungsgrad
  • 3-5
  • Fachbezogenheit / Reichweite
  • ist auf alle Fachlichkeiten anwendbar (unabhängig, generell, generisch)
  • FIM-Baustein
  • Formulare
  • Leistungsbeschreibungen
  • FIM-Baustein Formulare: Umfang Formularstandardisierung
  • gesamte Formulare
  • einzelne Formularfelder
    • einzelne Formularfelder
      • Standardisierung des Feldtyps
      • Standardisierung des Formularfeldinhalts
    FIM-Baustein Leistungsbeschreibungen: Umfang der Standardisierung
  • Gesamte Leistungsbeschreibungen
  • Nutzungsbedingungen
  • Geschäftsbereich
  • Recht
  • Verteidigung
  • Forschung und Entwicklung
  • Revision
  • Arbeit und Soziales
  • Veterinäraufsicht / Lebensmittelüberwachung
  • Friedhof
  • Schulen
  • Auswärtiges
  • Wirtschaft
  • Gesundheit
  • Sicherheit und Ordnung
  • Bauordnung / Bauverwaltung
  • Gewerbe
  • Sonstige Geschäftsbereiche
  • Bibliotheken
  • Gleichstellung
  • Sport
  • Bildung
  • Grünflächen
  • Stadtplanung
  • Bürgerservice
  • Hochbau- und Gebäudemanagement / Wohnungsförderung
  • Statistik und Wahlen
  • Einwohner- und Meldewesen / Personenstand
  • Inneres
  • Steuern
  • Energie
  • Keine Angabe
  • Straßen
  • Entsorgung
  • Kinder, Jugend und Familie
  • Technologie
  • Entwicklungshilfe
  • Kultur
  • Tourismus
  • Ernährung
  • Landwirtschaft und Forsten
  • Umwelt
  • Europa
  • Medien
  • Verbraucherschutz
  • Familien
  • Personal und Organisation
  • Verkehr
  • Feuerschutz / Zivilschutz
  • Presse- und Öffentlichkeitsarbeit / Marketing
  • Rechnungsprüfung
  • Vermessung und Kataster / Geodaten
  • Finanzen
  • Praxiseinsatz
  • Bundesbehörden
  • Landesbehörden
  • Kommunen
  • Standardisierungstyp
  • Technischer Standard
  • Organisatorische Standards (bspw. redaktionelle Standards)
  • Interoperabilitätsstandard
  • Standardisierungsverfahren/-organisation
  • keine Standardisierung bzw. Normung
  • Status
  • Offener Standard
  • Verbindlichkeit
  • Nutzung für bestimmte Anwendergruppe verpflichtend
  • Umsetzungsgrad: In Entwicklung seit01.07.2012
    Umsetzungsgrad: Im Einsatz seit01.01.2013

     

    Eine der wichtigsten Eigenschaften offener Daten ist der leichte Zugang zu ihnen. Datenjournalisten und Anwendungsentwickler können Daten schneller und besser erschließen, wenn diese in zentralen Portalen auffindbar sind. Da eine zentrale Datenhaltung über Verwaltungs- und Domänengrenzen hinweg aus verschiedenen Gründen kaum umsetzbar ist (heterogene Daten, verteilte Kompetenz, Interessenskonflikte, etc.) und auch wenig sinnvoll ist, wird in der Regel eine dezentrale Datenhaltung mit einem zentralen Metadatenportal genutzt. An prominenter Stelle – etwa daten.berlin.de – werden Informationen zu und Verweise auf die Daten der Datenbereitsteller gesammelt und präsentiert – in Berlin beispielsweise die verschiedener Senatsverwaltungen, der Stadtreinigung und der Verkehrsbetriebe.

    Was aber wird neben Name, Beschreibung und Autor in den Metadaten offener Datensätze festgehalten? Diese Frage stellt sich beim Erfassen der Metadaten als auch beim automatischen Austausch von Metadatensätzen, dem sogenannten Harvesting. Nur wenn Struktur und Bedeutung ausreichend einheitlich oder selbsterklärend sind, lässt sich ein zentrales Portal, hier für Deutschland, realisieren, das verschiedene Datenangebote und die Inhalte bestehender Datenkataloge vereinigt.

    Einheitliche Metadaten werden in vielen Domänen mit unterschiedlichen Ansätzen und Prioritäten adressiert, beispielsweise für Umweltdaten oder bibliographische Daten (vgl. OpenGov-Studie Abschnitt Metadaten). Für Open Data hat es sich in Europa und Amerika bewährt, die Metadaten-Strukturen von CKAN (Comprehensive Knowledge Archive Network) der OKFN zu nutzen. CKAN ist für Open Data der de-facto-Standard für Datenkatalogsoftware.

    CKAN tauscht Metadaten im JSON-Format aus. Das einzige Pflichtfeld ist der Name, der zugleich für Nutzer lesbar und URL-freundlich sein sollte, alle anderen Felder sind optional. Zu den Kernfeldern zählen Titel, Beschreibung, Ressourcen (also Datendateien oder -dienste), Lizenz und Ansprechpartner. Weitere Angaben können als JSON-Wörterbuch, d.h. als verschachtelte Schlüssel-Wert-Paare abgelegt werden. Diese Konzentration auf das Wesentliche zusammen mit der großen Flexibilität dürften der Grund für die Verbreitung dieses Metadatenmodells sein.

    Im Lauf der Entwicklung von Open Data vor allem in Berlin und Deutschland zeichnete sich jedoch der Wunsch nach mehr Verbindlichkeit ab: Viele Datenbereitsteller und Entwickler wollten festgelegt haben, wo welche Information in welcher Form steht. Um einerseits den minimalen, flexiblen Charakter von CKAN und JSON zu erhalten und gleichzeitig eindeutig festzulegen, wie die Metadaten für OGPD aussehen sollen, entwickeln wir das JSON-Schema für Open Government Data (OGD).

    Die OGD-Metadaten-Struktur wird auf github.com gepflegt. Sie ist nicht nur als Werkzeug gedacht, um valide Metadaten bestimmen zu können, sondern vielmehr als Kommunikationsmittel für Interessierte wie öffentliche Entscheider, Datenbereitsteller, Entwickler und andere Open-Data-Initiativen im deutschsprachigen Raum. Diesen Zwecken dient auch die frühzeitige Veröffentlichung im Beta-Stadium und die öffentlich nachvollziehbare Entwicklung auf github.com.

    Die Metadaten-Struktur, die sowohl die Beschreibung von Datensätzen (inkl. von Datendiensten), von Dokumenten und von Applikationen unterstützt, ist wie folgt aufgebaut: Die wichtigsten Eigenschaften werden auf oberster Ebene abgelegt. Dazu gehören: Titel, Bezeichner, Beschreibung, Verantwortliche und Nutzungsbestimmungen. Weiterhin essenziell ist die Liste der Ressourcen, also die eigentlichen Daten, Dokumente oder Applikationen. Wichtigste Eigenschaft jeder Ressource ist wiederum deren URL. Außerdem können je Ressource  Beschreibung und Format vermerkt werden. Dieser Aufbau ermöglicht es beispielsweise, inhaltlich zusammengehörende Dateien als einen Datensatz zu erfassen, für gegebenenfalls verschiedene Zeitabschnitte, in verschiedenen Sprachen oder Formaten. Innerhalb des Bereichs "Extras" werden alle weiteren Angaben gespeichert. Dazu gehören vor allem die zeitliche und räumliche Einordnung, sowie die Angaben zur Herkunft bei importierten Einträgen. (Quelle: https://www.govdata.de/metadatenschema)

    Verknüpfte Orgranisationen: 

    Verknüpfte Projekte: