Linked Data
Verknüpfte Daten — weltweit
In den letzten Jahren ist ein stetig wachsendes Netz aus Linked Data entstanden, das Informationen, die von unterschiedlichen Organisationen gepflegt werden, zu einem globale Netzwerk verknüpft. Das Semantic Web, das selbst aufgeklärte Zeitgenossen bisher für ein eher akademisches Thema hielten, wird damit Realität. Teilnehmer am Linked Data-Netz sind z.B. BBC, New York Times, Wikipedia, MusicBrainz, die Deutsche Nationalbibliothek, sowie zahlreiche wissenschaftliche Einrichtungen und Regierungsorganisationen. Haben sich die Zeiten geändert? Wir denken schon. Es wird auch für Sie Zeit, hier einzusteigen. Mit unserer umfassenden Erfahrung im Bereich Semantik und Informationsverarbeitung in Verbindung mit unserem REST- und Web-Knowhow unterstützen wir Sie dabei.
Grundprinzipien
Gemäß Tim Berners-Lee, Erfinder des Web und Chef des World Wide Web Consortium (W3C), liegen dem Linked Data-Konzept vier einfache Prinzipien zugrunde:
- Verwende URIs als Namen für Dinge.
- Verwende HTTP URIs, damit die Leute diese Namen nachschlagen können.
- Wenn jemand einen Namen nachschlägt, biete nützliche Information und verwende dabei die Standards (RDF, SPARQL).
- Biete von dort auch Links auf andere URIs, damit wir mehr Dinge entdecken können.
Damit können Menschen und Maschinen gleichermaßen die so vernetzte Information durchlaufen und systematisch durchsuchen. Gut gebaute Webanwendungen haben dies bisher für Menschen auch schon weitgehend ermöglicht. Aber nun kommen mit RDF und SPARQL Standards ins Spiel, die Maschinenlesbarkeit, schemagestützte Struktur und attributspezifische Suche ermöglichen.
Aus der Datenbank ins Linked Data-Netz
Ein einfacher Weg ins Linked Data-Netz geht direkt von Ihrer (relationalen) Datenbank aus. Mit der RDB-to-RDF Mapping Language R2RML beschreiben wir, wie die bestehenden Tabellen, Zeilen und Spalten in RDF abgebildet werden sollen. Open Source-Werkzeuge wie z.B. D2R Server übernehmen den Rest: Ihre Daten werden in RDF verfügbar und mit SPARQL durchsuchbar.
Die integrierte Webanwendung
Ein eleganterer Weg ist eine Webanwendung, die eine menschenlesbare HTML Darstellung der „Dinge“ mit Linked Data verbindet. Dies setzt voraus, dass die Webanwendung wie ein semantisches Netz strukturiert ist. Dann ist nur noch die Unterstützung des Ausgabeformats nötig, das die Anforderung des Clients berücksichtigt (Content Negotiation). Eine solche Webanwendung hat innoQ z.B. für das Umweltbundesamt entwickelt: die Umweltprobenbank. So eine integrierte Webanwendung können wir natürlich auch für Sie realisieren.
RDF Vokabulare
Die Verständlichkeit der eigenen Daten im globalen Linked Data Netz wird stark vereinfacht, wenn für das Schema bekannte RDF Vokabulare verwendet werden. Dies sind z.B. SKOS, Dublin Core, Data Cubes (vormals SCOVO), Geonames oder Darwin Core. Nicht immer ist dort alles genau so definiert, wie man es selbst getan hätte. Die Erweiterbarkeit von RDF durch Sub-Klassen und Sub-Properties bietet gute Möglichkeiten, eigene Spezialisierungen erkennbar an die bekannten Vokabulare anzuhängen. Wir kennen die für Ihren Gebrauch naheliegenden Standardvokabulare und formulieren bei Bedarf die benötigten Erweiterungen.
Ihr Unternehmens-Vokabular
Jedes Unternehmen spricht eine spezifische Sprache. Zum Teil liegt dies an der spezifischen Thematik, die Wortwahl ist aber auch Ausdruck der Unternehmenskultur. Wir beraten Sie bei der Formalisierung Ihres Unternehmens-Vokabulars auf Basis bestehender Glossare, Auswertung von Schlüsselpublikationen und Interviews. Am Ende verfügen Sie über ein RDF Schema und einen Unternehmensthesaurus, den sie z.B. mit unserer Open Source-Software iQvoc im Web weiter pflegen und verfügbar machen können. Beispiele sind der Semantic Network Service (SNS) des Umweltbundesamtes, an dessen Entwicklung wir beteiligt waren und den wir gerade auf iQvoc umstellen, oder das SURF Projekt der Deutschen Bank.
Vernetzung
Bei diesem Vorgehen sollten Ihre eigenen Daten bereits weitgehend miteinander vernetzt sein. Was aber noch fehlt, ist die externe Vernetzung mit bekannten Datenbeständen wie Wikipedia, Geonames oder branchenspezifischen Beiträgen. Potenzielle Vernetzungspartner finden Sie z.B. im Linked Data Katalog.
Auch hierbei hilft Open Source: wir verwenden für Sie Silk - „A Link Discovery Framework for the Web of Data“ – um diese Vernetzung teilautomatisiert herzustellen. Ein Beispiel ist das aktuelle Vorhaben Linked Environment Data.
Werden Sie Teil des globalen Linked Data Netzwerks und profitieren Sie von der verbesserten Sichtbarkeit Ihres Unternehmens. Entdecken Sie neue Kunden und potentielle Partner. Lassen Sie sich selbst entdecken in der neuen Welt des Semantic Web!
Weiterführende Informationen
- Open Source Vocabulary Management System iQvoc
- Linked Environment Data
- Umweltprobenbank des Umweltbundesamts