Sent from Hauptstadt!

ein Blog für den geneigten Leser

Unterschied und Gemeinsamkeiten von Tags und Ontologien

Tags: ,

Kategorie Promotion | Keine Kommentare »

In seinem Post über Folksonomien (Tags) und Taxonomien (Ontologien) kommt Dan Foody von Progress Software zu dem Schluss, dass beide Sachen eigentlich das Gleiche sind. Dem kann ich nicht ganz zustimmen, habe auch gleich mein Gegenargument als Kommentar hinterlassen. An dieser Stelle möchte ich aber nochmal ausführlicher dieser Frage nachgehen

Eine Taxonomie (Systematik, Begriffswerk) ist eine Sammlung von Begriffen und Beziehungen zwischen diesen Begriffen. So könnte man zum Beispiel sagen, es gibt den Oberbegriff Mensch und dieser zerfällt in Frau und Mann als spezifische Ausprägungen. Man kann weiterhin sagen, dass es Kinder und Erwachsene gibt, die jeweils Frau und Mann sein können. In solch einem Begriffswerk kann man auch Synonyme, Honoyme und Homografen definieren, etwa sucht nicht gleich Sucht oder Ehefrau gleich Hausdrache :-) Gerade für die Sprache existieren unheimlich komplexe Begriffswerke, man muss nur mal einen Blick auf WordNet werfen.

Eine noch stärker formalisierte Taxonomie bezeichnet man als Ontologie. In einer Ontologie werden zum Beispiel noch Axiome hinzugefügt, etwa der Art, dass eine Reise aus einem Start- und Zielort besteht, aber dass im Spezialfall einer Bahnreise Start- und Zielort nicht gleichzeitig in Europa und Nordamerika liegen dürfen. Aufgrund dieser genauen Formalisierung kann nun ein Computer Schlüsse aus den Angaben ziehen und Fragen selbständig beantworten. Sucht man zum Beispiel nach einer Möglichkeit um von Berlin nach New York zu reisen, so sollte der Computer nicht eine Bahnreise vorschlagen.

Die Erstellung von Taxonomien und Ontologien ist aufwendig und wird meist von Experten durchgeführt. Man muss sich sehr genau in dem Themengebiet auskennen, damit man die verschiedenen Begriffe sauber abgrenzen kann. Damit ist die Erstellung von Taxonomien kostenintensiv und lohnt nicht immer. Gerade Unternehmen müssen deshalb genau abwägen, ob sich der Mehrwert aus einer Taxonomie bzw. Ontologie wirklich für sie lohnt. Eine Alternative ist zum Beispiel öffentlich verfügbare Taxonomien zu verwenden, anstatt selbst eine Taxonomie zu erstellen. Will man zum Beispiel zu Beginn eines SOA Vorhabens die grundlegenden Begriffe wie Service und Serviceanbieter klären, sollte man das SOA Reference Model von OASIS als Ausgangspunkt wählen.

Neben Taxonomien gibt es noch die so genannten Folksonomien bzw. Tags. Dieser Ansatz lässt sich gut an der Foto Community Flickr erklären. Man werfe dazu einmal einen Blick auf folgendes Foto von mir. Das Bild zeigt einen Oldtimer Bus, der heute in Halle zur öffentlichen Nahverkehrsgesellschaft HAVAG gehört. Um dieses Bild genauer zu beschreiben, habe ich also die Tags (bzw. Stichworte) oldtimer, bus, havag und halle vergeben. Dies machen andere Nutzer von Flickr mit ihren Fotos ebenfalls und mit etwas Glück vergeben alle die gleichen Tags. Lässt man sich zum Beispiel alle Fotos mit dem Tag havag anzeigen, dann findet man sogar noch ein weiteres Bild von dem Bus von einem anderen Nutzer. Dies ist natürlich absolut faszinierend, da ich mich nicht mit den anderen Nutzer über die Nutzung von Tags abgesprochen habe. Das klappt natürlich nur deswegen, weil Flickr einfach so unendlich viele Nutzer hat, dass sich aus der Masse die richtigen Stichworte bilden. Unklar ist, wie viele Nutzer man braucht, damit so ein emergentes Verhalten auftritt.

Werden nun von verschiedenen Nutzern immer wieder die gleichen Tags bestimmten Bildern zugewiesen, entsteht natürlich auch eine Beziehung zwischen den Tags. So wird im Fall der Stadt Halle mit Sicherheit die Tags saale und halle häufig zusammen verwendet, da durch Halle die Saale fließt. Im Gegensatz zu einer Taxonomie ist diese Beziehung aber nicht explizit, sondern nur implizit, also indirekt, gegeben. Auch werden Folksonomien nicht von einer kleinen Expertengruppe erstellt, sondern sie entstehen durch eine große Nutzermasse. Dies ist auch der Grund, warum man vorsichtig sein muss, möchte man das Prinzip in Unternehmen nutzen. Selbst in einem großen Konzern gibt ist meist nur eine relativ kleine Zahl von Mitarbeitern, die aktiv an einer Systematik mitwirken. Diese geringe Nutzerzahl kann dazu führen, dass eben kein emergentes Verhalten entsteht und die Folksonomie nicht in Fahrt kommt. Dies mag auch ein Grund sein, warum Wikis in Unternehmen oftmals nicht erfolgreich sind. Es fehlt einfach die kritische Masse.

Im öffentlichen Bereich gibt es aber eben diese kritische Masse und es liegt natürlich nah, aus Folksonomien wie Flickr aber auch Wikipedia formalere Systematiken möglichst automatisch abzuleiten. Diese Idee ist nicht neu, denn schließlich wollte man schon mittels Natural Language Processing (NLP) Computer auf Basis vorhandener Texte lernen lassen. Wären Computer in der Lage durch das Lesen sehr vieler Texte eigenständig Systematiken zu erarbeiten, könnte man sich die mühsame manuelle Definition von Wissensbasen sparen.

Einen etwas anderen Ansatz geht man mit so genannten semantischen Wikis. Hier ist die Idee, gleich während der Erstellung einer Folksonomie auf semantische Beziehungen zu achten, damit man diese nicht hinterher mühsam hinzufügen muss. So wäre es auch bei Flickr denkbar, dass bestimmte sehr häufig verwendete Tags durch Experten formalisiert werden. Es ist somit die Kombination beider Ansätze. Ob dies erfolgreich sein wird, werden wir noch sehen. Momentan geistert dieser Ansatz auch unter dem unheimlich tollen Begriff Web 3.0 umher. Eine mögliche Umsetzung ist das Semantic Wiki.

Schreiben sie ein Kommentar