header
Suchwörter: "oder" "und" Ausgabe 04/2006


Autor:
Hanspeter Stocker
Dipl.-Ing. HTL in Maschinenbau,
Geschäftsführer der E:ssence kowledge sourcing GmbH

E:ssence vernetzt Informationen aus Internet, Fach- und Patentdatenbanken zu handlungs- und aktionsfähigem Wissen entlang der Wertschöpfungskette eines Unternehmens. Das interdisziplinäre Team deckt die Kompetenzen der Gebiete Maschinenbau, Werkstoffe, Automobilindustrie, Luft- und Raumfahrt, Corporate Governance sowie den ICT-Sektor ab.
www.use-essence.com
Informationssuche im Internet - Bewertung der Resultate - Teil 2 Informationssuche im Internet

Internet-Anwender werden mit einer Fülle von Informationen konfrontiert. Da stellt sich sofort die Frage: Nach welchen Kriterien bewertet man?

Bevor wir uns an die Kriterien machen, noch einige Fakten im Voraus:

  • 68% glauben, Suchmaschinen liefern zuverlässige, unparteiische Informationen1
  • User schätzen die Glaubwürdigkeit der Informationen auf dem Web als hoch ein2

Wobei anzufügen ist, dass diese Zahlen aus einer US-Untersuchung stammen. Nichts desto trotz wollen wir mal die Unterschiede Informationspool Internet versus herkömmliche Quellen auflisten:

Umfang: in bisher nie gekanntem Umfang, zentral nutzbar
Differenzierung: die Daten sind undifferenziert, keine Trennung in Bereiche, Kategorien, Klassifikationen
Grenzen: keine zensurbedingten, nationalen Grenzen (ausser China)
Publikationsprozess: schnell, einfach, direkt, einzig der Autor ist verantwortlich
Qualitätssicherung: weder Richtlinien noch Konventionen hinsichtlich der Veröffentlichungswürdigkeit von Dokumenten sind vorhanden

Bei so viel publizistischer Freiheit tut man gut, das Gesuchte einer kurzen Prüfung zu unterziehen.

Wie bewertet man nun ein gefundenes Dokument oder Seite?

Diese 6 Fragen ergeben einen guten Qualitätscheck:

  • Was ist der Zweck der Veröffentlichung? >> Zielgruppe erkennbar
  • Was ist über die Quelle bekannt? >> Autor, Körperschaft, URL (edu, gov, org, ….)
    Beispiel: Die Endung edu steht für „education“ und dahinter eine Bildungsinstitution mit Publikationsrichtlinien
  • Was lässt sich über den Inhalt sagen? >> Tiefe, Breite, Objektivität, Zitate, last update
  • Welche Referenzen gibt es? >> Outbound:Links zu anderen Arbeiten, Inbound: Links, die auf die Seite führen (Befehl für Google: link:www.Muster-Befehl.edu)
  • Was lässt sich über den Stil und die Sprache sagen? >> Wortwahl, Orthographie
  • Wie ist die Funktionalität der Seite? >> Navigation, Struktur

Halten die „Top-10 Resultate“ von Google dem Qualitätscheck auch Stand?

Unter der Voraussetzung einer systematischen Suche liefert die Google-Rangliste bemerkenswerte Resultate. Systematisch sind Sie dann unterwegs, wenn Sie Ihr Wunschdokument vor der Suche ansatzweise formuliert haben. Bewährt hat sich auch, die Grundeinstellung der Ergebnisanzeige einer Suchmaschine auf 30 oder mehr zu erhöhen. Damit geben Sie auch Seiten eine Chance, die nicht einer intensiven oder gar teuren SEO (Search Engine Optimisation) unterworfen wurden.

Was sagen die Fakten?1

  • 96% der User sind überzeugt von ihren Suchfähigkeiten, 62% sogar sehr überzeugt1
  • 87% haben gute Erfahrungen mit Suchmaschinen, 17% sagen sogar, sie finden immer, was sie suchen1

Nun gut, keiner gibt gerne zu, das dieser grösste Wissensspeicher einen manchmal verzweifelt suchen lässt. Oder aber man beginnt schleichend die „Top-10 Resultate“ zu akzeptieren, um der aufkommenden Verzweiflung vorzeitig auszuweichen. Anders lassen sich diese Fakten nicht erklären. Warum? Die EIN bis ZWEI Wortsuche ist Alltag, und der Inhalt eines Dokuments oder einer Seite lässt sich kaum auf zwei Worte reduzieren.

Ein Ausblick in die Zukunft: Clustering und semantische Technologien

Suchmaschinen zweiter Generation (z.B. Google,Yahoo etc.) sind heute technisch fast ausgereizt. Die Präzision der Ausbeute kann nur noch auf der Benutzerseite durch langlebiges Konzeptwissen und systematisches Vorgehen optimiert werden.

Eine Suchmaschine dritter Generation nennt sich LEXXE
Durch einen NLP-Ansatz (Natural-Language-Processing) und anschliessendem Clustering („Wissensnester“) bietet sie mögliche Antworten auf Ihre Anfragen. Mit einer W-Frage (z.B. why is the sky blue?) wechselt sie in den NLP-Modus, ansonsten bleibt sie im Modus der zweiten Generation (Ranglisten-Konzept). Probieren Sie es selbst, Sie werden sehr schnell den Generationenunterschied erkennen: http://www.lexxe.com/

Die vierte Generation wird in Richtung Semantik gehen. Semantik ist die Lehre der inhaltlichen Bedeutung einer Sprache. Die semantische Suche findet Synonyme und Worte, die zur gleichen Familie gehören. Durch weiterführende Verknüpfungen von Begriffen untereinander, könnte sehr viel mehr Wissen miteinander verbunden und damit wiederverwendet werden. Das bedingt aber die inhaltliche Beschreibung (semantische Anreicherung) von Datenbeständen. Ob für den Endnutzer damit die Datenflut sinkt und die Präzision steigt, ist zu bezweifeln. Wer bereits mit semantischer Technologie - beispielsweise in Knowledge-Mining Tools - arbeitet, weiss aus Erfahrung, dass dies einen sehr systematischen Prozess voraussetzt.

1. Teil: "Kann das Internet einen Beitrag zur Kompetenzentwicklung am Arbeitsplatz liefern?" - Der erste Teil befasst sich mit der Funktionsweise einer Suchmaschine und hilft dadurch die Suchkompetenzen zu steigern. (Augsut 06)

Ein passendes Buch mit praktischen Übungen zum Thema "Internetsuche" >>Buchtipp

---
1)Fallows, D.: Search Engine Users (2005)

2) Marilyn Domas White, Mirja Iivonen: Information Processing and Management (2001)

HINWEIS: Der oben stehende Inhalt wird vom Autor zur Verfügung gestellt. Dieser Artikel basiert auf der Meinung und Darstellung des Autors und spiegelt nicht grundsätzlich die Meinung des Seitenbetreibers Firma Goldwyn Partners Group AG wieder. Für Zusatzinformationen zum Artikel wenden Sie sich bitte direkt an den Autor.

>>diesen Artikel weiterempfehlen      >>diese Seite drucken      >>nach oben