|
Eine einfache, kurze Antwort ist ja, wenn nicht diese Unübersichtlichkeit wäre. Im Internet sind zahllose Materialien wie Projektberichte, Reviews, Patente, Kongressveröffentlichungen, Chatprotokolle, Lessons-Learned Dokumente etc. aufzufinden, die im Grunde bestens zur Kompetenzentwicklung geeignet sind. Diese Materialien enthalten Daten und Informationen, die für Personen und Unternehmen in der täglichen Arbeit höchst relevant sind.
Auf den zeitlichen Ablauf wissenschaftlicher Information übertragen, heisst das:
Erste Ideen und Forschungsanträge eines Projektes sind meist in Form eines Reports im Internet veröffentlicht. Danach folgen formalere Informationsmittel wie Patente, Kongressveröffentlichungen oder Zeitschriftenartikel, die die konkreten Ergebnisse des Projektes vorstellen. Erst weit nach Ende eines Forschungsprojektes tauchen die Ergebnisse dann vielleicht in Nachschlagewerken oder Lehrbüchern auf.
Publizieren ist leicht gemacht, lokalisieren braucht Kompetenz
Der Umfang an Publikationen wächst rasant, denn publizieren ist heute viel einfacher geworden als lokalisieren, beurteilen und nutzen von Informationen. Jeder weiss das aus eigener Praxis. Wie kann man sich nun das Finden des richtigen Materials zur richtigen Zeit erleichtern?
Die Antwort ist Informationskompetenz. Sie kann kontinuierlich aufgebaut werden und wird in naher Zukunft zu den „soft skills“ zählen, ähnlich einer Sozialkompetenz. Beginnen wir also mit einem ersten Schritt in Richtung einer vertieften Informationskompetenz. Im zweiten Teil des Artikels fragen wir uns, in welche Richtung die Suchmaschinen sich entwickeln. Ganz im Sinne „how to use the system“ und das kann nur jemand mit Konzeptwissen.
Eine trickreiche Frage zu Beginn:
Was liefern Suchmaschinen auf die Anfrage eines Benutzers?
Dokumente, die MÖGLICHERWEISE eine Antwort auf die ursprüngliche Frage enthalten oder EINE Antwort auf die urprüngliche Frage?
Die letztere Antwort zeigt die Funktionsweise von heutigen Suchmaschinen auf. Was Sie in das kleine Rechteck der Suchmaschine tippen ist nichts anderes, als eine ultraverkürzte Form Ihres gewünschten Dokuments.

Was macht die Suchmaschine mit Ihrer Anfrage?
Sie indexiert Ihre Anfrage mit den gleichen Kriterien, wie sie den Inhalt aus dem WWW erfasst:
- Wortextraktion, das heisst Interpunktionszeichen „wie“, ?, : usw. werden entfernt
- Stoppwortelimination, also Begriffe wie: und, die, das, auf werden entfernt
- Wortzerlegung heisst, dass "Wohnhaus" in „wohn“ und „haus“ zerlegt wird
- Wortnormalisierung heisst, dass aus „Häusern“ die Normalform „haus“ wird.
Eine Anfrage wie: „Wann gelang die erste Mondlandung?“ sieht dann nach der Indexierung so aus: geling erst mond land oder unser obiges Beispiel: krebs kaempf gift
Dieselbe Indexierung passiert mit Dokumenten, die der Spider der Suchmaschine kontinuierlich zuführt. Das war ja bereits oben erwähnt.

Anschliessend werden im indexierten Dokument die Wörter einzeln erfasst, gezählt und deren Positionen im Dokument bestimmt. Diese Daten inkl. der URL werden nun in eine Datenbank gespiesen. Diese Datenbank nennt sich Index einer Suchmaschine und ist vergleichbar mit einem Sachwortverzeichnis eines dicken Fachbuches. Der Unterschied ist, dass ein indexiertes Wort in Millionen von URLs und damit Dokumenten vorkommt.
So sieht ein Index einer Suchmaschine technisch aus:
| Term |
|
|
|
| Krebs |
www.krebse.ch |
www.naturkost.ch |
URL |
| |
2 |
1 |
Häufigkeit |
| |
3, 11 |
36 |
Position |
| Fisch |
1 |
4 |
|
oder in visualisierter Form mit IT-Begriffen:

Was verbindet Ihre Anfrage mit dem Index der Suchmaschine?
Die Suchmaschine vergleicht eine Anfrage mit ihrem vorhandenen Index. Der Vergleich erfolgt mit sogenannten Relevanzkriterien, wie beispielsweise:
- „Wie häufig kommt der Term krebs im Dokumententext vor?“
- oder „steht der Term krebs am Anfang des Textes häufiger?“.
Aus diesen Relevanzkriterien - insgesamt sind das sechs Stück - entsteht dann die Rangliste der Wichtigkeit von Dokumenten, die dem Besucher mit seiner Anfrage präsentiert wird.
Für den Anfrager heisst das, je allgemeiner eine Anfrage gehalten wird, desto grösser ist die
Unübersichtlichkeit, desto geringer die Chance, Berichte und Dokumente zu finden für eine Kompetenzentwicklung.
Tipps in Richtung einer qualitativen Suche:
Ihre Anfrage sollte eine stark verkürzte Form des gewünschten, zu lesenden Textes sein!
Was genau will ich wissen und somit im Text lesen? Oft reichen 8-10 Stichwörter aus, um ein Thema zu beschreiben. Daraus leiten Sie dann die Wortwahl Ihrer Anfrage ab.
Eine Hilfestellung bietet die Erlanger Liste: http://www.erlangerliste.de/ressourc/lex.html
Webseiten mit wissenschaftlichen Informationen werden häufig bei Suchmaschinen und Suchsystemen nicht angemeldet. Linklisten von Fachexperten erschliessen dennoch diese Daten. Ein Weg zu wissenschaftlichen Linklisten führt über die entsprechenden Fakultäten der Universitäten.
Eine Hilfestellung bietet Switch: http://www.switch.ch/de/edu/educ_orgs.html
Erstellen Sie sich eine einfache Suchprotokoll-Vorlage aufgeteilt in Thema, Begriffe, Anfrage, Treffer und Resultate. In die Spalte Resultate kopieren Sie sich die relevanten URLs, um sie später auszuwerten. Diese Vorgehensart hat einige Vorteile:
- Ihre Suche wird reproduzierbar und iterativ
- Das Lokalisieren und Auswerten wird getrennt und damit übersichtlich
Beispiel einer „Suchprotokoll“-Vorlage:
| Thema |
Begriffe |
Anfrage bei Google |
Treffer |
Resultate (URL's) |
| Mobiltechnologie Mobiltechnologien |
Multiplex, GSM Raum,Zeit, Frequenz |
1. Mobiltechnologie OR Mobiltechnologien |
512'000 |
|
  |
2. Multiplex GSM
3. - shop |
35
7 |
www.rn.inf.tu-
dresden.de/scripts
www.kbst.bund.de |
Ausbeute versus Präzision: Boolische Operatoren
Grundsätzlich sollte man immer mit dem Operator OR die Recherche beginnen. Damit erreicht man die maximale Ausbeute (Anzahl Treffer). Anschliessend folgt die Präzision mit den Operatoren AND und NOT.
| Operator |
Funktion |
Google-Eingabe |
| OR |
Bei der OR-Verknüpfung werden alle Dokumente geliefert, die mindestens einen der verknüpften Begriffe beinhalten.
Ergibt die höchste Ausbeute = Anzahl Treffer |
Raum OR Zeit |
| AND |
Mit AND verknüpfte Begriffe einer Suchanfrage liefern nur diejenigen Dokumente, in denen alle verknüpften Begriffe vorkommen.
Ist präzisionsorientiert
AND ist Default Modus bei Google |
Multiplex GSM |
| NOT |
Mit NOT können Begriffe ausgeschlossen werden, das heisst Dokumente mit den NOT verknüpften Begriffen werden nicht angezeigt.
Vorsicht bei der Anwendung! |
- glossar - shop |
Beispiel für eine Ausbeute versus Präzision

Erweiterte Suchfunktionen
Der Seitentitel ist meistens der aussagekräftigste Teil einer Internetseite. Der Ersteller wird dort, gleich wie in einer Überschrift, den Inhalt der Seite mit kurzen und prägnanten Worten zusammenfassen. Eine Suche, die sich also nur auf die Seitentitel beschränkt, ist gerade dann sinnvoll, wenn die Anzahl der Treffer sehr hoch ist. Dadurch können Sie die relevanten Seiten leichter von den unwesentlichen trennen.
allintitle: swissair (corti OR honegger)
fahrzeug design intitle: maybach
Ähnlich wie die Einschränkung durch „allintitle:“ oder „intitle:“ funktioniert auch die Suchverfeinerung durch „allinurl:“ oder „inurl:“. Auch der „user related link“ (URL), also die Internetadresse einer Seite, wird von den Suchmaschinen zur Indexerstellung herangezogen. Oftmals sind diese Internetadressen schon sehr aussagekräftig und beinhalten den Zweck einer Seite. Es kann sich dabei direkt um den Domain-Namen handeln, also z.B.
allinurl: oracle
organisation inurl: ibm
Weitere hilfreiche Suchbefehle für die Präzision

Was macht Google so erfolgreich?
Die Stanford-Arbeit von Brin und Page zeigt die wesentlichen Erfolgs-Faktoren auf und ist noch heute eine interessante und empfehlenswerte Lektüre:
- Mehr als zwei Suchbegriffe werden automatisch mit „AND“ verknüpft
- Die Wortnormalisierung ist minimal
- Google speichert jede vollständig indizierte Seite auf eigenen Servern und bietet so die Möglichkeit, die indizierte Information zu sehen > Cache Funktion
- Der auf den Namen "Pagerank" getaufte Algorithmus
(die Formel ist ebenfalls im Dokument ersichtlich)
Mit diesem präzisionsorientierten Ansatz erfüllt Google den Anspruch: Wir liefern „eine Antwort auf die ursprüngliche Frage“ am erfolgreichsten.
Die Ausbeute bleibt aber bei einer einfachen Suche auf der Strecke.
Ausblick mit Kompetenz
Im kommenden Artikel anfangs Oktober werden wir uns mit dem Bewerten von gefundenen Internet-Dokumenten befassen. Halten die „Top-10 Resultate“ von Google dem Qualitätscheck auch Stand? NLP, Clustering und semantische Technologie sind weitere Stichworte. Sie werden uns dem zukünftigen Anspruch: „Dokumente, die möglicherweise eine Antwort auf die ursprüngliche Frage enthalten“ ein Stück näher bringen.
HINWEIS: Der oben stehende Inhalt wird vom Autor zur Verfügung gestellt. Dieser Artikel basiert auf der Meinung und Darstellung des Autors und spiegelt nicht grundsätzlich die Meinung des Seitenbetreibers Firma Goldwyn Partners Group AG wieder. Für Zusatzinformationen zum Artikel wenden Sie sich bitte direkt an den Autor.
|