Suchen und Finden mit SharePoint 2010

Der Wettbewerbsfaktor Wissen und Informationen finden, ist im Unternehmensumfeld mehr denn je gestiegen. Denn die Suche nach Informationen ist bei stetig wachsenden Daten- und Dokumentenmengen im Business eine tägliche Herausforderung. Nur wenn es Unternehmen gelingt, ihre Informationen schnell und kontextorientiert zur Verfügung zu stellen, können Mitarbeiter produktiv arbeiten. Daher ist das Thema Enterprise Search mit SharePoint 2010 für viele aktuell sehr interessant. Nicht nur, weil sich in SharePoint 2010 diesbezüglich jede Menge getan hat, sondern auch weil für SharePoint nun auch die FAST-Engine zur Verfügung steht.

SharePoint hilft den Benutzern die Inhalte, Informationen und Personen zu finden, die sie brauchen. Kombiniert mit einer integrierten, einfach verwaltbaren und anpassbaren Plattform. Auf der anderen Seite bietet SharePoint aber auch Möglichkeiten zur Produktivitätssteigerung, wie Enterprise Content Management, Social Computing, Automatisierung von Geschäftsprozessen und die Visualisierung von Geschäftsdaten.

SharePoint Search 2010 -
Die Neuerungen

Auch wenn die Suche bereits in der Version 2007 bereits sehr erfolgreich war, gab es trotzdem einige Punkte, die es in der neuen Version zu verbessern gab.

Beim Thema Skalierung waren die meisten Kunden zufrieden mit den Möglichkeiten, die MOSS 2007 ermöglicht hat, jedoch gab es hierbei auch einige Grenzfälle und Limitierungen. So war es in der Version 2007 nicht möglich mehr als 50 Mio. Elemente im Index vorzuhalten und auch bei der Suchabfrage, die pro Sekunde möglich waren, gab es Grenzen. Bei der Suche von SharePoint 2010 sind diese Grenzen kein Thema mehr, hier können Sie skalieren, wie Sie möchten.

Darüber hinaus wurde auch die User Expierence bei der Suche verbessert, so liefert SharePoint 2010 bessere Antworten in kürzerer Zeit. Dabei helfen vor allem Filter und vielfältige Navigatoren in der Suchergebnisliste.

Bereits in SharePoint 2007 war es möglich nach Personen und Expertisen zu suchen. Hier geht es jedoch nicht darum, wie in einem Adressbuch einfach nur den Namen eines Kollegen nachzuschlagen, sondern auch darum nach konkreten Expertisen zu suchen. Diese Möglichkeit ist vor allem dann nützlich, wenn man selbst gerade nicht weiß, welchen Kollegen man zu einem bestimmten Thema befragen kann.

In SharePoint 2010 steht die Suche auch im Zusammenhang mit sozialen Netzwerken und unterstützt beim Ausbauseines persönlichen Netzwerks weiter.

Bei der Suche steht  das Thema Relevanz natürlich immer mit an erster Stelle. Um die Relevanz in SharePoint 2010  weiter zu erhöhen, beeinflussen neben des Indexes, auch Metadaten wie Tags und Rating, aber auch eine verbesserte Sprachunterstützung die Suchergebnisse. Dazu kommen weitere Einflussfaktoren wie z.B. die Klickanzahl auf ein Suchergebnis (Dokumente, die andere Benutzer nach einer Suche auch angeklickt haben), die Phrasen-Übereinstimmung, Social Tags, Ähnlichkeiten in der URL (URL Fuzzy Matching) und extrahierte Metadaten.

Suchlösungen für jeden Anspruch

Im Wesentlichen gibt es drei unterschiedliche Suchlösungen:

image

Als Einstiegslösung gibt es auch in der Version 2010 immer noch den Search Server Express als kostenlose Variante, die auch die Basissuche vom SharePoint Server darstellt. Der SharePoint Server enthält dagegen die vollständige Intranetsuche mit allen verfügbaren Features, wie z.B. die Personensuche. Der FAST Search Server 2010 für SharePoint stellt dazu eine Ergänzung bereit. Mit dieser Lösung erhält man eine High-End-Suche für große suchbasierte Infrastrukturen.

Alle drei Produkte stammen aus der gleichen Familie und basieren mittlerweile auch auf der gleichen Plattform und Benutzerschnittstelle. Somit macht es für den Benutzer keinen Unterschied mit welcher Suchlösung er arbeitet, Entwickler stehen einheitliche APIs und Entwicklermethoden zur Verfügung und auch Administration und Deployment sind gleich bzw. ähnlich.

Das sogeannte  “Search Center”-Template steht bei allen drei Suchlösungen zur Verfügung und beinhaltet die bereits bekannten und bewährten, aber nun in 2010 auch verbesserten Konzepte, wie die Scopes, Webparts, Best Bets und die erweiterte Suche. Zudem ist auch die föderierte Suche mit integriert, die es ermöglicht auch externe Quellen (z.B. Bing-Internetsuche), die über das Open Search-Format erreichbar sind, mit einzubinden.

image
SharePoint 2010 Such-Eingabefeld

User Expierence

Vor allem für den Endbenutzer wird in der neuen SharePoint-Suche einiges geboten. So kann er beispielsweise seine Suchergebnisse nachträglich mit neuen Metadaten-Filtern verfeinern, wie z.B. nach dem Erstelldatum, einem bestimmten Dokumententyp oder auch nach den Autoren.

image
Ungefilterte Suchergebnisliste mit Metadatenfilter (linke Seite)

image
Suchergebnisliste gefiltert nach Dateityp “PowerPoint”

Aber auch verbesserte Such- und “Meinten Sie” -Vorschläge, dazu verwandte Suchbegriffe sowie ein “View in Browser”-Link zur Voransicht eines Dokuments in der Ergebnisliste, sorgen für ein neues Sucherlebnis.

Benutzer erhalten in der neuen Suche auch Ergebnisse für zusammengesetzte Begriffe. Sucht man also nach Schlagwörtern wie “Innovation” und “Management”, erhält man auch Ergebnisse zu “Innovationsmanagement”.

FAST ermöglicht darüber hinaus auch noch eine bessere Erkennung von Sprache. So bekommen bspw. deutschsprachige Benutzer auch eher deutschsprachige Dokumente und englischsprachige Benutzer eher Dokumente auf Englisch im Suchergebnis angezeigt.

Insgesamt wurde die komplette Abfragesyntax verbessert. Features wie Boolesche Operatoren (AND/OR) für die Freitext- oder Metadatenfelder, Prefix-Matching (z.B. Author Bill*, Micro*) oder Operatoren für die Eigenschaftseinschränkung (=,<,>,>=,<=) waren zwar auch schon in der alten Such-Engine vorhanden, jedoch wurden sie erst mit der Oberfläche von 2010 auch tatsächlich zugänglich gemacht.

Suche ist sozial

Themen wie “Social Computing” und “Social Networking” sind aktuell in aller Munde und leben praktisch von der Suche nach Personen. Daher spielt die Personensuche eine sehr wichtige Rolle: Sie ebnet praktisch gesehen den Weg zum sozialen Netzwerk. Über die Personensuche kann nach Expertisen und Interessen gesucht werden. Gerade wenn ein neues Projekt ansteht und das Projektteam zusammengestellt wird, können mit Hilfe der Suche auch die passenden Mitarbeiter gefunden werden. Natürlich ist auch hier das Engagement der Nutzer gefragt. Nur wenn die Mitarbeiter dazu bereit sind, Informationen über sich preis zu geben, wird das Konzept funktionieren. Dass dies gut funktionieren kann, beweisen  jedoch zahlreiche Social Networks und Communities im Internet.

image
Suchergebnisliste im Adressbuch-Format nach Personensuche nach Expertise “Sales”

In die Ergebnisse fließen auch phonetische Namens- und Kurzform-Übereinstimmungen mit ein (in der aktuellen Beta leider nur für Englisch verfügbar). Die Ergebnisse selbst werden in einer Art Adressbuch-Ansicht angezeigt.

Die Relevanzmodelle sind in SharePoint 2010 spezifisch auf die Personensuche angepasst, dies war in SharePoint 2007 noch nicht der Fall. Dabei spielt z.B. auch das Suchverhalten der Benutzer eine entscheidende Rolle. So beeinflusst die bereits angesprochene Klickrate das Relevanzranking der Suchergebnisse. Wenn viele Benutzer ein Dokument in ihrer Suchergebnisliste besonders häufig anklicken, dann wird dieses auch anderen Nutzern mit einer höheren Relevanz in den Suchergebnissen angeboten.
Um die Relevanz des eigenen Profils (MySite) zu verbessern, kann man in SharePoint 2010 einfach nach sich selbst suchen und erhält dann Informationen darüber, wie oft man im letzten Monat gesucht wurde und wie man seine eigene Suchrelevanz erhöhen kann.

image
Erhöhung der Suchergebnisrelevanz des eigenen Profils

Darüber hinaus werden den Benutzern schon bei der Eingabe der ersten Buchstaben in das Suchtextfeld Suchvorschläge angegeben, die aus den Such-Logs generiert werden.

FAST Suche für SharePoint

Im Vergleich zu SharePoint bringt FAST noch einige Zusatzfeatures mit. Dazu gehören vor allem bei der Suchergebnisverfeinerung, die Einbeziehung von Navigatoren mit der Anzeige der exakten Anzahl der vorhandenen Dokumente, extrahierte Metadaten, Thumbnails, die Vorschau der Ergebnisse, die Anzeige von ähnlichen Dokumenten im Suchkontext und die Möglichkeit nach verschiedenen Eigenschaften die Suchergebnisliste neu zu sortieren. Alle diese Features ersparen dem Benutzer zusätzlich viel Zeit bei der Filterung der Suchergebnisliste.

image 
FAST-Suchergebnisliste mit Thumbnails der Dokumente

image
FAST-Suchergebnisliste mit Dokumenten-Vorschau

Die Anzeige von relevanten und artverwandten Suchbegriffen, helfen dem Benutzer auch schneller das zu finden, was er sucht.

Zudem ist es bei der FAST-Suche möglich die Relevanz der Suchergebnisse entsprechend des Benutzerkontextes anzupassen und entsprechend zu konfigurieren. Denn die Ergebnisse, die für den einen Benutzer aus dem Technischen Vertrieb interessant sind, müssen nicht zwingend auch für den Mitarbeiter aus dem Marketing interessant sein, trotzdem sie nach dem gleichen Begriff gesucht haben. Mithilfe der FAST-Engine können die Suchergebnisliste, aber auch die Anzeige der Visual Best Bets entsprechend des Benutzerkontextes getrimmt werden.

Des Weiteren bringt FAST eine exzellente Sprachunterstützung mit. FAST unterstützt rund 84 verschiedene Sprachen, das heißt es kann in nahezu jeder menschlichen Sprache gesucht werden.
Lemmatisierungen ermöglichen es auch Steigerungsformen eines Wortes zu finden, so ist bspw. möglich nach Begriffen zu suchen, die vom Wortstamm her nicht den gleichen Klang haben, jedoch trotzdem inhaltlich miteinander etwas zu tun haben. So schließt “besser” auch “gut” mit ein.
Dass die Phrasensuche in FAST auch Stopwörter (ein Auto mit Automatik) mit beinhaltet ist eine Besonderheit der FAST-Engine. In der Regel werden Stopwörter wie “und” und “ein” bei der Suche ignoriert  und der Benutzer würde nur Suchergebnisse erhalten, die die Begriffe “Auto” und “Automatik” beinhalten. Dies ist jedoch häufig nicht das, was man diesem Moment erreichen möchte.
Darüber hinaus werden bei FAST auch nur Substantive und Adjektive expandiert (Pluralbildung und Ableitungen) und werden nicht auf Verben übertragen. Denn das “Buch” hat wenig mit “buchen” oder “gebucht” zu tun. Das Verb “buchen” hat hier mit dem gleichen Wortstamm eine völlig andere Bedeutung als das Substantiv “Buch”. Somit bietet FAST hierbei eine höhere Genauigkeit.

Neuigkeiten für IT Pros

Die neue SharePoint Suche 2010 ist vor allem in Richtung Skalierungsmöglichkeiten und Performance erwachsen geworden und alte Bottlenecks wurden entfernt. So ist es in der neuen Version möglich, mehrere Indexserver innerhalb einer Farm zu installieren, was durch mehrere voneinander unabhängig arbeitende Crawler realisiert wird. Zudem muss auch der Index selbst, nicht mehr eine große Datei sein, sondern kann in mehrere kleine Dateien partitioniert werden, die miteinander zusammenarbeiten. Somit heben sich die Skalierungsgrenzen diesbezüglich auch auf. Nachwievor können die Indizes für eine Hochverfügbarkeit gespiegelt und auf mehrere Query-Server platziert werden. Neu ist jedoch, dass ab 2010 ein Query-Server nicht mehr den gesamten Index enthalten muss, sondern dass der Index in Partitionen verteilt auf mehreren Query-Servern vorliegen kann und auch die einzelnen Partitionen gespiegelt werden können. Hierfür kann nun auch direkt SQL-Mirroring genutzt werden, welches in 2007 nur auf Umwegen nutzbar war.

Ziel für die Skalierung, ist die Antwortzeit einer Suchanfrage von weniger als 1s bei einer Dokumentenmenge von 100Mio. Dokumenten zu erreichen. Das ist auch die empfohlene Skalierungsgrenze für die SharePoint Suche 2010. Bei größeren Dokumentenmengen empfiehlt sich der Einsatz der FAST Suche für SharePoint. Diese behält auch in der Spezialversion für SharePoint  die ursprüngliche Architektur und kann somit auch hier die gewohnt extreme Performance und Skalierbarkeit erreichen.

Auch in SharePoint 2010 können, wie schon beim Search Server 2008 und SharePoint 2007, externe Datenquellen leicht integriert werden. Auf der einen Seite können externe Suchquellen über die OpenSearch-Federation eingebunden werden, wie z.B. Bing, Wikipedia und Linkedin und auf der anderen Seite können externe Systeme mit SharePoint-Mitteln über Indexing Connectoren mit indiziert werden. Letztes gilt vor allem für Fileserver, Datenbanken, CRM/ERP-Systeme, Archivsysteme uvm. .

Weitere Verbesserungen liegen in dem Crawl-Prozess selbst. Wie z.B. einen eingebauten Load Balancer für die Verteilung der Quell-Hosts auf die verschiedenen Crawl-Datenbanken,  die Unterstützung von regulären Ausdrücken in Crawl Rules, die Unterstützung von case-sensitiven Inhaltsquellen sowie die Priorisierung von Inhaltsquellen und die Verteilung von Crawl-Ressourcen. Such-Backups können mit einer geringeren Downtime realisiert werden.

FAST-Integration in SharePoint 2010

Die Frage, die häufig gestellt wird, ist wie sich die FAST-Suche in SharePoint integriert.
Hat man kein FAST installiert, so greifen die Endbenutzer bei der Inhalts- und Personensuche auf die SharePoint-Engine zu, welche au die Inhalte und Profile indiziert.

image

Wird jedoch die FAST-Suche für SharePoint installiert und aktiviert, so wird die Inhaltssuche von FAST-Engine übernommen, die Personensucher erfolgt aber weiterhin über SharePoint. Der Endbenutzer erkennt dies selbst nicht, da die Oberfläche die gleiche bleibt, nur die verfügbaren Features werden entsprechend erweitert. Beide Engine nutzen auch die gleichen APIs und Konrektoren, so dass man hier weiterhin von einer Plattform sprechen kann.

image

Für eine optimierte Suche, stehen in der Central Admin zwei Arten von Reports zur Verfügung: In den Administration-Reports finden Sie Informationen darüber, wie der Zustand Ihrer Infrastruktur aussieht und in den Webanalytics-Reports erhalten Sie eine Aussage, wie die Suche benutzt wird.

image  Adminstration-Reports in der Central Admin

Einer der wichtigsten Reports bezüglich der Suche ist der Query-Latency-Report, der Auskunft über die Abfragezeit der Suchanfragen gibt.

image  Query-Latency-Report

Zudem sagt Ihnen der Top-Query-Report, welche Anfragen am häufigsten von den Benutzern gestellt werden:

image  Top-Query-Report

SharePoint vs. FAST

SharePoint 2010

FAST Search Server 2010 für SharePoint

Search Center-Template

  • Zugriff über Browser, Telefon und PC
  • ausgezeichnete Relevanz der Suchergebnisse ohne Anpassung
  • Such-Föderation

Wie SharePoint, plus:

  • umfangreichere Sprach-unterstützung

  • umfassendere Abfragesyntax

Verfeinerung der Suchergebnisse

  • Metadaten-Filter

  • verwandte Suche

  • Vorschau im Browser durch Office-Webapplications

Wie SharePoint, plus:

  • exakte Anzeige der Anzahl der Dokumente

  • Ähnliche Dokumente

  • Sortierung der Ergebnisse nach beliebigen Eigenschaften

  • Metadaten-Extraktion

Soziale Suche

  • phonetische Namens-und Kurzform-übereinstimmungen

  • Beeinflussung der Relevanz durch Ranking und durch Klickrate

  • Suchvorschläge

Wie SharePoint

Visuelle Hinweise

  • Thumbnails

  • Vorschau der Dokumente in der Ergebnislsite

  • Visual Best Bets

Berücksichtigung des Benutzer-kontextes

  • Beeinflussung der Suchergebnisse entsprechend des Benutzerprofils

Skalierung und Performance
  • Skalierung bis 100Mio. Dokumente
  • hohe Fehlertoleranz
  • Installation native 64 Bit oder virtualisiert mit Hyper-V

Wie SharePoint

  • jedoch wesentlich höhere Skalierung
Integration
  • zahlreiche Konnektoren werden mitgeliefert
  • neue Inhaltsquellen über BCS
  • Integration der Suche mit Kollaborations- BI- Workflow und Social Networking Features von SharePoint

Wie SharePoint

  • Integration mit High-End Features

Weiterführende Informationen:

TechNet - Enterprise Search TechCenter

Posted by. Cornelia Steinke