Solr – der Sonnenschein unter den Suchen

Die TYPO3-eigene Suche „Indexed Search“ ist für mittelgroße Webseiten ohne Fokus auf der Suche sicher eine gute Lösung. Doch für umfangreichere und mehrsprachige Webseiten steigen in der Regel auch die Ansprüche an die Suchfunktion. Schließlich wird bei solchen Webseiten auch das Angebot für den Webseiten-Nutzer größer. So gibt es nicht nur Informationen in Text und Bild, sondern ggf. auch einen Bereich mit verschiedensten Downloads oder einem umfangreichen News- und Events-Bereich. Um solch ganz unterschiedliche Inhalte in einer nutzerfreundlichen Suche anzubieten, erreicht man mit der „Indexed Search“ einige Grenzen. So ist diese Suche z.B. ab einer größeren Menge an Seiten und Inhalten nicht mehr performant. Damit geht für den Webseiten-Nutzer ein großes Stück „Sucherlebnis“ verloren.

Apache Solr

An dieser Stelle brauchen wir eine starke und performante Suche als Alternative: Apache Solr. Solr ist ein Open Source-Suchserver von Apache. Wie der Name schon sagt benötigt die Solr-Suche einen eigenen Server, mit welchem die Inhalte der Webseite indexiert und durchsucht werden. Als Indexierung wird die Aufnahme der Webseiten-Inhalte in den Such-Index bezeichnet. Dieser Such-Index wird bei einer Suchanfrage nach dem Suchwort durchsucht. Durch die Auslagerung in einen eigenen Server wird der Webserver der Webseite nicht belastet, somit bleibt die Performance der Webseite erhalten. Zudem hat dies den Vorteil, dass der Suchserver je nach Anforderungen nach oben skaliert werden kann. Solr läuft somit eigenständig und unabhängig vom verwendeten Content Management System der Webseite.

Solr-Suche

Beispiel von Solr-Suchergebnissen mit Kategorisierung

Die Solr-Suche bringt ein großes Paket an Funktionen mit und zeichnet sich besonders durch schnelle Antwortzeiten von Suchanfragen aus. So bietet die Suche neben der Volltext-Suche u.A. das Sortieren der Suchergebnisse nach Relevanz, die Kategorisierung (sog. Facetten) von Suchergebnissen nach Inhaltstyp (z.B. Seiten, News, Downloads, Produkte, Events), eine Autovervollständigung und das Highlighting des Suchworts. Daneben ist es auch möglich, die Inhalte von z.B. PDF’s und Word-Dateien zu indexieren. Ein Beispiel ist in der obigen Darstellung zu sehen. Es zeigt Suchergebnisse, die mittels Kategorien in Seiten, News, Dokumente und Veranstaltungen aufgeteilt sind.

Für mehrsprachige Webseiten kann im Solr-Server pro Sprache ein eigener sogenannter „Kern“ angelegt werden. Das heißt, dass die Inhalte schon bei der Indexierung nach Sprache in die einzelnen Kerne sortiert werden. Durch die Kerne wird gesteuert, dass ein z.B. französischer Nutzer auch tatsächlich nur im französischen Kern, also den französischen Inhalten, sucht. Das klingt ersteinmal unwichtig, wenn man aber bedenkt, dass ein Download mit dem gleichen Namen in allen Sprachen zur Verfügung steht, sollte der französische Nutzer nur den französischen Download bei der Suche angeboten bekommen, und nicht noch die, der 5 anderen Sprachversionen. 

Solr & TYPO3

Der Solr-Server läuft komplett eigenständig und getrennt von TYPO3. Daher ist die Integration der Solr-Suche in TYPO3 aufwendiger als die Nutzung der TYPO3-eigenen Suche „Indexed Search“. Mittels zweier Premium-Extensions kann die Kommunikation zwischen dem Solr-Server und der TYPO3-Webseite integriert werden. Dabei stellt eine Extension die Indexierung der Webseiten-Inhalte und die Funktionen der Solr-Suche zur Verfügung. Die andere Extension indexiert bei Bedarf mittels „Apache Tika“ die Inhalte von Dateien wie PDF’s und Textdateien.

Mittels einer umfangreichen Konfiguration muss die Indexierung und die Ergebnisausgabe gesteuert werden. Gerade bei einer Kategorisierung der Suchergebnisse (z.B. nach Seiten, News, Downloads) muss die Konfiguration um die Kategorien und deren Definition umfangreich erweitert werden. Durch diese mächtige Konfiguration wird ermöglicht alle Solr-Funktionen auch im TYPO3 nutzen zu können. Somit kann die Indexierung und gerade die Ergebnisausgabe flexibel und individuell gesteuert werden.

Sie wünschen eine Beratung oder benötigen Hilfe bei Ihrer Such-Funktion? Kontaktieren Sie uns.

 

Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.