Permalink

1

HowTo: Volltextindexierung von Microsoft XPS Dateien in MOSS 2007

Für gewisse Anwendungen steht das Microsoft XPS Format in direkter Konkurrenz zum Adobe PDF Format. Leider hat der MOSS Server für das XPS Format wie auch für das PDF Format keine direkt Unterstützung für die Volltextsuche. Für das PDF Format haben wir schon eine Anleitung publiziert. Nun, da ich, in einem Selbsttest, für meine Arbeit nun XPS verwende, brauche ich natürlich eine Volltextindexierung von XPS Dateien innerhalb von MOSS.

1. Die entsprechenden IFilter für den MOSS Server sind im XPS Essentials von Microsoft enthalten. Diese müssen zuerst auf dem MOSS Server installiert werden.

2. Die File Extension „xps“ muss in MOSS 2007 zu den zu durchsuchenden Dateien hinzugefügt werden.
Zentral Administration / SharedServiceProvider / Sucheinstellungen auf Farmebene / Datei Typen –> „Neuer Datei Typ hinzufügen“. Hier wird nun „xps“ (ohne Punkt) eingetragen.

3. Ob zu überprüfen, ob das Dateiformat „XPS“ wirklich auf dem MOSS Server eingetragen wurde kann man in der Registry unter

[HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\OfficeServer\12.0\Search\Applications\
Gather\Portal_Content\Extensions\ExtensionList]

Den Schlüssel “xps” suchen. Ist der Wert „xps“ vorhanden, hat im Schritt 2 alles richtig funktioniert.

4. Im Gegensatz zum PDF IFilter werden beim XPS Essential Pack nicht alle Registry Einstellungen für MOSS vorgenommen. Zuerst müssen wir eine Instanz für den Filter erstellen. Dies passiert in der Registry des MOSS Servers unter:

[HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\12.0\Search\Setup\Filters\]

Dort erstellt man als erstes den Schlüssel „.xps“. Inklusive dem Punkt vor dem „xps“. Danach trägt man folgende Werte ein:
Default = (value not set)
Extension = xps
FileTypeBucket REG_DWORD = 0x00000001 (1)
MimeTypes = application/xps

5. Um den XPS-Filter gegenüber dem MOSS Server zu identifizieren müssen wir weitere Modifikationen an der Registry des MOSS Servers vornehmen. Unter dem Wert:

[HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\OfficeServer\12.0\Search\
Setup\ContentIndexCommon\Filters\Extension\]

tragen wir wiederum einen neuen Schlüssel namens „.xps“ ein. Der „Default“ Wert wird auf den CLSID des XPS IFilter gesetzt:

Default REG _SZ = {1E4CEC13-76BD-4ce2-8372-711CB6F10FD1}

6. Jetzt muss nur noch der MOSS 2007 Suchdienst neu gestartet werden.

net stop osearch
net start osearch

Im Gegensatz zum IFilter von Adobe ist beim XPS-Format das Piktogramm von XPS schon richtig gesetzt. Nach einem neuen Crawl findet der MOSS nun auch Texte innerhalb von XPS Dateien.

Autor: Christoph Müller

Christoph Müller ist Consultant, Blogger und Podcaster rund ums Thema SharePoint, Digital Transformation, Cloud, Mobile und Netzpolitik.

1 Kommentar

  1. Bei einem W2K8-Server und Search Server 2008 Express hat
    Default REG _SZ = {0B8732A6-AF74-498C-A251-9DC86B0538B0}
    funktioniert