Permalink

2

HowTo: Volltextindexierung von Acrobat V.8 Dateien in MOSS 2007

Die Version 8 des Acrobat Readers hat einige signifikante Änderungen in der Architektur erfahren, inklusive eines eigenen IFilters um PDF Dokumente zu indexieren. Ältere Versionen von Acrobat benötigten dazu einen separaten IFilter um die PDF Dateien zu indexieren.

PDF_Search.JPG

1. Als erstes muss auf dem auf dem MOSS Server 2007 der Acrobat Reader V.8 installiert werden.

2. Die File Extension „pdf“ muss in MOSS 2007 zu den zu durchsuchenden Dateien hinzugefügt werden.

Zentral Administration / SharedServiceProvider / Sucheinstellungen auf Farmebene / Datei Typen –> „Neuer Datei Typ hinzufügen“. Hier wird nun „pdf“ (ohne Punkt) eingetragen.

3. Nun müssen in der Registry die Schlüssel auf die neue CLSID des Adobe IFilters angepasst werden.

HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office server\12.\Search\Setup\ContentIndexCommon\Filters\Extension\.pdf

Default –> {E8978DA6-047F-4E3D-9C78-CDBE46041603}

HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Shared Tools\Web ServerExtensions\12.\Search\Setup\ContentIndexCommon\Filters\Extension\.pdf

Default –> {E8978DA6-047F-4E3D-9C78-CDBE46041603}

4. Jetzt muss noch das Installationsverzeichnis des Acrobat Readers V.8 bei den Pfadvariablen eingetragen werden. Diese zeigt dem IFilter auf wo er die entsprechenden DLL’s findet. Standardmässig wird der Acrobat Reader unter „C:\Programme\Adobe\Reader 8.0\Reader“ installiert.

–> Rechtsklick auf Arbeitsplatz / Eigenschaften / Erweitert / Umgebungsvariablen / Systemvariablen –>Variable „Path“ Editieren und mit einem „,;“ getrennt am Ende des Werts den Pfadnamen „C:\Programme\Adobe\Reader 8.0\Reader“ eintragen.

5. Jetzt muss nur noch der MOSS 2007 Suchdienst neu gestartet werden.

net stop osearch
net start osearch

Nach einem neuen Crawl kann der MOSS 2007 nun PDF Dateien indexieren. Etwas unschön ist es, dass bei den Suchresultaten kein Icon zu den gefundenen PDF Dateien angezeigt werden. Um hier Abhilfe zu schaffen braucht es aber nur noch ein paar kleine Schritte.

6. Als erstes müssen wir eine GIF Datei eines PDF Icons haben. Dieses Icon wird von Adobe zur Verfügung gestellt. Am besten verwendet man die kleinere Variante mit 17×17 Pixeln. Dieses GIF wird dann in den Ordner „C:\Programme\Gemeinsame Dateien\Microsoft Shared\web server extensions\12\TEMPLATE\IMAGES“ kopiert.

7. Damit das PDF Icon auf dem entsprechenden Datei Typ zugewiesen werden kann muss in der Datei „Docicon.xml“ eine Zuweisung gemacht werden. Diese Konfigurationsdatei befindet sich unter „C:\Programme\Gemeinsame Dateien\Microsoft Shared\web server extensions\12\TEMPLATE\XML“ Dort wird ein weiterer Eintrag gemacht in dem der Filetyp und der Name der Datei angegeben wird:

8. Nach einem Neustart des MOSS Suchdienstes (siehe Schritt 5) ist auch dieses kleine Manko behoben.

Autor: Christoph Müller

Christoph Müller ist Consultant, Blogger und Podcaster rund ums Thema SharePoint, Digital Transformation, Cloud, Mobile und Netzpolitik.

2 Kommentare