SharePoint 2010 での PDF 検索

こんにちは

Office サポートのかわぞえです。

はじめに 3月11日(金)に発生した東北地方太平洋沖地震により、被災された皆様、そのご家族の方々に対しまして、心よりお見舞い申し上げます。

今回の地震の影響は地震自体の被害、津波による被害、さらには原発の影響等計り知れないものがあります。また、直接の被害だけでなく、避難生活が続くことによる精神的ストレスなどもあるかと思います。

自分の子供達も地震や映像として映し出された状況を目の当たりにし、家から出ない、親から離れようとしない等、普段と全く違った行動をする場面もありました。(お医者様によると、ショックにより上記のような行動をとる場合もあるそうです)

また、サポート部門が普段在席している東京都調布市にある調布テクノロジーセンターでも輪番停電の影響をうけ、ビルの停電等が実施されています。そのため、お客様にご迷惑をお掛けしないよう、3月現在はサポート部隊は現在各地のオフィスに分散して、サポートを続けている状況です。お客様からの直接のご連絡をお受けできないなどご不便をおかけすることがありますが、どうぞご理解、ご協力いただければ幸いです。

では、サポートチームブログの内容に進みたいと思います。

今回取り扱うのは SharePoint 2010 での検索です。

SharePoint では、SharePoint サイトだけでなく、Office 文書や HTML 等のコンテンツ等もクロールして、インデックス付けすることができます。また、各製品ベンダー様から提供いただく iFilter を使用することで、独自のファイル形式についてもクロールすることができます。よくお問い合わせいただくのは PDF 形式のファイルです。SharePoint 2007 では、以下のサポート技術情報にある方法で、WSS 3.0 および MOSS 2007 のいずれでもクロール、インデックス付けすることができました。

32 ビット版の Office SharePoint Server 2007 および Windows SharePoint Services 3.0 において、Adobe PDF IFilter 8 および Adobe PDF IFilter 9 を使用し PDF ドキュメントを検索する方法

https://support.microsoft.com/kb/960628/ja

SharePoint 2010 でも同じ仕組みで、iFilter を使用することで、独自形式のファイルフォーマットをクロール対象とすることができます。SharePoint 2010 では、以下のサポート技術情報 (残念ながら、まだ英語版のみです) で、PDF ファイルをクロール対象とすることが可能です。

SharePoint 2010 - Configuring Adobe PDF iFilter 9 for 64-bit platforms

https://support.microsoft.com/kb/2293357/en-us

 

これで万事 OK ですね。。。。といいたいところですが、何か足りません。そうです、SharePoint Foundation 2010 の記述がありません。

では、WSS 3.0 と同じ手法で試して、、、うまくいきません。

実は、SharePoint Foundation 2010 では、WSS 3.0 と設定方法が異なっており、WSS 3.0 と同じ手法だとうまくいかないのです。SharePoint Foundation 2010 では以下の手法で対処可能ですので、おためしください。

手順概要 (ここでは、サポート技術情報と歩調をあわせ、Adobe 社様の iFilter を使用いたします)

======================================================

1. PDF iFilter のインストール

2. ファイルの種類を追加する

3. レジストリを編集する

4. SharePoint Foundation Search V4 サービスを再起動する

5. PDF アイコンを追加する

6. 動作確認

1. PDF iFilter のインストール

--------------------------------

"Adobe PDF iFilter 9 for 64-bit platforms" をダウンロードし、SharePoint Foundation サーバーにインストールします。(ファーム構成の場合は、SharePoint Foundation Search が動作する検索サーバーにインストールします)

<参考>

Adobe PDF iFilter 9 for 64-bit platforms

https://www.adobe.com/support/downloads/detail.jsp?ftpID=4025

注意 : 本投稿に記載されているサードパーティ製品は、マイクロソフトと関連のない他社の製品です。明示または黙示にかかわらず、これらの製品のパフォーマンスや信頼性についてマイクロソフトはいかなる責任も負わないものとします。

また、文書の体裁上の都合により製品名の表記において商標登録表示、その他の商標表示を省略している場合がありますので、予めご了解ください。

2. ファイルの種類を追加する (PDF)

--------------------------------------

1). 以下のスクリプトをAddExtension.vbs として保存いたします。

----- ここから -----

Sub Usage

    WScript.Echo "Usage: AddExtension.vbs extension"

    WScript.Echo

end Sub

Sub Main

    if WScript.Arguments.Count < 1 then

                Usage

                wscript.Quit(1)

    end if

    dim extension

    extension = wscript.arguments(0)

    Set gadmin = WScript.CreateObject("SPSearch4.GatherMgr.1", "")

    For Each application in gadmin.GatherApplications

        For Each project in application.GatherProjects

                    project.Gather.Extensions.Add(extension)

                Next

    Next

End Sub

call Main

----- ここまで -----

2) [スタート] ボタンをクリックし、[ファイル名を指定して実行] をクリックします。

3) cmd と入力し [OK] をクリックし、コマンド プロンプト ウィンドウを起動します。(管理者特権で実行されます)

4) コマンド プロンプトより、ファイルの種類を指定して、実行します。

<Cドライブ直下にスクリプトを配置した場合の実行例>

C:\>WScript AddExtension.vbs pdf

3. レジストリを編集する

------------------------

1) ファーム内の SharePoint Foundation Search が実行されているサーバーにて、[スタート] ボタンをクリックし、[ファイル名を指定して実行] をクリックして regedit と入力し、[OK] をクリックしてレジストリ エディタを起動します。

2) 次のレジストリ キーに移動します。

HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Shared Tools\Web Server Extensions\14.0\Search\Setup\ContentIndexCommon\Filters\Extension\

3) 右クリックして、[新規] - [キー] をクリックして、".pdf" と入力します。

4) [既定] を右クリックし、[修正] メニューをクリックします。

5) [値のデータ] ボックスに以下の GUID の値を指定します。

   {E8978DA6-047F-4E3D-9C78-CDBE46041603}

6) [ファイル] メニューの [レジストリ エディタの終了] をクリックして、レジストリ エディタを終了します。

注:なお、レジストリは編集前にバックアップしておいてくださいね。

4. SharePoint Foundation Search V4 サービスを再起動する

-------------------------------------------------------

1) SharePoint Foundation Search が実行されているサーバーにおいて、管理者権限でコマンド プロンプトを実行します。

2) コマンド プロンプトに以下のコマンドを入力し Enter キーを押して、SharePoint Foundation Search V4 サービスを停止します。

   net stop spsearch4

3) コマンド プロンプトに以下のコマンドを入力し Enter キーを押して、SharePoint Foundation Search V4 サービスを再開します。

   net start spsearch4

5. PDF アイコンを追加する

---------------------------

1)以下フォルダに PDF 用のアイコン ファイルを Adobe 社様の Web サイト等からダウンロードして、保存します。

  C:\Program Files\Common Files\Microsoft Shared\Web Server Extensions\14\Template\Images

2) 以下フォルダにある "DOCICON.XML" をメモ帳などで開きます。

  C:\Program Files\Common Files\Microsoft Shared\Web Server Extensions\14\Template\Xml

3) "DOCICON.XML" ファイル内にある <Mapping Key> タグに以下の 拡張子 [*.pdf] 用のエントリを追加します。ここでは、pdf のアイコンファイル名として、pdf.gif を指定しております。

   <Mapping Key="pdf" Value="pdf.gif"/>

4) 管理者として実行したコマンド プロンプトから、"iisreset /noforce" コマンドを実行して IIS をリセットします。

注意 : 上記手順は、ファーム内のすべての Web フロント エンド サーバーにて実施致します。

6. 動作確認

-------------

手順 1 から 5 までを完了した後、サイトのフル クロールを実行し、PDF ファイルが検索可能となることを確認します。

1)管理者として実行したコマンド プロンプトから、以下のディレクトリに移動します。

>C:\Program Files\Common Files\Microsoft Shared\Web Server Extensions\14\bin

2) 以下のコマンドを実施して、フルクロールを実行します。

>stsadm -o spsearch -action fullcrawlstart

いかがでしたでしょうか。

今回は SharePoint 2010 における iFilter の登録方法についてご紹介させて頂きました。

SharePoint 2010 では、検索のみならず、サービスという観点でのアーキテクチャが大幅に変更され、より柔軟に対応できるようになりました。

今回ご案内した検索機能でも様々な新機能、改良点がありますので、是非お試し下さい。

最後になりますが、今回の地震や津波、原発による被害等、震災による影響としてはまだ落ち着いている状況ではありません。

どうか一日も早く被災者の方々が落ち着いて暮らせるようにと願って止みません。

日本マイクロソフトは、被災地域の復興支援に、全力で取り組んでまいります。

日本マイクロソフトの被災地域への復興支援と対応について

https://www.microsoft.com/japan/citizenship/disasterrelief/default.mspx

MSN東北地方太平洋沖地震に関する役立つ情報

https://eastjapaneq.jp.msn.com/