ハウツー:MOSS 2007 の検索結果に、特定の列の情報を表示させない

こんにちは。SharePoint サポートチームのかわぞえです。

最近不幸にも家の網戸にとまってしまったカマキリを捕獲して、ペットとして飼っています。

奥さんには嫌がられていますが、子供たちは興味津々で次々とバッタやコオロギをカマキリのいる虫かごに放り込み、弱肉強食の食物連鎖の構図を楽しんでいます。

A: 「でも、カマキリのパパは最後にはママに食べられちゃうんだよ」

B: 「そうなんだ、、、切ないねーパパ。僕も食べられちゃうのかな。。」

男に対する食物連鎖の厳しさがあることに気づき、大人の階段を一歩上ったわが子を垣間見ました。。。

さて、今回は MOSS 2007 の検索機能の中で、ちょっとした Tips をご案内したいと思います。

内容は、「MOSS 2007 の検索結果に、特定の列の情報を表示させないようにする」、です。

以下のような状況を想定したケーススタディを考えてみます。

1). Contoso 社のサポート部門では、リストライブラリでお問い合わせいただいた内容やお客様名、企業名、対応者を記録しています。

2). お問い合わせを受けた際には、リストライブラリを検索し、過去に受けた問い合わせ内容やお客様を検索し、迅速かつ適切な対応ができるよう努めています。

3). これらの状況のため、いかに早く情報を抽出できるかが、顧客に対するサービス品質向上の1つとして重要な要素となっています。

ところが、サポートの担当者からは、以下の声が上がっており、IT 管理者は頭を悩ませています。

「お客様名を検索しようとすると、同じ名前の対応者もひっかかってきており、検索精度に影響がでるのでなんとかしてほしい」

ここは是非 MOSS 2007 の検索機能を使用してこの問題に対処してみたいと思います。

MOSS 2007 では、コンテンツをクロールした際に検索インデックスにインデックス情報が格納されますが、コンテンツの中身だけではなくプロパティ情報もデータとして格納されます。

たとえばドキュメントのプロパティとしては、タイトル、作成日時、作成者などがすぐに思いつきますね。

早速 MOSS 2007 の管理画面から、どう設定するのか、確認してみましょう。

1. まず現状の動作を確認してみます。今回対象のリストは以下のようになっています。舞黒さんが顧客名列にも対応者列にも存在しています。

image1

2. このリストを検索すると、舞黒太郎さんを含む列と舞黒次郎さんの名前を含む列がヒットします。1つは [顧客名] 列の舞黒太郎さん、もう1つは [対応者] 列にある舞黒次郎さんを含む例です。この舞黒次郎さんを含む [対応者] 列を除外することが今回の要件となります。

image2

3. では、この状況を変更するべく、サーバーの全体管理サイトから、共有サービスプロバイダの管理ページ -> [検索の設定] ページにアクセスします。画面が表示されたら、[メタデータ プロパティのマッピング] のリンクをクリックします。

image3

4. 何やら見慣れない画面がでてきましたね。説明文に、「クロールされたプロパティは、クロールされたコンテンツから自動的に抽出されます。」とあります。先にご説明したコンテンツの中身だけでなく、プロパティ情報もデータとして格納されている、ということですね。では先ほどの列がどこに格納されているか確認しましょう。[クロールされたプロパティ] をここでクリックします。

image4

5. 次は [メタデータ プロパティのマッピング] 画面が表示されます。このなかで SharePoint のリスト列の情報なので、SharePoint カテゴリを選択します。

image5

 

6. クロールされたプロパティが表示されました。これらがSharePoint カテゴリに分類されるコンテンツをクロールした際に、抽出されたプロパティになります。早速編集する対象の [対応者] 列を探すべく、検索ボックスで [対応者] と検索しますが、ヒットしません。再度検索してもやはりヒットしません。そこで、よく画面を見てみると、プロパティ名で意味不明な文字列があります。意味不明な文字を解読するため、ここでは当該の文字列に対してデコードを行ってみましょう。まず ”ows_” の部分と、”_x” の部分を除いた文字列を初めに抽出します。そうすると、(5bfe 5fdc 8005) という 3 つの文字列が残りますので、次にこれをデコードします。デコードするには、外部サイトになりますが、以下のサイトが便利です。デコードを行うと、”5bfe 5fdc 8005” に対応した文字列として、日本語の ”対応者” が表示されます。

- 参考 URL

Unicode code converter (W3C の Internationalization Activity Lead である Richard Ishidaさんのサイトにある Web 上のツールです)

https://rishida.net/tools/conversion/

image6

7.  お気づきの通り、日本語などの DBCS (Double Byte Character Set) では、Unicode にエンコードされて表示されます。その他の文字列についても、”ows_” の部分と、”_x” の部分を除いた文字列をデコードすると、対応する日本語文字列が表示されます。(英数字で列を作成している場合にはエンコードされることはありませんので、英数字で記載された列を作成するもの1つの手です。今回の例でいえば、ReqNo は、ows_ReqNo として表示されます。)

では早速 [対応者] のプロパティをインデックスから除外してみましょう。クロールされたプロパティ (ows_x5bfe_x5fdc_x8005) をクリックして表示された画面で、[このプロパティの値を検索インデックスに取り込む] のチェックを外して、[OK] します。

image7

8. [メタデータ プロパティのマッピング] 画面の説明にもあるように、今回実施したプロパティの変更はフルクロールが必要となりますので、フル クロールを実施します。フル クロール後、再度同様の検索を実施すると、[顧客名] 列の舞黒太郎さんは表示されましたが、[対応者] 列の舞黒次郎さんは結果から表示されなくなりました。これで今回の要件を実現することができましたので、IT管理者も一安心です。

image8

今回は、特定の列を検索インデックスから除外するというピンポイントな Tips でしたが、いかがでしたでしょうか。MOSS 2007 検索機能では、その他にもクロールルールを作成して、ルールに基づくコンテンツのみをクロールする (例えば、特定の URL はクロールする対象から除外する)、特定の URL を検索結果から即削除する、検索範囲で指定できるルールから特定のフォルダ、指定したプロパティを含むコンテンツを当該の検索範囲には表示させない、といった様々な機能が用意されています。会社の要件に沿うよう、ご利用になっている MOSS 2007 の検索機能について色々な設定をお試しください。

- 参考情報

今回ご紹介した機能に関する TechNet の参考情報です。お時間のあるときにでも、是非ご一読ください。

タイトル : コンテンツをクロールする (Office SharePoint Server 2007)

URL : https://technet.microsoft.com/ja-jp/library/cc262794.aspx

タイトル : メタデータ プロパティのマッピングを管理する (Office SharePoint Server)

URL : https://technet.microsoft.com/ja-jp/library/cc262933.aspx

タイトル : 検索範囲を構成する (Office SharePoint Server)
URL : https://technet.microsoft.com/ja-jp/library/cc263389.aspx

タイトル : 範囲ルールを管理する (Office SharePoint Server)
URL : https://technet.microsoft.com/ja-jp/library/cc263348.aspx