SPS2013 10月CU に含まれる検索機能強化について

この記事では、SharePoint Server 2013 の 2013年10月のCU に含まれる検索機能強化について解説します。
本投稿内容の元となった記事についてはこちらをご参照ください。

 

概要
SharePoint Server 2013 の 2013年10月のCUには、検索結果により適切なコンテンツを表示するための追加機能が含まれています。この追加機能により、Word 文書と PowerPointプレゼンテーションにおいて検索結果のタイトルにより適切な情報が表示されるようになりました。また、ドキュメント本体から最終更新日時を取得する動作が無くなりましたので、コンテンツの正確な最終更新日時を利用して検索結果の並び替えや絞り込みができるようになりました。

 

変更点
検索インデックス作成時のプロセスにおけるメタデータ抽出機能に改良を加え、以下の2つの新しい「クロールされたプロパティ」を追加しました。

・MetadataExtractorTitle
・MetadataExtractorAuthor

また、従来ドキュメントの本体から意図しない更新日時が取得されていた動作を廃止し、コンテンツのメタデータより取得される更新日時が正確に検索結果に反映されるよう改善を加えました。

 

変更の適用方法
SharePoint Server 2013 の 2013年10月のCU の適用後、コンテンツのフル クロールを実施します。

 

影響範囲
この動作変更の影響により、CU の適用に伴い 「Title」 管理プロパティと 「Author」 管理プロパティに対する既存の検索スキーマのマッピングが初期化されます。これらの管理プロパティに対する既存の検索スキーマの設定を変更しているユーザーは既存の検索スキーマの設定内容を控えておく必要があります。

 

詳細な動作について
以下に、詳細な動作について解説します。

タイトル表示に対する変更点
今回の改良が適用される以前は、「Document1.docx」や「Presentation1.pptx」といったタイトルでドキュメントが保存されていた時に、検索結果において「Document1.docx」や「Presentation1.pptx」といったタイトルが表示されるケースがありました。今回の改良により、メタデータ抽出機能でドキュメント本体からより適切と考えられるタイトルが抽出されるようになりました。メタデータ抽出機能で取得されたタイトルの値は、新しい「クロールされたプロパティ」の「MetadataExtractorTitle」として出力されます。MetadataExtractorTitle は既定で「Title」管理プロパティにマッピングされ、優先順位が一番高く設定されます。これにより、検索結果により適切なタイトルが表示される可能性が高くなります。

検索結果に表示されるタイトルを変更する方法
ユーザーは検索スキーマの設定で「Title」管理プロパティにマッピングされる「クロールされたプロパティ」の優先順位を変更することで、検索結果に表示されるタイトルを任意のプロパティに紐づけられます。

以下は、既定でマッピングされているプロパティの一覧です。

優先順位 クロールされたプロパティ カテゴリ 説明
0 MetadataExtractorTitle MetadataExtractor Word 文書と PowerPoint プレゼンテーションの本体から抽出されたタイトル
1 TermTitle SharePoint SharePoint アイテムのタイトル
2 Office:2 Office Office ドキュメントのタイトル
3 Ows_BaseName SharePoint SharePoint ページの名前例) https://my/sites/wiki/Home.aspx
4 Title ドキュメント パーサー コンテンツ処理コンポーネントにより取得されたタイトル
5 MailSubject ドキュメント パーサー コンテンツ処理コンポーネントにより取得された電子メール ファイルの件名
6 Mail:5 メール 電子メールファイルの件名
7 People:PreferredNameurn:schemas-microsoft-com:sharepoint:portal:profile:PreferredName ひと ひとの姓と名
8 Basic:displaytitleurn:schemas.microsoft.com:fulltextqueryinfo:displaytitle 基本 オフィス ドキュメントのファイル名
9 ows_Title SharePoint SharePoint ページのタイトル
10 Basic:10 基本 ファイルのメタデータ プロパティに関連付けられたファイル名
11 Basic:9 基本 ファイルのメタデータ プロパティに関連付けられたファイル パス

該当するプロパティの値が空の場合には、優先度がひとつ低いプロパティの値がマッピングされます。
管理プロパティの設定方法については以下の資料を参照してください。

(参考資料)
SharePoint Server 2013 で検索スキーマを管理する
https://technet.microsoft.com/ja-jp/library/jj219667.aspx

SharePoint Online で検索スキーマを管理する
https://office.microsoft.com/ja-jp/office365-sharepoint-online-enterprise-help/manage-the-search-schema-in-sharepoint-online-HA103628856.aspx

Author 管理プロパティに対する変更点
Author 管理プロパティに対しても、新しい「クロールされたプロパティ」の「MetadataExtractorAuthor」がマッピングされます。
Author 管理プロパティに対するマッピングには優先順位は無い (クロールされた全プロパティからコンテンツを取り込む) ため、特にユーザーが変更を意識する必要はありません。

以下は、既定でマッピングされているプロパティの一覧です。

クロールされたプロパティ カテゴリ 説明
Author ドキュメント パーサー コンテンツ処理コンポーネントにより取得された作成者
MailFrom Mail 電子メール ファイルの差出人から取得された名前
Mail:6 Mail 電子メール ファイルのメタデータに含まれる作成者
Author Notes Lotus Notes connector によってクロールされた Notes コンテンツの作成者
Internal:3 内部 SharePoint 内部オブジェクトのメタデータに関連付けられた作成者
Internal:105 内部 SharePoint 内部オブジェクトのメタデータに関連付けられた作成者
Office:8 Office Office ドキュメントの ModifiedBy メタデータ プロパティ
MetadataExtractorAuthor MetadataExtractor Word 文書と PowerPoint プレゼンテーションの本体から抽出された作成者

クロールされた全プロパティからコンテンツを取り込む設定になっていた場合、すべてのクロールされたプロパティの値を重複を削除した形でマージしてから検索プロパティに値を格納します。検索時にはいずれか1つのプロパティの値が一致した場合に検索結果に表示します。

LastModifiedTime 管理プロパティに対する変更点
以前の動作では、メタデータ抽出機能によりドキュメントの本体から最終更新日と想定されるデータが抽出されていました。これにより、本来更新日とは全く関係が無い日付が最終更新日として取り込まれるケースがあり、検索結果の絞り込みや並べ替えに影響を与えることがありました。今回の動作変更では、LastModifiedTime 管理プロパティに対してドキュメント本体から最終更新日を取り込む動作を廃止しました。
これにより、ユーザーはより正確なコンテンツの最終更新日に基づき、検索結果の並び替えや絞り込みができるようになりました。