郵便番号辞書や人名地名辞書を使ってみましょう

前回は顔文字の入力方法をご紹介しました。   顔文字辞書と同じように追加して利用できる辞書には、郵便番号辞書、単漢字辞書、人名地名辞書、カタカナ英語辞書、記号辞書があります。 これらの辞書も、候補と並んで表示された辞書名を選択することで入力に利用することが出来ます。   例えば、郵便番号辞書を使って、郵便番号から住所へと変換してみましょう。 まず、「168-0063」と入力し、変換キーを押します。数字の候補の他に、「住所に変換…」という項目が現れます。ここで、「住所に変換…」を選ぶと、郵便番号に対応する住所「東京都杉並区和泉」と変換されます。 郵便番号が分かっている場合は、住所の入力が手早くできますね。   他の辞書についても、同じように「さくらまち」から「人名地名…」を選択して「櫻町」を入力したり、「たこ」から「単漢字…」を選択して「鱆」を入力したり、「しあとる」から「英語に変換…」を選択して「Seattle」と入力したり、と利用することが出来ます。   このように、予め利用する辞書を切り替えたり、といった特別な操作をしなくても、入力の途中でいろいろな辞書を利用して変換することが出来ます。   入力の際、変換候補に並んで、追加辞書の名前が現れたら、期待する結果が隠れているかもしれません。 是非お試しください。    大井 恵太

0

顔文字入力の方法

いろいろなところで目にする顔文字。ビジネスメールにも顔文字が入る会社もあるのだとか。   さて、今回は、今ではみんなが使うようになった(?)顔文字の入力方法をご紹介します。よろしくお願いします。m(__)m   まずは基本編。「かお」と読みを入力して変換します。変換キーを押して候補一覧を出すと「顔文字」という選択肢が現れます。選んでみましょう。たくさんの顔文字が表示されましたね。(*^^)v 「かおもじ」でも同じ候補が出ます。   「かお」と入力して顔文字を入力できることは、ご存じだった方が多いと思いますが、実はその他にも入力方法があります…というわけで、ここからはちょっと応用編。   実は「あいたっ」「おちゃ」「おじぎ」「いか」など、「かお」「かおもじ」他にも顔文字を入力できる読みをいくつも用意しています。どんな顔文字が入力できるんだろう(?_?)、と思った方は、是非お試しください。   それでは皆様、ご機嫌よう! (^^)/~~~   (顔文字の一覧はヘルプに掲載しています。興味のある方はどうぞご覧ください。)   大井 恵太

0

全角/半角 オートコレクト

Microsoft IME では、文字の種類によって、全角と半角のどちらに変換するかを指定しておくことが出来ます。自分の入力スタイルに合わせて設定しておけば、普段の入力で一手間減る…かもしれません。   全角と半角のどちらに変換するかは、[Microsoft Office 2010 IME のプロパティ]から変更できます。ちょっと変更してみようと思った方は以下の手順を試してみてください。   1.    まず、プロパティを開きます。プロパティは、例えば、IME ツールバーの[ツールボックス] ボタンを押し、表示されたリストの中からプロパティを選択することで開くことができます。([ツールボックス] ボタン は工具箱の形をしています。特に変更していない場合は、「?」アイコンの左隣にあるはずです。) 2.    [Microsoft Office IME 2010 のプロパティ]が開いたら、[オートコレクト]をクリックし、[オートコレクト]タブに移動します。 3.    [オートコレクト]タブの下半分に [全角/半角] 設定があります。自分の入力スタイルに合わせて設定してみてください。   記号については文字ごとに個別に設定することも、まとめて設定することも出来ます。 なお、Microsoft Office IME 2010 では、記号の分類を少し変更し、一緒に設定することが多い、句読点、中点、かぎかっこ(「」)を一つのグループにしました。   この他にもプロパティで様々な項目を設定可能です。お試しください。   大井 恵太  

0

IME2010 で辞書をアップデートするには?

IME2007までも、最新語辞書や郵便番号辞書をアップデートしてきましたが、Office Onlineのページから、ダウンロードセンターに行き、自分でダウンロードする必要がありました。 IME2010では、最新語辞書などのMicrosoftで出している辞書を、自動でアップデートする機能が備わります。   出荷時の設定では、自動アップデートはオフとなっていますので、辞書を自動的にバージョンアップしたい方は、   1. 言語バーの[ツール]ボタンをクリックし、[追加辞書サービス]から[Microsoft辞書アップデート]を選択し、辞書アップデートの設定画面を起動してください。 2. [インストール済みの辞書を自動的にバージョンアップする]にチェックをし、[OK]ボタンを押してください。   これで、自動的に辞書がアップデートされます。   最初の辞書アップデートはベータテスト用に1月下旬に予定していますので、ぜひバージョンアップしてみてください。   関 美由紀  

0

Inside IME 2010

Inside IME 2010 概要 Microsoft IME 2010 は、安定性および基本性能を向上させました。向上させた基本性能は、変換精度、学習機能、実行速度です。IME 2010 は、辞書の自動アップデートで、語彙の充実を広範囲のユーザに提供できるようにしました。また、辞書を拡張する機能として、企業向けのSharePoint 辞書に加え、一般ユーザー向けにXMLファイル形式のオープン拡張辞書をサポートしました。また学年別辞書、サーチ機能をサポートしました。 ユーザーの皆様からのフィードバック Microsoft IMEは、ユーザーから誤変換や登録単語をレポートしていただく機能を備えています。Microsoft IMEのユーザーは推定で 6,000万人いらっしゃいます。これまでに、誤変換レポートは累積で5千万件寄せていただきました。現在、一日当たり、単語登録レポートがおよそ 2,000件、誤変換レポートは 10 万件、学習データのレポートは 120 件、お送りいただいています。 単語登録データは、辞書のアップデート・サービス(ご案内はここ [1])に利用しています。誤変換データは、変換をチューニングするために利用しています。学習データは、今後の研究のために利用しています。研究の一例をIME Blog [2] に紹介しています。 安定性 IME 2010 開発プロジェクトは、品質を第一の優先事項として実行し、安定性と基本性能に注力しました。ストレス・テストは、従来より種類も数も大幅に増強し、早期に出荷レベルの安定性を確保しました。また、2007に対して行った修正点のすべてに関して、根本原因にさかのぼって分析し、テスト・ケースやテスト・システムを強化する等の対策を行いました。 基本性能 変換精度 標準的に組み込まれた辞書に、これまで辞書アップデートで提供してきた語彙30,650語を追加しています。フィードバックをもとにしているため、多くのユーザが登録した単語が追加されています。それらには、入力に手間のかかる専門的な単語、実世界・日常における重要な単語、社会の変化にともなう新しい固有名詞などが含まれます。 Microsoft IMEは、IME 2007 以降、変換精度向上の限界を打破するため、基本方式を変えました。従来は品詞接続ベースの文法でしたが、現在は統計的言語モデルを採用しています。統計的言語モデルとは、具体的には、単語のつながりやすさを示すTrigramやBigramなどです。詳しくはIME Blog[3] を参照ください。それらに加え、実際は、品詞のつながりやすさ、特殊な複合単語連鎖の知識、共起しやすい自立語のペアの知識、など様々な言語知識を併用しています。ところで、統計的言語モデル方式は、そのモデルを構築するために、大量のサンプル・テキストを使います。IME 2010 では、そのもとになるサンプルテキストの質向上によって、言語モデルの質を向上させました。サンプル・テキストにはごみやエラーが混じらないように丁寧にデバッグしてあることが必要です。また、サンプルのバランスが重要です。IME 2010 では、誤変換フィードバックに頻出する同音語の使用サンプルを重点的に収集し、モデルを生成しました。それによって、ユーザーが実際に多く遭遇しやすかった誤変換を解決しています。 学習機能 Microsoft IMEは、統計的言語モデルの採用に伴い、新しい学習原理を導入しました。それは、単語の使用情報と選択情報の利用です。詳しくは、IME Blog[4] をご覧ください。フィードバックによって、IME 2007 SP2で、学習の効果がすぐに発揮されるようにチューニングしました。IME 2010では、その性能を強化するとともに、副作用が出にくいようにさらにチューニングしました。 変換・学習の評価 変換や学習の質は、約70個の評価基準によってチェックしています。評価基準とはたとえば、変換結果が正解とどれだけ一致したかを示す文字正解率、正解が候補一覧の何番目にあったかを示す正解候補分布、一度正解を機械的に学習させた後の文字正解率、文節単位で変換した場合の文字正解率、などです。IME 2010は、評価基準の強化から実施し、開発の途中はラボの5,60台のマシンを毎日稼働させ毎日ビルドを評価し、品質チェックをしてきました。 チューニングの結果、たとえば弊社のテストで、IME 2010の文字正解率は 97.8 %です。また、一度正解を機械的に学習させた後の文字正解率率は 99.6%で、IME 2007 SP2 と比べてエラーを17%…

0

IMEチームの日本語分析を紹介します。

こんにちは。   今回は、IMEチームでの日本語分析の一端について書いてみます。   とても嬉しいことに、たくさんのユーザーの皆様から、Office IME 2007を通じて、誤変換、登録単語などの情報をお送りいただいています。頂いた情報は最新語辞書の更新や、変換精度の向上に役立てています。皆様ご協力ありがとうございます。   さて、今回は、どの単語を何回くらい使ったのかという情報を使って分かること、の一部をご紹介したいと思います。   その1。 Office IME 2007 を使って文章を入力している方は、”時間”の”確認”を”お願い”する”メール”を書く方だ。   上の”時間”、”確認”、”願い”、”メール”は利用頻度の高い単語として、上位に現れるものです。この結果を見るだけでも、新聞でも小説でもなく、PCで入力される文章の特徴が見事に現れていますね。   その2。 使う単語から個性が見える。   面白かったので、いくつか例を挙げてみましょう。下の例は実際のデータから計算して求めたものです。   2-1.「診療」「診察」をよく使う人は、「医師会」「カルテ」もよく使う。   どうでしょうか。なかなか当たってそうだと思いませんか?   2-2.「換気」「ダクト」をよく使う人は、「額縁」「空調機」をよく使う。   え?「額縁」って絵画の? 調べてみました(Bing で)。サッシの周りの枠も「額縁」って呼ぶのですね。私は知りませんでした。勉強になるなぁ。   2-3.「市場(しじょう)」をよく使う人は、「投資」「戦略」「金融」をよく使う。「市場(いちば)」をよく使う人は、「生花」「陶器」「青果」をよく使う。   これは、納得。読み方によってこんなに変わるものですね。   では、最後に、「セブン」をよく使う人は… …あぁ、どうやら「セブン」はコンビニエンスストアに関係する単語のようです。でも、これは現在のデータでの分析結果。時間がたてば、私たちが期待している単語も、きっと上位に出てきてくれるでしょう!   それでは、また、楽しんでいただけそうな発見がありましたらご紹介します。     大井恵太

0

IME2007の辞書更新サービス2009年11月版のお知らせ

IME2007用の最新語辞書および郵便番号辞書 2009年11月版がLiveされました。   以下のページからご利用ください。   最新語辞書2009年11月版   郵便番号辞書2009年11月版   最新語辞書には以下のような言葉が追加されています。   就規(しゅうき)、初月(しょげつ)、特表(とくひょう)、花鶏(あとり)、甘草湯(かんぞうという)、校園(こうえん)、茉莉花(まつりか)、ニコ動(にこどう)、飛翔体(ひしょうたい)、衛生研(えいせいけん)、宮出し(みやだし)、自主勉(じしゅべん)、早摘み(はやづみ)、豚丼(とんどん)、婚カツ(こんかつ)、など 郵便番号辞書は、2009年9月に日本郵政株式会社から公開されたデータをもとに更新されています。   早いもので、来月はもう12月です。 年賀状などご挨拶状の作成の際、ぜひアップデートされた郵便番号辞書をご活用ください。   なお、最新語辞書2009年5月版の記事にも書きましたとおり、Office 2003 のメインストリームサポートが2009年4月で終了しております。 それに伴い、IME2003 の郵便番号辞書の更新は、2008年11月版が最終バージョンとなります。ご注意のほどよろしくお願いいたします。   関 美由紀

0

IME2010 パブリックベータ

Microsoft Office 2010のパブリックベータが公開されました。 以下から、ご入手いただけます。 http://www.microsoft.com/2010/ja これには、IME2010が含まれております。IME2007はSP2で、変換精度やスピードをチューンアップいたしました。IME2010は、それにさらに大幅なチューンアップを実施したものです。新機能や、チューンした点など、これからご案内してまいります。   まずは、お試しいただき、フィードバックをいただけましたら幸いです。    

0

最新語辞書 2009 年 8 月版が Live されました

IME2007 用の最新語辞書がリリースされました。 以下のページからご利用ください。   最新語辞書2009年8月版   この辞書をインストールすると、次のような単語が入力できるようになります。   翌末(よくまつ)、講学(こうがく)、月令(げつれい)、濃絵(だみえ)、竹酢(ちくさく)、麦門冬(ばくもんどう)、企画品(きかくひん)、仙豆(せんず)、副振動(ふくしんどう)、児相(じそう)、銀傘(ぎんさん)、培養士(ばいようし)、美ら海(ちゅらうみ)、極星(きょくせい)、マカロン、など   今回も、皆様のたくさんの登録単語報告に支えられ、IME最新語辞書がリリースされています。 ご協力ありがとうございました。   また、この辞書は 2007 Microsoft Office system Service Pack 2(以下SP2) に付属しているIMEでご使用になると、よりよい変換結果を得ることができます。 まだ SP2 にバージョンアップされていない方は、この機会にぜひ SP2 にバージョンアップされてみてはいかがでしょうか。   SP2 についての詳細は、以下のページをご参照ください。 2007 Microsoft Office system Service Pack 2   関 美由紀

0

最新語辞書 2009 年 5 月版のお知らせ

IME2007 用の最新語辞書がリリースされました。 以下のページからご利用ください。   最新語辞書5月版   この辞書をインストールすると、次のような単語が入力できるようになります。   売伝(うりでん)、内検(ないけん)、出し値(だしね)、居食屋(いしょくや)、岩盤浴(がんばんよく)、七赤金星(しちせききんせい)、婚活(こんかつ)、巡音(めぐりね)、点図(てんず)、秘文書(ひぶんしょ)、地活(ちかつ)、淀江傘(よどえがさ)、鉄観音(てっかんのん)、月9(げつく)、エグザイル、など   なお、IME2003の最新語辞書はメインストリームサポート終了に伴い、2009年2月版をもって終了となりました。 長い間、皆様にご愛顧いただきまして誠にありがとうございました。 Office2003のメインストリーム サポートのポリシーにつきましては、Office製品のプロダクト サポート サイクルに載っております。 併せてご参照いただけますと、幸いです。   関 美由紀

0