スタッフブログ

2011.10.30

IME2007、Microsoft社の姿勢は?

windowsマシンで日本語を入力するためには、標準ではMicrosoft IME を使うような設定になっています。(もちろんATOKを使っている人もいるでしょうが^^)
「IME」とは「Input Method Editor」の略です。

Windows vistaに搭載されたIME2007は、あちこちであまり評判がよろしくありません。
私もとても困りまっていました。

ネットに出ている症状としては、
1.変換効率が悪い
2.余計な候補が出る
3.必要な候補が出ない
4.一般的でない用語が先に来る
5.動作が遅い。
6.半角/全角キーでの入力モードが効かなくなる
7.時々変換ができなくなり、ひらがな/カタカナ程度になる
(私はこれで一時期、本当に参っていました^^;)
※マイクロソフト社のサイトに修正プログラムがあって、ダウンロードしてやっと治りました。でも、この手当ができる人は本当に少数でしょう・・・

これらはいったいなぜ起きるのでしょうか。また何らかの対処法はあるのでしょうか。

今回やっとすぐれた情報が手に入り、いろんな現象の謎が解けた感じです。
謎がわかりにくい原因はIMEが2種類あるということにも関係しています。

その2つとはVista IMEとOffice2007 IMEです。
このふたつは別モノです。Vista IMEはIME2003 for Vistaとでも呼ぶべき機能で、IME2003のテクノロジを踏襲したVista専用IMEですね。IME2007は2007Officeで提供されるモノです。

IME2007が嫌いな人は、Vista標準のIMEに切り替えちまうって対処法もあります。

IME2007の変換はIME2003からアルゴリズムが変更されて、まったく新たにTrigram/SLM(Statistical Language Model)を採用したらしいんです。

Trigram/SLMでは、3つの語(Trigram)のつながりやすさを考慮して変換結果を決めます。
3単語の相関で候補の優先を演算し、「調整のための手作業が不要で」「機械的に変換基準を学んでいく」機能なのだそうです。

と考えると、アルゴリズムの変更で、IME2003までの変換基準の情報を取り込めなかったのではないか? となります。
IME2007では機械的な「学び」を前提とし、あまり「調整のための手作業」を行っていないのではないでしょうか?つまり、インストール直後は、何も覚えていない状態と言えます。
(まあ、当たり前ですが、それでも2003などは標準の順位づけなどである程度調整されていたはずです)

だからこそJIS2004で追加になった見たこともない字が先に表示されてみたり、ごく普通の単語が数十もの候補の一番最後に表示されたりするのではないでしょうか。

ということでIME2007で大量の文章を打ち込んでいくと、だんだんと自分の言い回しや漢字の使い方にかなりマッチしてくるようなんです。

現に最初は酷評していた人も、だんだんと言わなくなりますから。
変換候補もかなりヒットします。文脈を判断して候補の優先が変わったりしますので、長文を一気に入力した際に手戻りして別候補を指定させる必要がほとんどなくなってきています。

どうやら一度調教すると変換効率やら精度のぴったり感はかなり優れているようなんです。^^。
このTrigram。かなり使い込まないとメリットが出てこない代物なのかもしれません。

このへんの恩恵を受けるために、[IME2007のプロパティ]ダイアログ-[辞書/学習]タブ-[学習設定]-[学習する]にチェック、さらにその下の-[学習情報をファイルに保存する]にもチェックをつけておかないといけないようです。
ここらへんのチェックを外すとそもそも覚えてくれなかったり電源切るたびに忘れてくれてしまったりするようなのです。

次に動作が遅いこと。実はお客さんのPCでこれが発生。
ハードは最高のスペックなのに、古いマシンより使いづらい、変換が遅い、待ちきれん!などと苦情が出てしまいました。

これについては、「Outlookをひと通り設定すると速くなるぜ」との話があります。
まったく、「えー?」という感じですが、実はIME2007の目玉のひとつに、「Outlookアドレス帳、Exchangeグローバルアドレス帳をIMEの辞書として活用」ってのがあります。

実際にはアドレス帳を直で辞書として使うわけではなく、不特定のタイミングでアドレス帳からIMEの辞書にデータをインポートしているみたいなんですね。
で、アドレス帳がないとインポート動作が空振りしてしまうわけなんですが、どうもこの時にタイムアウトするまで待つんだかアドレス帳データがあるかもしれないフォルダを片っ端からチェックしに行くだかして時間がかかっちゃうらしいんですね。

「フリーズかっ?」と思うほど遅い時は、このインポートロジックが虚しく空振り続けているのではないかと思われます。

そこでアドレス帳にダミーでもいいのでいくつかデータを登録しておくとかなり動作が改善されるようです。(なんのこっちゃ^^;)

このアドレス帳データがインポートされる辞書が「Outlook連絡先辞書(姓/名)/Outlookグローバルアドレス一覧辞書(姓/名)」の4ファイルなんですが、これが標準の設定のようなんですね。
[IME2007のプロパティ]ダイアログ-[辞書/学習]タブ-[システム辞書]から確認できます。
じゃあこの4つの辞書をシステム辞書の登録から削除したら?

と~っても速くなります!

さらに!ユーザー辞書が設定されていなくても遅くなるようですので、ダミーでもいいのでいくつか単語登録しておきましょう。
(なんとも不思議なことです)

次、時々変換が効かなくなる。

まず、Office IME 2007 で入力した文字を漢字に変換できない場合の対処方法で言及されているのは、おもに設定ファイルや学習情報が壊れてしまった場合の対処です。
保存されたファイルだけではなく、それらのデータがオンメモリだったりキャッシュだったりの中で壊れている場合もあるようなので、上記ページで言及されている対処をする前に、一度単純に再起動かけて様子を見てもいいかもしれません。

それでも何度も発生するようであれば、大元のファイルが壊れている/または壊れやすい状態になってしまっていると判断し、一から出直す覚悟を決めて設定やら辞書やらを削除します。

もうひとつはInfoCage/モバイル防御における重要なお知らせ「IME2007に関する件」。「ME2007の共存問題について」などに書いてありますが、入力関係かメモリ関連でお行儀の悪いソフトと混在させると、IME2007がうまく辞書にアクセスできなくなってしまうようなんですね。他にも一部のオンラインゲームなど相性が悪いものがかなりあるようです。

私の場合は原因はわかりませんでしたが、Microsoft社の修正プログラムを入れてみました。
今のところ、解決できたようです。^^

それから予測入力が発動しない場合は、[IME2007のプロパティ]ダイアログ-[予測入力]タブ-[設定]-[予測入力を使用する]にチェックするだけではダメで、[テキストサービスと入力言語]ダイアログ-[詳細設定]-[システムの構成]-[詳細なテキストサービスをオフにする]のチェックを外す必要があります。

このチェックを外すと言語バーが表示されてしまいます。

で、ここまでの設定で予測入力に対応してくれるのはOfficeソフトだけです。
Office以外のソフトでも予測入力を可能にしたい場合にはもうひとつ、、[テキストサービスと入力言語]ダイアログ-[詳細設定]-[互換性の構成]-[詳細なテキストサービスのサポートをプログラムのすべてに拡張する]にチェックを付けておく必要があります。

ここまで設定すると、メモ帳だろうが秀丸だろうが十分予測入力のお世話になれるようになります。

おまけ情報。
予測入力は、インストール時にはオンメモリの状態、つまり電源を切ると予測のためのデータを忘れてしまう設定になっています。電源を切っても今日使った言い回しを覚えておいてもらいたい時には、[IME2007のプロパティ]ダイアログ-[予測入力]タブ-[入力履歴]-[ファイルに保存する]を選択しておくと良いそうです。

いや~、奥が深いですなぁ~^^。

覚え続けさせていると何だか重くなってくるような気がしないでもありませんが、ご自分で確認してみてください。

人によっては半角/全角キーでの入力モードが効かなくなる場合があるようです。

予測入力の関係で、言語バーをデスクトップに表示すると、半角/全角キーでの入力モード切り替えができなくなってしまう場合があるようです。
Alt+半角/全角は効くようですが。

この現象はXPマシンで言語バーが表示されている時にのみ発生するようです。
詳細なテキストサービスをOffにしてIMEバー表示の状態だったり、それをシステムトレイに入れている状態では大丈夫なんですね。

どうもこれは言語バー側の問題のようです。
言語バーはIMEではなくOS側の機能なので、日本のIMEチームではなく米国のWindowsOSチーム主体で開発されているんです。だからでしょうか。
どうもしっくりこないようですな。

どうやらIME2007の動作の納得できない挙動ははIMEだけに起因するわけではない、ということとです。

まとめですが、Trigram/SLMはクセがあるということと、変換効率を上げるためには、使いこむこと(育て方/育てる必要があること)を理解するといいでしょう。
また他社製ソフトとの相性問題が依然として解決されていないということですから、自分のPCだけがダメということもあり得ます。

さらに!インストールデフォルト(インストールしただけの設定状態)では使いにくい状態もあるということです。
快適に使うためには、情報収集と自分で設定を変えて最適にする必要があります。
(そもそも、デフォルトでそこそこ使える状態にしてほしいものです)

このエントリーをはてなブックマークに追加

トラックバック

トラックバックURL:

コメント

コメントフォーム

ブログ内検索

アーカイブ

カレンダー

«10月»
      1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31