日本語入力ソフト(IME)の酷過ぎる予測変換をまとめてみた
当ブログの記念すべき初記事が此方になります…。
Windows 標準搭載の Microsoft IME や、Android でトップのシェアを占める Google 日本語入力*1 などの所謂「入力ソフト」のサジェスト機能(予測変換)について、ユーザーに多く入力されている単語とはいえ流石に酷いものが多いので紹介したい。
※当記事にお笑い要素はございません。至って真面目な記事になります。
今回の検証では主に Google 日本語入力(Windows版)を使用。Microsoft IME もほぼ一緒なので割愛。
勿論、学習機能諸々は全て無効化済みの状態で行う。(当然ながらサジェスト機能は有効。)
まとめブログのサイト名
ソシャゲの名前なんかを入れてみようものなら、数々のまとめブログのサイト名が嫌でも目に入ることであろう。
更に「まとめ」なんか入力しようものなら、そこはまるでアンテナサイトにでもアクセスしたのではないかと目を疑う。
政治的なワード
まあ、「ねとう」まで入力すれば入力ミスでない限り目的のワードは1つしかないであろうが、「ーー脳」というワードまでご親切に補完してくれるのには笑った。
同様のワードを Microsoft IME でも入力してみると、これまた面白い結果に。そしてこんなところにもまとめブログと思わしき固有名詞が存在している…。
例の国名を入力すれば、誰もが予想できたであろう結果が見られる。こうしたくだらない検証から、国民性までも現れていてなかなか面白くなってきた。
(これは有名?な本のタイトルのことらしい。)
こんなところで十分、有名入力ソフトの予測変換の酷さはお分かりいただけたのではないかと思う。メジャーなワードといえばこれら位しかないので…。
何か面白いものがあれば是非教えていただきたい。
対策方法
予測変換だけ見せといて何もないのはあまりにも建設的ではないので、一応対策を載せる。
Google IME
Windows版で
プロバティ -> サジェスト -> サジェストの種類 -> システム辞書からのサジェスト自動表示を有効にする
のチェックを外して適用させればOK。
最後に
この記事を通して何を言いたいかというと、OS に標準インストールされていて、標準でオンになっている入力ソフトのサジェスト機能がどこかの個人(まとめ)ブログを候補に出したり、差別用語を補完していたりして本当に大丈夫なのかということ。
平気で個人ブログを候補に出すことは宣伝行為になりかねないし、意図せず差別用語を目にして不快になる人も大勢いる。
こうした問題を世界的な大企業が起こしていることこそが問題なのである。
無論、ユーザーから集められた無数の使用統計情報に基づいて構成されるという特性上、こうしたことが起こるのは必然的である。
しかしながら、サジェスト機能でのシステム辞書の使用を標準ではオフにしたりだとか*2、ある程度の改善はすべきではないか。
…こんなこと書いときながら、多少不快になることはあるがオフにすれば不便に感じることの方が多いので、サジェスト機能のシステム辞書の使用はオンにしている。あと Microsoft IME 重すぎだろ‥‥