かな漢字変換精度

前にも Twitter でちょっとだけ呟いたのだけど、みんなで育てることで変換精度が上がる ってのは本当なの? すげー信じがたいんだけど。
なぜ信じられないかの理由を述べよう。私が20年前から持ち続けてるVJEドグマではこういうことになってる。

使わない語が辞書に登録されていると、むしろ変換精度は悪くなる(使わない語の方が先に出てきたりするため)。辞書を賢くする最も効率的な方法は、使わない語を辞書から削除することだ。そうすれば必要な変換だけやってくれるようになる。

だから私は、他人の作った辞書登録データをマージするってのを基本的にしないんですよ。私の使わない単語が入ってくると変換効率が落ちる。文節区切り学習についても、自分の区切りは学習して欲しいけど、私と文体の全く異なる人の区切り方の学習結果が私の文体の変換時にどういう影響を及ぼすのか、すげー信用できないんですが。かな漢字変換ツールはパーソナルなものであって、私の癖だけを学習して欲しい。
前々から思ってるんですけど、Web 2.0 とか集合知ってのは、際限無くバリエーションを増やすことについてはすごく効果的だけど、候補を一つに絞り込むことことについては良い技術がまだ無いと思うのね。 Web 2.0 で絞り込みって言うと digg みたいな投票メソッドが言われるけど、あれがだめだめだってのはホッテントリの惨状を見ればわかること。んで、単語登録数を際限無く増やすことについてはたぶん Social IME が効果的なんでしょう。けど私がかな漢字変換に求めてるのはそういうものじゃない。「欲しいときに欲しい漢字を絞り込んで変換してくれる」ことであって、それは集合知が最も苦手としているところだと思うなあ。
とかなんとか書いてたらまた ゴーディアン とか変換しやがったこの馬鹿IMEが。ソーシャルとか言う以前の問題ぢゃろが。