文字認識

文字というのはよくできています。
だってこうやって読めますから・・・・
 
日本語と英語の認識率の話などがよく出たりしますが 日本語に比べて英語は比較的認識率が高くなります。
これは明確な理由があり ひたすら文字数が少ないことに由来します。
文字数が少ないこととデジタルでの認識率は比例しない という意見もあるわけですが よくよく考えてみるとわかるのですが たとえば文字が10文字しかないとすると これに数字を割り当てて考えてもらうとほぼ全てが一筆書きに近いもので成り立っていることがわかると思います。
「4」などのように活字で見ると一筆書きですが 書き文字ではふた筆になるという意味も含めてなのですが。
じゃあ一筆かどうかが認識率にどう関係あると突っ込まれそうですが 感じの画数を考えてもらうとわかりますがとりあえず読める漢字だけで4000文字ぐらい。
一筆書きで表現できる図形では底をついてしまい、一筆出かける図形の組み合わせが始まるわけです。
それでも足りないので お出来上がった文字を複数重ねて文字にしたりもします。
例に出すと「木」、「林」、「森」などです。
文章の中で出てくるからわかりますが これが単体でぽんとおかれているとバランスが悪ければご認識してしまうわけです。
もちろん線数も増えるので 解像度的にもどこまでが適正化といわれると より難しくなるわけです。
裏を返せば 文字が一筆書きでかける文字だけにすれば 認識率は高くなる・・・・となるわけですが それが 最近よく話題に出すGrafittiというPalmの入力方式です。
もっとも、これは書き順も見ているのですから 図形としての文字認識でひとくくってしまうのは問題があるわけですが。
 
日本語は認識率が悪いから使わない・・・・
なんてことを言いたい人もいて 会社は英語しか使っちゃダメなんていわれると私はトイレにも行けなくなって生きていけないわけです。
英語だけにして生きていけるかどうかの基準を 某有名テストなどに頼っている段階でどうかと思うわけですが・・・
同じ日本人で くいz番組を見ていてこんなにバカでよいのか?と思う人が 面白い考え方としゃべり方で説得力を持って話すのに、一緒に出てきた大学教授の話はさっぱり分からなくて苦笑を誘うなんて見ているとそんなもので評価している時点で個人主義を落としてしまって それで国際市場で戦えるなんて片腹痛いと思うのは私だけですね。ひがんでますから・・・
じゃあ、日本語をなぜ使ったほうが良いかという話なのですが 「文化」なんて方に藩士を進めるつもりは毛頭ありません。
それは別の機会で 今回は論理的観点からの話です。
 
誰かの作ってくれたプログラムをネットを通じていただくときなどの話ですが
〜〜〜.zipだったり〜〜〜gzだったりと拡張子付きで届きます。
これはアーカイブという複数のファイルを纏めて一つのファイルにする技術でもあるわけですが 
圧縮してファイル容量を減らすという効果もあるわけです。
そのまま日本語と英語の比較であてはめてみると
たとえば「目」がeyeと三文字になるわけです。
何でもいいのですが 最近は外来語が増えて「カタカナ言葉」が多くなって圧縮率は下がっていますが文字数は確実に圧縮することができるわけです。
ああ、そこのひとじゃあこの無駄に長い文章はなんだという突っ込みは無ですよ・・・
 
上記仮定通りだと 必ずしも日本語を使うことが効率の悪いことではなく短い文章で伝達ができるということであれば
文字認識力を上げるに注力するのではなく、情報量このままで認識率を上げる方に力を使った方が良いのでは?という考え方もあるわけです。
簡単な対策が「フォントを変える」なわけですが これは結構効果があります。
というのも、先日来海外産のAndroidを触っているとなのですが 「中華フォント」と言われるフォントを使っています。
これは中国語と日本語で同じ感じを使ったりするので それに寄ったフォントで微妙に日本人の感覚に合わないことがあるわけです。
これはどちらが悪い問うわけではなく さっきの林と森の話と同じで この二つの文字があるから 林の時は横幅を縮めて森の時には縦も縮めるなどの加工を文字に合わせてしているからで それが国によって異なることによって起きたりするわけです。
ひらがなの「え」が無ければ「之」という字ももう少し柔らかくフォントを作ることができるようにです。
それがたまたま日本語に対して 読みやすいか読みにくいかの問題である。
で、Lynxはシャープの端末で そういう意味では読みやすいフォントが実装されています。
中国の人に見せたら なんだか変と言われるかもしれないがである。
パッと見たとき頭の中で理解するまでの時間が短くてよいのである。
こういう試みは非常にありがたい訳なのです。さすが日本の・・・・・
 
ですが 認識率が上がったところで端末の画面サイズは変わらない。
文字をおっかけていて目が疲れるのは変わらない。
画面が小さいときには・・・・
やはり認識率を上げるためには画面サイズを大きくして・・・・って
年取ったってことかしら??


written by HatenaSync