自動ニュース作成G
認識率98.66%?!たった2ヶ月で手書き日本語のOCRを開発したノンジャパニーズに話を聞いてきた
https://bita.jp/dml/reactive_int
2016-06-15 19:51:48
>実際に開発に携わったのは、全部で4人。なんと日本語の読み書きはほとんどできないそう。まず、なぜそもそも日本語を対象にしたのかってところをストレートに聞いてみました。
>―David 日本語は世界で最も難しい言語のひとつと言われていて、OCRの開発が上手くいった前例もないから、とてもチャレンジングで面白いと思ったんだよ。ビジネス観点で見ても、システムの開発に成功すれば必ず大きなニーズがあるってわかっていたからね。
・ちゃんと直接取材してるところはいいね
・98.66って低すぎだろ、原稿用紙1枚読み込むと6文字弱も違ってるんだろ? それとも日本語だとこれでも高いの?
・10年ぐらい前のOCRソフトは文庫本の一行に3文字4文字の誤字は当たり前だったような記憶
・こええなあ。手書きメモのテキスト保存が進みそう。なんだかんだと手書きメモは現役だから
・怖いのか?
・中国に外注してる会社有ったと思うけど、こういうの進歩するとそういうのも失業か。
・断言する。絶対無理。日本人が木星に行く方が早い>今後の普及のために特に日本がすべきことは、もっと情報を集積、統合的に管理して、公開手順を簡単にすることだね。
・日本人の情報共有意識の低さはもう思考に根付いてるレベルだからな
・活字だともっと認識率高そう。
・FAX使ってるうちは無理だろ
・初音ミクみたいなのは皆公開してるんじゃないか?企業が業務として開発するのと趣味で開発するので違うんだと思う。
・#8 漫画アニメのwikipediaは充実してるぞ
・クサチュー語みたいなのがどう認識されるのか気になる。 >間違えやすいものを文脈から自動修復する