(2008/10/23 電子情報技術産業協会(JEITA)主催
Speech Technology:Today and Tomorrow 招待講演)(
1)(
2)(
3)(
4)(
5)(6)(7)(8)(9)
6 音声認識ソフトの問題点
便利な音声認識ソフトでもいくつかの使いにくさがあります。わたしは、新しいソフトが出るとすぐに買って試します。使用時間の半分くらいは、メンテナンスです。それが面倒なところです。それがちょっと大変なのです。
でもひっくり返して考えたらどうでしょうか。これは「たまごっち」のようなソフトなんですよ。育つんです。うまく育つこともあるし、突然、変な癖がついてしまうこともあります。変なことばを覚えてしまうんです。
あるとき、「このようになる」というフレーズの「なる」が「成田山」の「成」に変換されるようになりました。ドラゴンスピーチの場合です。何回、直しても治りません。それで、思い切ってスピーチファイルを新しく取り替えたのです。もう半年も使い込んだファイルなのですが、新しいものを作ろうと決意しました。それがかえって良かったのです。その後、うまく育ちました。
つまり、これもソフトの問題ですが、使い始める前に、トレーニングあるいはエンロールといいますが、何かの文章を読み上げないといけないのです。これによってユーザーの声の特徴を学習するわけです。これをなくしたのは一番新しいソフトのAmiVoiceです。しかし、実際には必要なのです。それで使い始めのときには、しばらく変換にもたつきがあります。
ユーザーにとっては、最初のトレーニングやエンロールがどのような性格なのか見当がつかないのです。どんなテンポで、どんな区切り方で、どんな発音で読んだらいいか。読みまちがいはどうするかなど、見当がつきません。マニュアルではそのあたりが詳しくないのです。どういう読み方をすると、本来の学習になるのか、初期にうまく行くのか、それがわからないのです。つまり、ソフトの学習機能の全体像がわからないのです。
ユーザーもまったく新しい体験をするわけですから、早く全体像を知りたいわけです。ところが、それがわからないのです。どうやって読んだらいいのか、わからない。
それで、ついつい「わ、た、し、は……」などと一音ずつ区切ってしまうのです。コトバは単音のつながりであるから、細かく区切れば分かるだろうと思うのです。「わ」と言ったり、「わたしは」と言っても出ない。「わたしは」と繰り返しても出ない。それで、「なんだこれは……」といった感想を持ってしまいます。それで、ついに使わずにしまいこんでしまうことになります。(つづく)
◎私が使用中の、(1)マイク、(2)USBデバイス、(3)AmiVoice SP(マイク無し)
(1)
ELECOM イヤフォン付きマイクロフォン MS-HS59SC

おすすめ平均 
音、はいいです
マイクだけ
性能は問題ありませんでした。
まあ安いからいいけど
ずいぶんと前から
Amazonで詳しく見る by G-Tools
(2)
Creative USBオーディオ Sound Blaster Play! SB-PLAY

おすすめ平均 
僅かの投資で、音は、不満→ 満足へ!
簡単でコストパフォーマンスも最高
もはや定番
Amazonで詳しく見る by G-Tools
(3)
AmiVoice SP USBマイク無
エムシーツー 2010-07-23
売り上げランキング : 526
Amazonで詳しく見る by G-Tools