スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

高精度高速音声入力装置が開発か。98%の正確な認識。

 北九州市のロボットを専門に開発してきた中堅ベンチャーのフェニックスロボテクニクスが、ロボットとの対話の研究を通じて培ってきた音声認識技術と、画像認識技術を使って、画期的な音声認識技術を開発したようです。
 従来の音声のみを使った音声認識では、認識率は70%程度であったのが、音声と画像認識を統合した新しく開発された高速演算アルゴリズムで、話した言葉を98%の確率で認識できるようになったようです。必要なシステムはPCIエクスプレスバスの認識演算補助ボードと、新たに開発された口と顔のの形状認識するためのカメラで、当面は10数万円の価格だが、マザーボードに搭載できるICチップの量産が実現すれば、数千円のコスト販売できる見込みだそうだ。量産の見込みは今年の秋以降だそうだ。
 十数分のパソコンとの音声による訓練をすると、かなりの早口でも文字が入力でき、修正も片手で操作できるハンドパッドで簡単にできるので、テキスト入力やプログラム入力をするときに片手が空く。アイスクリームでも食べながら、あるいは紅茶を片手で飲みながら、プログラムを入力したり、小説を書いたりすることができるようになる。
 なお現在実験したのは、雑音の少ない場所での実験なので、雑音の多い場所で音声をどう識別して雑音をキャンセルするかが今後の検討課題であるが、これも時間の問題だろう。
 この点については、マイクを声帯にもっとも近い位置に密着させて、外部マイクとの入力信号との出力および位相差を分析比較をすることで外部ノイズをほとんどキャンセルするという技術が実験レベルでは確立しているという。

 小型化が進めば、しゃべった言葉をすぐに外国の言葉に翻訳して音声出力することも可能で、今後は小型化、省電力が課題となるそうだ。
 英語がしゃべれなくて海外でのビジネスに一歩他国に負けていた日本のビジネスマンにとっても、救いとなるはずだ。
 また工作機械に取り付ければ、人間のいうことをおとなしく聞く機械が実現することになる。

 円高で国際競争力がますます問題となっている今日、このような他国の追随を許さない技術が、日本の生き残りを図る救世主になるかもしれないと、さまざまな分野の研究者が注目しているそうだ。

コメントの投稿

非公開コメント

FC2カウンター
プロフィール

dongwcat

Author:dongwcat
FC2ブログへようこそ!

最新記事
最新コメント
最新トラックバック
カテゴリ
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QRコード
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。