14日間無料トライアル

どこまで進んでる?音声認識システム!

一番身近な音声認識システムといえば、スマートフォンに取り付けられた音声認識機能になるかと思いますが、みなさんはこの機能を使ったことはあるでしょうか?自分たちが思っていた以上に音声を認識してくれ、初めて使った時にはその正確さに驚いた方も多いかと思います。そんな今回は、現在の音声認識システムは一体どのレベルにまで達しているのかについての情報をご紹介したいと思います。

2016年10月のCBS Newsに掲載された記事ですが、MicrosoftでAIを活用した製品やサービスの開発を目的とする部門「Microsoft AI and Research Group」の研究グループが開発した音声認識システムは、人間と変わらない精度で音声を認識し、文字に起こせるレベルに達しています。

CBS News

さらに詳しいレベルとしては、与えられた人間の音声を誤認識率5.9%の精度で認識することが可能となっており、これは人が話した内容を文字に書き起こす「文字起こし」を仕事とする人と同じかわずかに上回る精度となっています。しかし、音声の違いで誰が話しているのかを認識したり、周囲の騒音がある状況でもハッキリ認識するということはまだ難しく、今後の開発の課題となっています。

音声認識システムを頻繁に使っていますという方はまだ少ないかと思いますが、この技術がもっと進歩していけばコールセンターの電話対応は人ではなく機械へと代わり、身の回りにある家電にも備え付けられ、音声で操作ができるといった商品もでてくるかもしれません。また、体の不自由なお年寄りの方でも、音声で色々なものを操作できれば負担も減らせますし、防犯や安全といったセキュリティの部分でも利用が考えられます。

果たして今後、どのようなサービスや商品がでてくるのか注目してみてはいかがでしょうか?

この記事を書いたひと
D-SCHOOL オンライン編集部

プログラマー、英語教員、マーケッターなど多彩な人材から生み出されるD-SCHOOL オンライン。プログラミング教育や英語教育の最新情報、海外の情報など鮮度の高い情報をお届けします。