ニュース
東芝、音声や映像から人の意図と状況を理解して人に伝えるクラウドサービス
2015/07/03 19:03
RECAIUSは、人がICTを意識して利用するのではなく、ICTが人の意図や状況に合わせて適切に動作するための仕組みづくりを支援するもの。同社が長年培った音声認識、音声合成、顔・人物画像認識、知識処理技術を融合して、これらの能力を最大限引き出せるよう、必要な知識を日々進化させることが可能なクラウド上で構成されている。さまざまな言葉の表現や人の動き・態度から意図や状況を理解して、要約、翻訳、音声対話、音声合成を利用して、人にわかりやすく伝える。例えば、カメラに写った人に合わせて情報を提示する案内システムや、音声記録をテキスト化して重要な発言だけをチームで共有するなど、幅広い業務や用途で活用できる。
RECAIUS音訳エディタ「DaisyRings(デイジー・リングス)」は、視覚障がいやディスレクシア(識字障がい)により文字を読むことが困難な人のための音訳コンテンツを、簡単に作成できるクラウドサービス。ウェブブラウザ上で、テキストをアップロードして音訳でき、編集結果をDAISY形式のファイルでダウンロードできる。音声合成の読みやアクセントも簡単に修正できる。図書館や学校、行政機関での利用のほか、一般企業でも製品マニュアルなどドキュメントの音訳に利用できる。
RECAIUS音声書き起こしエディタは、講演や会議などの録音データをブラウザ上で人が聴いて書き起こす作業を支援するサービス。アップロードした音声データを再生しながらテキスト入力する際、テキスト未入力の箇所を特定して自動的に音声を再生したり、音声認識によるテキスト入力の候補を提示したり、話者の切り替えを推定したりすることで、音声をチェックしながら書き起こしを効率よく行うことができる。
今後は、RECAIUS音声ビューア、RECAIUS音声クリエータ、RECAIUS音声対話、RECAIUS同時通訳、RECAIUS人物ファインダの各サービスをSaaSで提供していく予定。さらに、RECAIUSの次世代サービスの充実に向け、同社の研究開発センターでさまざまな技術開発に取り組んでいる。その一例として、話者の音声に似た声で多様な感情音声を生成する「感情つき似声生成技術」や、カメラで撮影した看板・標識・メニューなどの画像から複数文字列を同時に認識する「情景文字認識技術」などを開発しているという。
- 1
関連記事
東芝、分散処理でIoTの課題を解決へ、クラウドからセンサーへの“下り”制御を重視
東芝ソリューション クラウド型ビジネスへシフト グループ連携を機に促進
東芝 クラウド&ソリューション社 クラウドの発展に寄与するポートフォリオを提供 「ストレージイノベーション」の実現へ