ニュース
NTTテクノクロス、深層学習を活用した音声合成ソフトの最新版
2017/12/06 14:36
新バージョンでは、NTTメディアインテリジェンス研究所が開発した深層学習(DNN)を国内で初めて活用。最新の音声合成技術と音声のデータベースにより、少量の音声データから人の声と遜色ない肉声感・明瞭感のある自然な音声を作成できるようになった。
イントネーションや声質の元となる既存の大量の音声データベースを利用して、DNNを活用した音声合成をすることで、今まで困難であった声の特徴を忠実に再現した自然な音声を作成することができる。また、既存の大量の音声データベースとDNNを活用し、話者が違う音声のデータから読み方やアクセントを補うことで、所望の話者の少量の音声データからその話者の自然な音声合成を実現する。
いままで音声合成では置き換えが難しかったナレーションやガイダンス作成・電子書籍の読み上げなど、大幅な用途拡大を見込んでいる。
- 1
関連記事
IMVとNTTテクノクロス、「ラムダバイブロ分析システム」を開発
NTTテクノクロスとNEC、「リビングラボ」を活用し子育て支援のアイデア創出