音声合成・変換技術

豊かな表現の音声で伝える

音声には、言語情報(発話している内容)だけでなく、発話者の話者性、性格、感情、発話様式等の多様な非言語的な情報が含まれています。また人はその時々の状況に応じて、感情や発話様式を適切に変化させることで、円滑なコミュニケーションを実現しています。

私たちは、このように多様な情報を含む音声を、コンピュータにより高精度に生成・変換する技術に取り組んでいます。具体的には、以下の内容に取り組んでいます。

  • 少量の音声に含まれる非言語的な情報を任意テキストの合成音声や任意話者の音声に反映する音声合成・変換技術
  • 人対人、人対機械の対話の文脈から適切な非言語的情報を生成し合成音声へ反映する音声合成技術
  • 異なる言語間で一貫した非言語的情報を含む音声を生成する音声合成技術