音声には、言語情報(発話している内容)だけでなく、発話者の話者性、性格、感情、発話様式等の多様な非言語的な情報が含まれています。また人はその時々の状況に応じて、感情や発話様式を適切に変化させることで、円滑なコミュニケーションを実現しています。
私たちは、このように多様な情報を含む音声を、コンピュータにより高精度に生成・変換する技術に取り組んでいます。具体的には、以下の内容に取り組んでいます。