[Japanese|English]
生体情報・自然言語・画像などの様々なマルチメディアにおいて、潜在的な分化構造(擬時間に沿った枝分かれ構造)によって解釈することのできるデータ群が数多く知られています。代表的な例は生体における細胞の分化構造で、ヒトの細胞は初期胚から様々な組織や臓器へ分化していく能力を持っていることが知られています。このような分化のメカニズムが解明されていくことで、近い将来には万能細胞を所望の組織や臓器を誘導することができるようになり、臨床医学への応用が進むことが期待されています。
我々は、様々なマルチメディアデータに対し、そのデータの背後に潜んでいる潜在的な分化構造を推論するためのアルゴリズムの研究を進めています。
本手法は、教師情報や補助情報を用いずに、観測マルチメディアデータのみから潜在的分化構造をその不確かさを含めて推論することができます。
分化構造推論は機械学習・データマイニング、特に生体情報処理においては長年研究されてきている重要なテーマの一つで、様々な方法やアルゴリズムが提案されてきています。本手法の特徴は、特に以下の二つの未知の構造をユーザ・エンジニアの人手を介することなくデータ駆動的に観測データのみから推論することができる点にあります:
・未知の分化構造トポロジー:枝分かれの個数や枝分かれの均衡度合いなどの分化構造トポロジーは一般にアルゴリズムの調整用パラメータとして用いられることが少なくありません。本手法はこれらの分化構造トポロジーをデータ駆動的に推論します。
・未知の観測情報生成メカニズム:対象とするメディアやデータに応じて一般的にはアルゴリズムを調整しないといけない場合が少なくありません。本手法は、観測情報と潜在的な分化構造との間のブラックボックス変換をデータ駆動的に推論することのできる能力を持っています。
ヒトの細胞の分化構造メカニズムの解明は、近い将来の臨床医学の発展や人工臓器の実現への重要な手がかりになると期待しています。我々のグループは、引き続きマルチメディアデータ解析技術の発展をめざしていきます。
中野 允裕 (Masahiro Nakano)
コミュニケーション科学基礎研究所 メディア情報研究部 生体情報処理研究グループ