[Japanese|English]
訓練済みの機械学習モデルを全く新しい環境で運用するには、再訓練のために正解ラベルを含めてデータを取り直す必要がありますが、それは非常に高コストです。ソースフリードメイン適応技術は、一度訓練されたモデルを新しい環境の正解ラベルなしのデータのみを用いて、その環境に適応させる技術であり、その有用性から注目を集めています。この研究では、ソースフリードメイン適応技術について、既存の研究では未解明であった、なぜソースフリードメイン適応が可能なのかについて、理論的な解釈を示すとともに、改良した新しい手法を提案しました。

これまで個別に提案されてきたソースフリードメイン適応手法に対して、異なる研究領域で示された自己訓練の理論を用いて統一的な解釈を提示しました。この新たな解釈から、ソースフリードメイン適応では一貫性の訓練と多様性の訓練を同時に行うことが重要であることがわかりました。また、理論的な解釈から、一貫性の訓練に用いるデータ拡張の調整と一貫性と多様性の訓練のバランスをうまくうまく調整する要素が新たな知見として得られました。

この研究では、得られた知見に基づき、既存のソースフリードメイン適応を改良する手法を提案しました。それぞれ知見は、データ変形器をモデル訓練の進みに合わせて自動的に調整する方法と、モデル訓練に用いられる一貫性と多様性の損失を自動的に調整する手法として実現しました。

ソースフリードメイン適応は、ラベルありデータのプライバシー・著作権などの保護や、新環境への柔軟な適応を可能とする、実用性の高い技術として注目されています。本研究が解明した理論的解釈は、技術の信頼性を向上させ、新たな技術創出の基盤にもなりうることが期待されます。
三鼓 悠 (Yu Mitsuzumi)
コミュニケーション科学基礎研究所 メディア情報研究部 メディア認識研究グループ