データ分析 自動化技術
『RakuDA』チーム

Team RakuDA
第二推進プロジェクト
(2018年11月取材時点)

データサイエンティストの試行錯誤を
自動化する機械学習フレームワーク『RakuDA』を開発。

『RakuDA』チーム

―SICにおける第二推進プロジェクトの研究領域について教えてください。

境:第二推進プロジェクトの研究領域は、深層学習や機械学習といった分野になります。我々のチームが担っているのは機械学習の部分です。機械学習の前処理や、アルゴリズムの選択とそれらのパラメータを自動的にチューニングする技術などを研究しています。その他、商用化にあたり課題となるコスト軽減に向けた深層学習基盤の研究や、コネクティッドカー等の次世代モビリティ社会で求められる動くセンサーデータの大規模蓄積と、緯度と経度、時間を用いた高速検索を実現する時空間データ管理基盤技術の研究など、様々なテーマに取り組んでいます。

『RakuDA』チーム

―データ分析自動化技術『RakuDA』は、どのような経緯で開発されたのですか?

塩田:もともと我々は、事業会社と協力しながら、彼らの抱えているデータに機械学習を適用し、新たなビジネスを創出するための基盤構築や分析支援などを行なっていました。そのなかで、データサイエンティストたちの日々の業務を見ていると、皆が同じような分析を繰り返し行なっていることに気付き、その部分をうまく抽出して自動化してあげると、彼らの業務量も減って嬉しいのではないかと考えました。また、研究を始めた2015年頃は「ビッグデータ」というキーワードとともにデータ分析に対するニーズが高まっており、そこに時代の要請があるのではないかと考え、データ分析自動化技術に着目して研究を続けてきました。プロトタイプ自体は2017年初旬にはできていたのですが、実際にこのプロダクトをリリースしたのは2018年ですので、開発期間は長期におよびました。

及川:2年程度、研究やプロトタイピング、そして実験を行ない、有効性を確認してから、2017年度に初期開発を実施しました。データサイエンティストの作業のうち、自動化できる箇所を見つけてシステム化するのは難しく、いろいろな使い方が想定されるため、それに耐えうるようなインタフェースにしなければならないなど、考えさせられることも多かったです。やっていること自体は機械学習の様々なパラメータの探索領域を絞り込み、探索を複数のコンピュータで並列実行するシステムなのですが、これを最初から作るとなるとかなりの規模になるので、開発当初は品質や性能を安定させるのに大変苦労しました。

『RakuDA』チーム

『RakuDA』をもっと“広く”“深く”するために。
機能や性能改善の開発に取り組む。

『RakuDA』チーム

―このチームに課されたミッションは何ですか?

境:現在、社内では「データの民主化」という取り組みが広まっています。とはいえ、機械学習や深層学習という分野は、ある程度の知識がある人でないとそのモデルは作れないという問題があります。そこをもう少し簡単に、Excelで統計分析できるぐらいのレベルに敷居を下げようという課題意識を持ち、研究に取り組んでいるところです。現状でリリースされている『RakuDA』もかなり簡易化されていますが、依然として一定の専門知識が必要ですので、今後はさらに簡易化を進め、利用対象者を増加させるような研究開発を進めたいと考えています。一方で、深層学習におけるモデル自動構築などの研究も進め、技術の幅を深めていきたいと考えています。

石井:私はつい先日まで事業会社に勤務し、このプロダクトを受け入れる方の立場にありました。開発前に『RakuDA』の研究チームが事業会社に来てプロダクトの概要を説明してくれたことがあったのですが、研究から実用化までがスピーディで、データ分析のツールとしてすぐに利用できるような感じがしました。このチームに配属された今、優れたプロダクトを事業会社やお客さまへより便利に使ってもらうための戦略を立てることで、チームに貢献していきたいと考えています。

個々のスキルを組み合わせ1つのものを作り上げる。
それこそが、チームワークで得られる達成感。

『RakuDA』チーム

―チーム内で、それぞれどのような役割を担っていますか?

境:チームの方向性を決めるところが一番の仕事だと考えていますので、方向性を定め、メンバーが働きやすいようにリソースを整えるところを重点的にやっています。技術面は彼らの方が私の数倍も知識を持っているので、そこは任せるといった役割分担をしています。

石井:このデータ分析自動化技術をどう使うかという戦略や、同分野の今後の研究開発ロードマップの検討をメインで担当しています。また、既存プロダクトへの機能追加や性能改善のための開発プロジェクト管理を行なっています。

及川:開発の技術面や全体の設計を担当しています。加えて、リリースした『RakuDA』を実際に使ってもらうため、事業会社を訪問してのインストールや、使い方や分析の仕方をアドバイスするなど、コンサル業務も行なっています。

塩田:大学時代から機械学習を研究していることもあり、データ分析や『RakuDA』開発のアルゴリズム面を担当しています。2017年のリリースにより研究開発はひと段落ついたので、ディープラーニングのモデルを自動構築するための研究活動を始めています。

槇:データ分析自動化の領域拡大に向けた研究を担当しています。そのために、実際に事業会社を訪問して現場で『RakuDA』にデータを適用して課題を抽出しています。また、データサイエンティストとして、事業のパフォーマンス向上に貢献するデータ分析結果を事業会社へ提供しています。

『RakuDA』チーム

―チームで仕事をするうえでのやりがいや、仕事をしてきて嬉しかったことは何ですか?

塩田:データ分析の効率化や自動化という大きな目標に向かい、チーム一丸となって1つのプロダクトを作り上げることにやりがいを感じています。チームメンバーの持つ専門的スキルを踏まえ、自分たちの能力を最大限に発揮しながら、目標達成に向けて一緒に手を動かせることが楽しいです。

石井:このチームには、私の知識不足を補ってくれるメンバーがたくさんいます。世界を膨らませてくれたり、様々な刺激が受けられるので、自分が成長するうえでのプラスになりますし、生み出すもののクオリティも高くなっていると感じています。

境:それぞれ異なった専門分野を持つメンバーで構成されているチームですので、非常にバランスがいいと感じています。うまく組み合わせて最高のパフォーマンスを出していけたらと思っています。

機械でできる単純な分析はどんどん自動化。
人間にしかできない分析に力を入れられる世界へ。

『RakuDA』チーム

―『RakuDA』が世の中に与える影響やメリットはどのようなものですか?

石井:データサイエンティストの人材不足に対し、データ分析を誰もが簡単に実施できることは、この先非常に重要なメリットになると考えています。データを持っている人がその場ですぐに分析できるような世界を作ることで、データ分析からその結果としての事業活用までのリードタイムを短くし、事業自体のスピードアップや収益への貢献に繋げたいと考えています。

及川:データを分析する人も楽をしたいはずなので、このような自動化システムがあるのは大きなメリットです。機械で自動化できるような単純な部分はどんどん機械に任せて、人間はデータ分析など人にしかできないところに力を入れていくべき。そうすることで事業会社のパフォーマンス向上に役立つのではないかと思っています。

境:『RakuDA』が目指しているのはまさしくそういうところで、そのために必要な要素技術を1つずつ分解して研究していくことが大切だと考えています。我々はそれを一歩ずつ着実に取り組んでいきます。

Profile

『RakuDA』チーム

データ分析 自動化技術
『RakuDA』チーム

Team RakuDA
第二推進プロジェクト

境美樹

境美樹
Miki Sakai
主任研究員

石井方邦

石井方邦
Masakuni ishii
研究主任

及川一樹

及川一樹
Kazuki Oikawa
研究主任

塩田哲哉

塩田哲哉
Tetsuya Shioda
研究員

槇俊孝

槇俊孝
Toshitaka Maki
研究員