連合学習
連合学習(Federated Learning)とは、機械学習モデルを開発する手法の一つである。学習用データを一つの拠点/サーバーに集約せずにモデル開発が可能な手法であるため、プライバシーを確保しながらモデル構築可能な点が大きな特徴。
本開発手法は、2017年にアメリカGoogleが提唱したものである。
従来の機械学習でのモデル開発では、学習用データが多ければ多いほどより優れたものとなるため、多数のサーバーや拠点などに存在するデータを1カ所に統合し、開発に用いていた。一方で連合学習は、各拠点/サーバーにある学習用データそのものではなく、学習用データで得られたモデルの変更点を集約することで、個人情報などの外部と共有できないデータを扱いながらも、プライバシーや情報の機密性が保たれたままで開発が可能となる。
連合学習におけるモデル構築の大きな流れは以下の三つであり、これを繰り返すことでモデルの性能を徐々にアップデートすることができる。
(1)中央サーバーより学習前の機械学習モデルを各拠点/サーバーに配布。
(2)各拠点/サーバーで持つ学習用データを用いてモデルを訓練し、元々のモデルとの差分を中央サーバーに戻す。
(3)中央サーバーで各拠点/サーバーより受け取ったデータを集約し、モデルを更新する。
連合学習の用途例として挙げられるのが、創薬AIの取り組みである。新薬開発において、複数企業間で各社の持つ医薬品などの原料となる化合物の構造データを活用することや、複数の病院が臨床試験に参加する(一般に病院で扱う患者のデータは個人情報に該当するため、合意が必要)といったことが事例となる。