川原 尚己
近年では,機械学習をはじめとして様々なデータ活用技術が幅広い分野で応用されているが,データに含まれる人々のプライバシの保護が喫緊の課題となっている.局所差分プライバシは,データ活用技術におけるプライバシ保護手法の一つである.これまで様々な統計分析に対して局所差分プライバシを適用する試みがなされてきた.画像データセットに対しての局所差分プライバシ適用は,深層学習を利用する手法や,画像ではなく画像データから抽出した特徴ベクトルに局所差分プライバシを適用する手法がある.しかしながら,深層学習を利用する方法では計算コストが高く,特徴ベクトルを利用する方法では画像形式に対してのみ計測できる統計量を測定できなくなるという問題点が存在する.深層学習を用いずに,有用性とプライバシー保護のバランスを両立させる局所差分プライバシを用いたの画像データ匿名化手法は,依然として解決が困難な課題である.本研究では,有用性とプライバシー保護のバランスを両立させる局所差分プライバシに基づいた画像データ匿名化手法の構築を提案する.局所差分プライバシには,等しい強度のプライバシ保護を施しても,データセットの次元数が多いほどより大きなノイズが付加されるという性質があるため,効果的な次元削減が必要である.また,本フレームワークで利用する匿名化メカニズムは,メカニズムの値域が小さいほどノイズの付加量が小さくなるため,情報を損なわないような値域の削減も重要である.以上より,本フレームワークにおいては画素数とメカニズム値域という二種類の削減手法を適用してから,局所差分プライバシを適用するための手法を提案する.MNISTデータセット及びfashionMNISTデータセットに対し提案手法及び既存手法により匿名化を行った後,SSIMやMSEの測定及びCNNを用いた分類精度の測定による比較を行った.その結果,我々の提案手法は同等のプライバシ保護レベルにおいて,比較に用いた既存手法よりも柔軟に有用性とプライバシー保護のトレードオフを制御できることが判明した.