新しいデジタル プラットフォームやサービスの登場に伴い、オンラインでユーザーの情報を安全に保つという課題はますます複雑になっています。新しいテクノロジーには、新しいプライバシー ソリューションが必要です。Google は、プライバシー強化テクノロジー(PET)への注力を続けています。PET はデータ処理の重要なタスクを解決する最先端ツール ファミリーであり、個人情報のプライバシーと安全性を保証します。
ここ 10 年間で、私たちは製品スイート全体に PET を組み込み、PET を利用して社会的課題に取り組むとともに、世界中のデベロッパーやリサーチャーがオープンソース プロジェクトとして PET を自由に活用できるようにしてきました。
本日は、差分プライバシーの最新情報をお知らせします。差分プライバシーは、プライバシーを保護しながらデータセットを分析できる数学的フレームワークで、個人情報が決して漏洩しないようにするものです。
差分プライバシーは、ほとんどのユーザーには知られていない PET ですが、無名のヒーローの 1 つとして、現在特に広く使われているテック機能を支えています。しかし、ほとんどの PET がそうであるように、業界での差分プライバシーの導入は、さまざまな理由で困難になる可能性があります。たとえば、技術を組み込むのが複雑である、スケーラビリティに制限があり大規模アプリケーションに導入するのが難しい、コンピューティング リソースのコストが高いといった理由です。
Google はこの 1 年で、30 億台近いデバイスという世界最大の差分プライバシー アプリケーションを実現しました。このテクノロジーによって、Google Home や Android の Google 検索、Messages などのプロダクトが改善され、全般的なユーザー エクスペリエンスも向上しています。
たとえば、Google Home の Matter デバイスのクラッシュの根本原因を特定し、顧客満足度の向上に役立てることができました。Matter は、スマートホーム エコシステム全体でスマートホーム デバイスのセットアップと制御を簡素化する 業界標準 です。Google Home が新しいデバイス タイプのサポートを追加し続ける中、私たちのチームは差分プライバシー ツールによって解明された分析情報を使用して、ホーム アプリの接続性に関する問題を発見し、迅速に修正しました。
この 30 億台のデバイスへの展開は、6 年以上にわたる当社の 「シャッフラー」モデル の研究によって可能になりました。このモデルは、「ローカル」モデルと「中央」モデル間でデータを効果的にシャッフルし、より大規模なデータセットでより正確な分析を実現すると同時に、最も強力なプライバシー保証を維持します。
私たちが PET へのアクセスを解放するという使命に着手したのは、5 年以上前に、基礎となる差分プライバシー ライブラリの最初のオープンソース版をリリースしたときのことでした。私たちの目標は、社内で利用しているさまざまなテクノロジーを誰でも自由に利用できるようにして、世界中のデベロッパーやリサーチャーの参入障壁を下げることです。
この取り組みの一環として、2 年前に初めて完全準同型暗号(FHE)トランスパイラをオープンソース化し、継続的に参入障壁を取り除いています。また、フェデレーション ラーニングや、秘匿マルチパーティ計算などのその他のプライバシー技術についても、同様の作業を行っています。秘匿マルチパーティ計算は、2 つの当事者(2 つの研究機関など)のデータを組み合わせ、基礎情報を明かすことなく結合データを分析できるようにする仕組みです。
2019 年以降は、新しいプログラミング言語でライブラリを公開してアクセスを拡大し、できる限り多くのデベロッパーに提供しています。本日は、Java 仮想マシン(JVM)向けの PipelineDP である PipelineDP4j のリリースについてお知らせします。この作業は、OpenMined との共同作業を進化させたものです。PipelineDP4j を使うと、デベロッパーが Java をベース言語として高度な並列計算を実行できます。すでに Java を使っているデベロッパーの参入障壁が低くなるため、差分プライバシーの新しいアプリケーションへの扉が開かれることになります。今回、JVM リリースが追加されたことで、Python、Java、Go、C++ という人気のデベロッパー言語のいくつかがカバーされ、世界中のデベロッパーの半数以上にリーチできるようになりました。
一部の最新差分プライバシー アルゴリズムは、Google トレンドなどの独自ツールの強化にも役立っています。私たちが開発したモデルによって、データ量が少ない言語 / 地域であっても、Google トレンドで細かく分析できるようになっています。差分プライバシー(と一般的なプライバシー保証)のデータセットは、個人データが漏洩しなくなる最低限のしきい値を満たす必要があります。この新機能によって、リサーチャーや地元のジャーナリストなどの専門家が、小規模な都市や地域でも詳しく分析できるようになるため、一番重要なトピックに注目できます。たとえば、ルクセンブルクのジャーナリストがポルトガル語の結果を問い合わせれば、これまで得られなかった知見を得ることができるかもしれません。
業界と政府の両方で、差分プライバシーの導入が広がっています。これは、プライバシーを考慮してユーザーデータを処理するという点において、大きな進歩です。ただし、導入が広がることによって、メカニズムの設計や実装に誤りが生じるリスクが増加する可能性もあります。この分野で開発されたアルゴリズムは膨大であるため、実装を手動で検査するのは現実的ではありません。重要な仮定なしに多様な技術をテストできる柔軟なツールが不足しています。
そこで、ライブラリ DP-Auditorium をリリースします。これは、アプリケーションの内部プロパティにアクセスせずに、メカニズム自体のサンプルのみを利用することで、特定のメカニズムが差分プライバシー保証に違反しているかどうかを担当者がテストできるようにするものです。
プライバシー保証を効果的にテストするには、2 つの重要なステップが必要です。1 つは固定データセットに対するプライバシー保証の評価、もう 1 つはデータセットを調査して「最悪の場合」のプライバシー保証を見つけることです。DP-Auditorium には、両方のコンポーネントに汎用性の高いインターフェースが準備されています。簡単かつ効率的なテストができるため、既存のブラックボックス アクセス テスターよりも常に高い効果を発揮します。一番重要なのは、インターフェースが柔軟に設計されていることです。リサーチ コミュニティによる貢献や拡張が可能なので、ツールのテスト機能は進化を続けます。
私たちは、PET への長年の取り組みを続けるとともに、デベロッパーやリサーチャーがユーザーデータとプライバシーを安全に扱い、保護できるようにします。