インターネット

ケンブリッジ・アナリティカが試みた群衆操作の全容

ケンブリッジ・アナリティカはFacebookから取得した個人情報、感情の性質などの情報を活用し、2016年のアメリカ合衆国大統領選挙と英国のEU離脱をめぐる国民投票における「説得可能な投票者」（Persuadable）の抽出に成功した。「群衆を操れる」という同社の主張には多くの疑問が残る。

米連邦取引委員会（FTC）は2019年7月、政治コンサルティング会社ケンブリッジ・アナリティカ（Cambridge Analytica=CA）を巡る個人情報の流出問題で、Facebookに50億ドル（約5400億円）の制裁金を科す和解案を承認したと、米国の主要メディアが報じた。この事件は報道の雨嵐のせいか、むしろ解像度が低い印象がある。日本でもかなり種類は異なるが就職活動の学生の情報をそのまま採用活動を行う企業に販売するという希有な出来事が起きており対岸の火事ではない。このため事件の重要だが効果的に伝えられていない要所をいまさらながらまとめてみることにした。

1. ケンブリッジ大学の研究者の役割

あらすじ

ケンブリッジ・アナリティカは、Facebookから取得した個人情報、感情の性質などの情報を活用し、2016年のアメリカ合衆国大統領選挙と英国のEU離脱をめぐる国民投票における「説得可能な投票者」（Persuadable）の抽出に成功した。彼らはFBのターゲティング広告を使い、説得可能者の投票行動を変容させるよう働きかけた。報道では、米国の複雑な選挙区や選挙人団という制度によって重要性を増した浮動票を動かすことに成功し、トランプの当選やEU離脱の多数派形成を成功させた、とされている。

Graph APIの果たした役割

CAがFacebookユーザーの個人情報の収集と、ユーザーの友人に関する豊富な情報を取得するのができたのは、FacebookのGraph APIの設計と機能によるものである。Graph APIは、サードパーティのアプリからFacebookの「ソーシャルグラフ」のデータを取り込んだりする手段であり、開発者レベルで利用されていた。

重要なことに問題の始まりとなったGraph APIは、多くの人が指摘しているように「バグではなく機能」として設計されていた。Facebookの目論見はGraph APIによりインターネット上の様々なエンティティを自らのエコシステムのなかに結びつけ、取り込んでいくことだったと考えられる。

Facebookページまたはユーザーアカウントはそれぞれ一意のIDを持っており、情報を取得するには、そのIDを直接クエリすることができる。マーケティング担当者、企業、研究者、法執行機関には、Facebookユーザーのアクティビティ、接続、感情状態へのアクセスと高度な検索機能が提供されたということだ。Instagramにも同様のGraph API機能がある。

FacebookのGraph APIは、大規模なデータ提供における革命だった。人とその好きなもの、つながり、場所、更新、ネットワーク、履歴、拡張ソーシャルネットワークを文字通り「オブジェクト」に変換した。会社の製品とユーザーが生成したデータをより経済的に活用可能にした。

Graph APIのバージョン1.0は2010年4月21日にリリースされた。バージョン1.0に2014年4月に廃止され、2015年4月30日にバージョン1.0を採用して開発されていたレガシーアプリに対しても完全に閉鎖された。

Facebookは、Graph APIの最初の実装で、サードパーティが利用可能な個人情報の量に問題があることに気がついた。しかし、彼らは巨大な収益源からマーケティングチャネルとビジネスパートナーを切り離したくなかった。そのため、2014年4月30日に、同社は開発者会議「f8」で、厳格な規則を採用するv2.0 APIを優先することを発表した。

4月の同日、同社はネット追跡および広告ターゲティング商品である「Facebook Audience Network」を発表した。簡単に言えば、この商品により、同社のデータプロファイリングと広告ターゲティングの範囲を、自社のアプリとサービスから他のアプリにまで拡張した、ということだ。この2010年から2014年はユーザーのモバイル移行が著しく進んだ時期であり、そのモバイルでの利用時間（Time Spent）におけるアプリのシェアがモバイルウェブを超えた時期である。Facebookは当初はHTML5に期待していたが当時のウェブ技術はまだ制約が多いために諦め、ネイティブアプリへと重心を動かしたのだ。その結果Facebookのモバイルにおける快進撃が始まるのである。その新しい競争空間が生み出す富をできるだけ獲得するための商品投入である。

”Two Billion People Coming Together on Facebook” Via Facebook Newsroom

Graph API バージョン1.0 の致命的な”脆弱性”

Facebook Graph APIのv1.0を問題のあるものにしているのは、その拡張されたアクセス許可だった。サードパーティアプリは、その利用の理由を説明することなく、膨大な範囲のユーザーの友人に関する情報をリクエストできた。1回承認されると、サードパーティのv1.0のSDKを埋めたアプリは、何年もの間、バックグラウンドに留まり、人々のデータ（および友人ネットワーク全体のデータ）を収集している可能性があるのだ。さらに、v1.0アプリはユーザーのプライベートメッセージの内容をリクエストすることもできる。

また、開発者は複数のv1.0アプリを操作できた。 v1.0 APIが実際のFacebookユーザーIDを返すため、アプリ開発者とFBのパートナーは、多数の異なるアプリとクイズにわたって収集された大量の個人識別情報を統合できたのだ。

Symeonidis、Tsormpatzoudi、およびPreneelの論文（2017）は、会社のv1.0 APIにより、サードパーティのアプリベンダーはユーザーの個人情報を取得するについてFacebookから同意を得ることができたが、Facebookユーザーは自分のデータの利活用について同意を求められなかったと指摘している。これが小賢しい人々をFacebookの保持する個人情報の採取に駆り立てた主たる理由だった。

行動科学、データ分析、アドテクの融合が生まれるまで

CAは、同じ問題に関するさまざまな広告をさまざまな人に見せることで、特定の投票をするようにユーザーを説得するサービスを提供する政治コンサル企業である。説得は、Facebookページのユーザーの「いいね」に関する情報を収集し、そのデータを使用して人格を予測するモデルを作成することによって行われた。Aleksandr Kogan率いるグローバルサイエンスリサーチはCAに個人データを提供した会社だが、同社のデータ収集方法はFacebookの利用規約に違反していることが判明したため、Facebookは2015年にCAを含むKoganがデータを提供したすべての企業に、すべて削除するよう依頼してはいる。

Facebook広告に対するCAの戦略を理解するには、行動科学、データ分析、革新的な広告技術（アドテクノロジー）がどのように結び付いているかを理解する必要がある。行動科学とは、人間または動物の行動に関する研究分野を指している。CAの最終目標は、ユーザーにクライアントへの賛成票を投じるように説得することだった。代表的なのが、行動の変化につながる可能性が高いメッセージを、彼らの画面に表示することだった。

政治の領域では、既存の信念と価値観に応じて、同じ候補者または問題を支持するさまざまなメッセージで異なる人々を説得することができる。このように、CAは、誰かの性格の指標があれば、最も説得力のある広告をキュレートできると仮定した。これにより、パーソナライズされたターゲット広告を使用して、特定の問題または候補について同じ意見を持つように、異なる性格を持つ多くの異なる人々を説得することができると、同社のCEOのNixは方々でプレゼンテーションをしていた。

行動科学の使用を通じて特定の方法で投票するよう潜在的な有権者を説得するには、広告のターゲットが誰であるかについての情報が必要になる。これを行うために、CAはまず何百万人ものユーザーに関する生データを取得する方法を最初に見つけなければならなかった。次に、そのデータを使用してユーザーの性格を予測する必要があった。ここで、生データから有用な情報を抽出する手法であるデータ分析が始まった。

CAは、ケンブリッジ大学の心理学者であり研究者であるAleksandr Koganに頼った。当時CAの従業員だったChristopher Wylie（後に内部告発をする）はKoganとの関係を管理していた。次に、Koganは回答者に性格について質問する調査を作成し、Qualtricsを活用した。Qualtricsは、参加者を獲得するために参加者を数ドルずつ支払うことで参加者を募集するサードパーティのオンライン調査ベンダーだった。アンケートでは、回答者がFacebookページのデータ（気に入ったページを含む）にアクセスすることについて同意を求めている。

Koganはすでに説明した「Graph API バージョン1.0」を利用しFacebookの開発者向けの機能を通じて、回答者の友人の個人情報へのアクセスも得たのだった。繰り返すが、Graph APIの2006年から2015年までのバージョン1.0では、特定のプライバシー設定をオフにしない限り、サードパーティがユーザーの友人のデータを収集できる。

Koganは最終的に約3,000万人分のデータを収穫した。その後、CAは各ユーザーのFacebookデータを使用して、ユーザーの性格を推定した。個性を定量化するために、5つの主要な特性を心理学の「ビッグファイブ」のモデルに従って採点した。各属性に対する各人のスコアは、各ユーザーのFacebookページのいいねを調べ、ページのいいねに基づいた性格の予測モデルを作成することによって決定された。

Facebookの広告技術を利用

最後に利用したのは近年著しく進化した広告技術である。広告技術は、行動科学とデータ分析を使用して得られた結果を取得し、高度に個別化されたチャネルを通じて視聴者に表示することを許容する。そのなかでも彼らが最も重用したのがマイクロターゲティングが可能なFacebook広告だった。

CAは接戦の選挙区を狙う戦術を得意としていた。有権者のインサイトから「説得可能（Persuadable）」を抽出して、その人の態度変容を迫るFacebook広告に巨額の予算を投じた。Facebookを利用する利点としてはFBがユーザーのデモグラフィック（属性）データを保持し、一人のユーザーがもつ複数のデバイスを一つのIDに統合できており、ターゲティング精度が高いことが上げられる。またこの特性からFacebook広告では一度抽出したクラスターのユーザーと類似する人々を抽出するのが容易でもあり、この種のキャンペーンをスケールするのを助けてくれる。

現代的な広告技術はターゲットに対して動的にクリエイティブを変えることを許容する。アドテクに卓越した企業の場合は、ページロードの最中にユーザーの嗜好に合わせて即時的に断片的な素材を組み合わせて広告クリエイティブを製作するため、その種類が数百〜数千通りにも達しているものだ。

このようなターゲティングを用いて掲出する広告の大半が相手候補を攻撃する内容だった。CAが保持する多数のクリエイティブのなかからどれを選ぶかは、先述した心理的洞察に基づいて行っていたと考えられる。広告掲出等のマーケティングのシナリオを事細かに設計し、その無数のシナリオを同時に展開することが現代の広告技術では可能である。

CAは「説得可能」を顧客側に投票させることもさることながら、ネガティブな広告を集中的に投じることで無投票に導く戦略も利用していた。トリニダードトバコの選挙では、CAはソーシャルメディアと動画メディアを利用して相手側に投票をしない抗議運動を作り、相手側の投票率を下げることに成功している。

CAのキャンペーンは消費財メーカーが行う広告キャンペーンと比べると、特異である。これは投票と購買の差と言えるかもしれない。消費者行動をめぐる条件も大きく異なる。選挙では人々が近く同じ時期に「どちらか」に投票することを条件としている。消費者による消費財の購入はある程度習慣化しているものの基本的には二つ以上の選択肢がある。CAの戦略が奏功した可能性がある事例はほとんど選択肢は二つである。選挙のとき、当選者は一人に限られ、数年は政治を執り行うことになるので、両者は激しく意見をぶつけることになり、確かに個々に心理的な脆弱性が生じている可能性がある。またCAの行う「相手候補の支持者を無投票に追い込めばいい」という戦略も通常のマーケティングでは用いられないのだ。

このような検証が曖昧な心理学の手法で、本当にユーザーの心理を理解できるのか、が疑問である。大規模なキャンペーンを実行すれば誤差は気にならないということだろうか。アメリカ大統領選挙とEU離脱のような、人々が二つの意見に割れ、興奮している状態では、おおつかみな心理のインサイトでも、相手の心を変容させてしまえばいいということだろうか。
公開されている情報だけではその効果を推定することは難しい。わかるのはトランプとEU離脱派が選挙に勝利したことであり、彼らがCAと契約していたことだけだ。
ケンブリッジ・アナリティカ事件の最も重要な意味合いは、二者間で争う選挙のような特定の条件のもとでは、人の脆弱性を攻撃し、その行動を操作することで社会に大きな損失を負わせることができる可能性を証明したことだ。

2. 誇大広告の可能性

ケンブリッジ・アナリティカ（CA）事件は民主主義に大きな衝撃を与えた。しかし、政治的目的のためのデータ操作に関する同社の主張と内部告発について、説明不足な部分が多々ある。「心理ターゲティング」が、実際にはどのように働き、どのような効果をもたらしかた、です。これは、データサイエンスが選挙に影響を与えることができるかどうかを問うことだ。

実際には、ケンブリッジ・アナリティカが喧伝する手法があまり効果がなかったのではないか、という懐疑が存在する。

ウプサラ大学の応用数学の教授デイヴィッド・サンプターはその著書『Outnumbered』（『数学者が検証! アルゴリズムはどれほど人を支配しているのか? あなたを分析し、操作するブラックボックスの真実』）で説明を試みており、CAはみずからの成果を誇張していると指摘しています。

内部告発者のクリストファー・ワイリーは、ケンブリッジアナリティカのソーシャルメディアデータと性格テストの結果の組み合わせを「心理戦争ツール」と見なしている。サンプターは、ケンブリッジアナリティカは、1980年代から数学者が使用した手法、いわゆる主成分分析と回帰分析を展開したことの有効性を測定しようとする。

サンプターは、The Observerがワイリーの告発を発表する前に書かれた『Outnumbered』では、心理ターゲティングの有効性を測定しようとしている。バンクシーやスペースインベーダーなどの魅力的な例をひいて彼が説明するところでは、数学自体はとても同じくらい簡単なもので、たとえばFacebookで仕事について投稿する人が家族についても投稿するかどうかを示す2次元の単純な散布図を作成するような方法だ。3つのカテゴリを使用すると、グラフを回転させてx、y、z軸の関係を確認できる。次元を追加すると、視覚化が不可能になりますが、多くの異なるカテゴリ間の関係を測定することができる。

複数の次元を扱う場合、回帰分析と主成分分析を使用すると、どのカテゴリ間の相関が最も強いかを判断できる。サンプターは、このアプローチの有効性をテストする。彼は、ケンブリッジ大学心理測定センターの協力を仰いだ。同センターに所属していた計量心理学者Mical Kosinskiは2013年にオンライン行動から属性、性的指向、性格を理解できるとする研究を発表、スタンフォードに移った後、ケンブリッジ大学のWu Youyouとともに2015年にFacebookのいいねからその人の性格を性格に把握できることを示した研究を発表している。これらの研究をCAは、協力を拒まれた後、真似していただ。

線形回帰モデルにすぎない？

サンプターはケンブリッジ大学心理測定センターで保持されているFacebookデータの同様のセットを使用して、20,000人のユーザーの匿名データベースにアクセスしたという。彼の調査結果は興味をそそるものだ。民主党員を特定する好きなFacebookグループには、ミシェルとバラク・オバマ、NPR、TED Talks、ハリー・ポッターが含まれる。共和党員はジョージ・W・ブッシュ、聖書、キャンプが好きだった。しかし、政治的な好みを表明したのは4,744人のユーザーだけだった。そして回帰モデルは、政治的選好を選択しなかったユーザーの4分の3、つまり選挙の結果を決定するであろう未決定の有権者は、自信の政治的選好を明らかにしていないのだ。

サンプターは他の主要な要因にも目を光らせている。回帰モデルは、人が50以上の「いいね」をした場合にのみ機能する。しかし、実際にそうしているユーザーは非常に少なく、18％にすぎない。最終的に、モデルは全体の60％でしか正確ではない。

本の厄介な結論は、私たちは皆、CAの後援者である、秘密主義のヘッジファンドの億万長者ロバート・マーサーに騙されているということだ。ルネッサンス・テクノロジーズの共同創業者の一人は、マインドコントロールと「心理戦争」の亡霊を生み出したのかもしれない。

Facebook所属中にユーザーの性格をプロファイリングし、その情報を使用して広告をターゲットする特許を出願した計算社会科学者のDean Ecklesは、アンケートを通じて心理特性を測定しても、それは、インタビュイーが本当に気にかけていることを測定できない場合があり（正直な回答を得られないような場合）、さらに、別のデータセットを使用してアンケートの結果と照合してその行動を予測したとき、それは、Facebookの「いいね」から5つの特性への次元の削減ではあるものの、他方で多くの情報を捨てている可能性がある、と指摘している。

トランプ陣営は戸別訪問部隊にアプリケーションをもたせており、その部隊がアプリに打ち込んだ、有権者の支持政党、投票意思などの、絨毯爆撃的に獲得したデータのほうが役に立っていた可能性がある。これらと有権者名簿、データブローカー等から得られる人口統計データ、購買履歴などを突合することで、浮動票を割り出し、Facebook広告でターゲティングするというオペレーションをとっていた可能性がある。

Outnumbered: Exploring the Algorithms That Control Our Lives by David Sumpter.

ただ単にFacebookのターゲティング広告が優れており、それに膨大な予算を使うことで、一定の成果が出ただけであり、CAは事後的に「われわれは選挙結果を覆した」と誇大広告している可能性すらある。

そしてロシアがどのように背後で暗躍していたのか、一部は明らかになっている。CAの戦略は発展途上国では効果てきめんのようですが、比較的社会制度が成熟した富裕国では必ずしもそうではない可能性がある。

3.「精神ハック」への懐疑論

CAの元データサイエンティストで内部告発者のクリストファー・ワイルの"Mindf*ck: Inside Cambridge Analytica’s Plot to Break the World"（マインドファック：世界を壊したCAの内幕）が2019年10月に出版されました。本書は未翻訳であり、あらすじは翻訳書ときどき洋書さんのこちらのブログを確認ください。あるいは、僕が書いたこちらのブログは、心理ターゲティングが選挙結果に及ぼした効果の評価を除いて、本書の内容を知るのに役立つ。

Christopher Wylie, Via Simon Fraser University (CC BY. 2.0)

ケンブリッジ・アナリティカ事件で注目されたのは、彼らが個性を定量化するために、5つの主要な特性を心理学の「Big Five」（OCEAN = オーシャン）モデルに従って定量化したことだ。CAの心理ターゲティングは主に、スタンフォード経営大学院の計量心理学者Mical Kosinskiらの先行研究を根拠にしている。

Kosinskiは2013年にオンライン行動から属性、性的指向、性格を理解できるとする研究を発表、スタンフォードに移った後、ケンブリッジ大学のWu Youyouとともに2015年にFacebookのいいねからその人の性格を性格に理解できるとする研究を発表していた。

Kosinskiとニューヨーク市立大学コロンビアビジネススクールの計算社会科学者、Sandra Matzらは、米大統領選挙後の2017年に人々の心理をターゲティングすることが、効果的であることを3つの研究を通じて示した。Matzらは、女性のFacebookユーザーは、消費者の外向的または内向的と推定される性質に基づいて構成された美容小売業者の投稿に対し、「いいね！」をより多く押す傾向があることを発見しました。3つの実験を通じて、推定される性格特性に一致するように調整された広告を表示した人は、一致しない広告を表示した人よりもかなり多くの商品を購入することを実証した。消費者が自分の性格を反映したマーケティングメッセージにより好意的に反応するという証拠です。Kosinskiらは、1つの仮説に対し3つの異なる実験を重ねることで、心理学の実験でしばしば問題にされる、再現性を確保したと主張する。この証拠はケンブリッジ・アナリティカが活用した扇動的な政治的なメッセージに対しても同様の結果を示す可能性を示唆している。

CAは政治広告サービスを改善するため、当初、ケンブリッジ大学の心理学者であり研究者であるAleksandr Koganに頼った。Kogan は当時同じケンブリッジ大学の The Psychometrics Centre（計量心理学センター）に所属していたKosinskiに着目しました。KosinskiはKoganの申し出を断ったため、Koganは、Kosinskiの研究の枠組みをそのまま利用することにし、データ収穫に関してはFacebook APIのクラックに頼ることにした。

ビッグ・ファイブ分析に疑問符

FacebookのGraph APIの2006年から2015年までのバージョン1.0では、特定のプライバシー設定をオフにしない限り、第三者がユーザーの友人のデータも収集できました。「六次の隔たり」と表現されるように、Facebookのネットワークは非常に緊密なつながりを含んでおり、友人のデータも収穫できることは、小さな母数でも大人数の人々のデータを収穫できることを意味している。Koganは最終的に約3,000万人分のデータを収穫した。CAは各ユーザーのFacebookデータを使用して、ユーザーの性格を推定した。個性を定量化するために、前述の「Big Five」モデルを採用した。

2010年から2017年の間にFacebookで働き、有権者の行動を研究したMITスローンスクールオブマネジメントの計算社会科学者であるDean Ecklesは、Facebookのデータのみを使用して、誰かのビッグファイブ特性のあり方を構築することが可能であると説明。彼は、心理的ターゲティングは、まったくターゲティングしない場合と比較して説得力を高めることができると考えている。しかし、Big Fiveと他の一般的に研究されている性格特性の違いは、人々が前者のターゲティングにより活発に反応することを説明するものではないと彼は言う。

Facebookは、かつて、ユーザーの性格をプロファイリングし、その情報を使用して広告をターゲットすることを特許出願し、ユーザーへの適用を検討したことがある、とBBCは報じた。Dean Ecklesは、2012年に最初に出願されたこの特許の申請者の一人。特許関連情報サイトJUSTIAによると、特許は「ユーザーのテキストから言語データを取得し、推測された性格特性は、ユーザーのプロファイルに関連して保存され、製品のターゲット設定、ランキング、バージョンの選択、およびその他のさまざまな目的に使用できます」と説明する。

特許の出願者であると同時にFacebook社内で生データに触ることができたEcklesは、Koganが採用した手法に懐疑的です。CAがFacebookのインハウスのターゲティング機能に加えてパーソナリティアプリで簡単な質問で得た知見を追加すると、ターゲティングの精度が低下した可能性がある、とEcklesはWiredの取材に回答しています。Ecklesは、アンケートを通じて心理特性を測定しても、それは、インタビュイーが本当に気にかけていることを測定できない場合があり（正直な回答を得られないような場合）、さらに、別のデータセットを使用してアンケートの結果を予測したとき、それは、Facebookの「いいね」から5つの特性への次元の削減のようであり、他方で多くの情報を捨てている可能性がある、と指摘する。「ソーシャルメディアデータに存在する人々の性格の痕跡はいくらかあるが、たとえば、広告主に本当の効果をもたらすデータのほとんどは、Cookieまたは以前の顧客の訪問から得た適切な情報です」と実際にはFacebookで働いていたEcklesは指摘している。

Googleのクリエイティブ、広告担当者はかつて、ソーシャルメディアでは、人は自分を偽る傾向が強く、マーケティングの役には立たない、と指摘したことがある。また、Facebookの広告商品のプロダクトマネージャーを務めたことのある、Antonio García Martínezは著書の『サルたちの狂宴』で、Facebook単体では、広告主を満足させるデータが得られない、と記述している。同書には、Martínezがデータマネジメントプラットフォーム（DMP）のブルーカイやその他のアドテク企業、データブローカーと面談し、情報を得ていた件があり、それが数年後にFacebookの広告商品に組み入れられている（関連ブログ）。

つまり、性格ベースのプロファイリングが、Facebookが既に提供している人々をターゲットにする無数の他の方法よりも良いかどうかは明確ではない。たとえば、Facebookは広告の自動最適化機能を提供し、さまざまデータソースから収集したデータを使用して、広告がクリックなどのアクションにつながるために最適なタイミングを予測する。収集元はサードパーティCookie等から獲得したWebの閲覧記録から、他のアプリベンダー、トラッキング業者との協力により獲得したモバイル行動のログ、データブローカーのオフラインデータとのマッチング等多岐にわたる。

このようなFacebook広告の機能は、Big Fiveなどのモデルよりも多くの次元でユーザーをセグメント化できる。消費者メーカーと広告代理店とのもみ合いの中で磨き上げられたFacebookのターゲティングは、心理ターゲティングを活用する必要性がない。

Facebookのデータがなくとも心理プロファイリングは可能

ケンブリッジアナリティカのCEOのAlexander Nixはサイコグラフィックマーケティングを使用しているとプレゼンテーションしてきた。しかし、NixはKoganの手法が役に立たなかったという発現を英国議会でしてもいる。

しかし、企業は、人々の性格のモデルを構築するために、Facebookの「いいね！」を必ずしも必要としない。前述したKosinskiらの2013年の研究によると、広告主は、人のデジタルフットプリントの他の側面をマイニングして、Twitterフィード、閲覧履歴、電話等の行動パターンなどを調べることができる。Kosinskiらの研究では、これらのデータはさまざまな結果を示しているが、性格を予測できることが示唆されている。

たとえば、米国に拠点を置く会社Crystalは、そのWebサイトによると、公開データを分析することで人格プロファイルを予測します。ロンドンに本拠を置くVisualDNAは、Webサイトで心理的プロファイリングも使用していると語っています。これは、4000万人が回答した性格クイズに基づいています（どちらの会社もケンブリッジアナリティカには関与していません）。CAは、人口統計情報と投票履歴、テレビ視聴習慣、購入パターンに関するデータを含むデータベースを使用すると主張しています。これらはすべて米国でデータブローカーから合法的に購入できます。

ただ単にFacebookのターゲティング機能に依存していた可能性

その後、ケンブリッジアナリティカは、Facebookの「カスタムオーディエンス」機能を利用し、Facebookを主に広告配信ツールとして使用して、他のデータを使用して構築された心理学的モデルに基づいて選択された特定の人々に、性格に合わせた広告を表示することができたのは確かだ。

カスタムオーディエンスとは、Facebookで広告を出稿するときに、広告主が独自に保有している顧客データとFacebookのアカウント情報を照合することで、ユーザーを絞り込んでターゲティングできる機能を指す。カスタムオーディエンス機能に含まれる類似オーディエンス（Lookalike）機能を使用すると、プラットフォームが特定のグループに類似していると他のユーザーを見つけることができ、プロファイルしていないユーザーをターゲットにすることさえできる。つまり最初に抽出したユーザークラスタと類似したクラスタを拡張できるため、CAは手元で膨大な有権者の分析をしなくても済んだのかも知れない。

つまり、喧伝していたパーソナリティ・プロファイル・モデルを使用せずに、Facebookの機能に依存して広告をターゲティングし、事後的に「心理ターゲティング」と自慢できる可能性が示唆される。ノースカロライナ大学の政治学者 Timothy Ryanは、ケンブリッジアナリティカが使用する広告のサンプルを見たことがあると言う。「それらは、ビッグファイブの特徴を念頭に置いて調整されているようには見えなかった」と彼は言う。

CAがその広告のターゲティング方法を明らかにすることはほとんどない。学者とジャーナリストのグループがCAからデータを取得しようとしたが、会社は秘密を守るために自らを閉鎖することを選択した。

一部の科学者は、プロセスをリバースエンジニアリングできる可能性があると考えている。しかし、2016年の米大統領選挙で起きたことは、CAだけで完結せず、もっと複雑なできごとが起きていた。ソーシャルメディアは悪用されましたが、その形跡は大量のデータとして残っている。悪意の人々がソーシャルメディアを使い人々を操作しようとしていたことへの探求は今も続いている。

4. 「人を操れる」と売り込み

CAの元取締役であるブリタニー・カイザーもまた回想録『告発フェイスブックを揺るがした巨大スキャンダル』を出版した（昨年12月には日本語に翻訳されている）。

Wylieの本は物事のデータ収集の側面に重点を置いていました（彼は、データの予測能力に夢中になっていたと言う）。対照的に、CAでのカイザーの仕事は、潜在的なクライアントへのピッチ（売り込み）を伴った。 CAのさまざまな悪行については、多くのことが言われており、カイザーはNetflixドキュメンタリーThe Great Hackの中心的な出演者として、さまざまな内部情報を広めている。

この回想録では、政治コンサルタントと技術内部告発者が、数十億ドル規模のデータ産業に関する不穏な真実を明らかにし、CAがプライバシー法の弱点を悪用した方法を公開している。ドラマチックなCAの盛衰について、カイザーが目撃したことが記録されており、彼女は、Facebookの緩いポリシーと十分な国内法の欠如が、英国と米国の両方で有権者を操作することをどのように許可したかを明らかにした。何もしなければ2020年の選挙でも同じことが起きる可能性がある。

カイザーは、政治に関心があり、高学歴で、中流階級、オバマの好意的な崇拝者だった。カイザーは米国エリート私立学校Phillips Andoverに通い、その後、30歳までに少なくとも博士号を含む一連の学位を取得する。カイザーは2007年の大統領選挙でバラク・オバマのメディアチームで働いています。また、人道主義を訴えるロビイストとしてアムネスティ・インターナショナルで働いた。

しかし、彼女が留学先から米国に戻ると、両親が貯蓄を失い、仕事を必要とした。カイザーは、秘密主義のクオンツファンドの共同創業者の億万長者で、ドナルド・トランプのパトロンであるロバート・マーサーが資金を提供しているCAに入社したとき、人権と国際関係論の4つ目の学位に取り組んでいる理想主義的な若い専門家でしたが、やがてCAが世界中で実行する「悪事」に関与するようになった。

彼女の主たる仕事は、政治家などの顧客への売り込みだった。CAのCEOアレクサンダー・ニックスは、彼女にPowerPointプレゼンテーションを作成してクライアントに売り込む方法を教えると、彼女はそれが得意であることが判明したのだ。そのプレゼンテーションの内容が、彼女の本が明らかにする、CAに関する最も新しい情報だ。

彼女はCAに在籍する間、両親にお金を注ぎ込んだり、社内政治に疲弊したり、絶望的に疲れたり、アドレナリンに駆られたりすることを告白している。特に2017年から2018年の間には、彼女が関与していた出来事への心配から、過度に飲酒していたことを認めている。

ケンブリッジ・アナリティカ事件に関連するAxionの記事

参考文献

Iraklis Symeonidi, Pagona Tsormpatzoudi, Bart Preneel (2017), "Collateral damage of Facebook Apps: an enhanced privacy scoring model"

デイヴィッド・サンプター. 『数学者が検証! アルゴリズムはどれほど人を支配しているのか? あなたを分析し、操作するブラックボックスの真実』. 2019.

『告発フェイスブックを揺るがした巨大スキャンダル』（ハーパーコリンズ・ノンフィクション）

Special thanks to supporters !

Shogo Otani, 林祐輔, 鈴木卓也, Mayumi Nakamura, Kinoco, Masatoshi Yokota, Yohei Onishi, Tomochika Hara, 秋元善次, Satoshi Takeda, Ken Manabe, Yasuhiro Hatabe, 4383, lostworld, ogawaa1218, txpyr12, shimon8470, tokyo_h, kkawakami, nakamatchy, wslash, TS, ikebukurou 太郎.