人々の属性情報を「デジタル・フットプリント(足跡)」から高い精度で予測する研究がある。スタンフォード大学のミカル・コジンスキー(Michal Kosinski)助教らは2013年に「個人の特性と属性は、人間の行動のデジタル記録から予測可能」と指摘していた。

ケンブリッジのThe Psychometrics Centreに当時所属していたコジンスキーらは、Microsoft Research Cambridgeと共同で、myPersonalityアプリケーションを介して自分のいいね、人口統計プロファイル、心理測定テスト結果を志願した58,000人を超える米国Facebookユーザーのデータセットを分析した。myPersonalityは、2007年にDavid Stillwellによって作成された人気のFacebookアプリケーションで、ユーザーが実際の心理測定テストを受けて即座に結果を取得できるようにしたものだ。

彼らはmyPersonalityから得られた「いいね」を5つの因子に要約し、彼らはいいねをした人の属性を予測した。Kosinskiたちは利用者の属性のほかに、知性、感情的安定性、開放性、外向性などの性格特性についてもテストした。このような潜在的な特性を測定することははるかに困難ですが、分析の精度は驚くべきものだった。「いいね」だけを観察することは、個人の実際の性格テストスコアを使用するのとほぼ同じくらい有益であることが明らかになったとKosinskiらは説明する。

いいねの数の中央値は1人あたり68だった。つまり、68程度のいいねがあれば、その人の人となりを深く分析することが可能だ、と言える。

研究の結果

民族の起源と性別で最高の精度が達成された。 アフリカ系アメリカ人と白人系アメリカ人は参加者の95%で正しく分類され、男性と女性は参加者の93%で正しく分類された。これは、いいねで表されるオンライン行動のパターンがこれらのグループ間で大幅に異なり、ほぼ完全な分類が可能であることを示唆している。

キリスト教徒とイスラム教徒は、参加者の82%で正しく分類され、民主党と共和党(85%)で同様の結果が達成された。 性的指向は、女性(75%)よりも男性(88%)を区別しやすく、異性と同性愛の男性の間で(オンライン行動から観察される)より広い行動格差を示唆する場合がある。

Fig. 1. Prediction accuracy of classification for dichotomous/dichotomized attributes expressed by the AUC. Source: Michal Kosinski, David Stillwell, Thore Graepel. Private traits and attributes are predictable from digital records of human behavior. 2017.

コジンスキーらは、Facebookの「いいね」を使用して、性的指向から知性に至るまで、さまざまな人々の個人属性を自動的かつ正確に推測できることを示していると主張した。 Facebookの「いいね」と、閲覧履歴、検索クエリ、購入履歴などの他の広範囲のデジタル記録には類似性があり、これらを用いれば、ユーザーの属性を明らかにする可能性がより深まる可能性を示唆している。さらに、この研究で予測された多種多様な属性は、適切なトレーニングデータが与えられた場合、他の属性も明らかにできる可能性があることを示している。

コジンスキーらはユーザーの個々の属性と好みを予測することで、多数の製品とサービスを改善できることを示唆する。一方で、行動のデジタル記録からの個々の属性の予測可能性は、個人の同意を得ることなく、また気付かずに容易に多数の人々に適用できるため、プライバシーやパーソナルデータの保有に関する深刻な問題を引き起こす可能性にも言及している。「デジタル露出に対する意識の高まりは、人々のデジタルテクノロジーの経験に悪影響を及ぼしたり、オンラインサービスに対する信頼を低下させたり、デジタルテクノロジーの使用を完全に阻止したりするリスクがあります」と論文は指摘している。

参考文献

Michal Kosinski, David Stillwell, Thore Graepel. Private traits and attributes are predictable from digital records of human behavior. 2017.

Photo by h heyerlein on Unsplash