SNSのボットを判別するのが難しい理由

ボットはSNSから切り離せなくなった。近年は陰謀論やヘイトを拡散したり、好ましい意見を拡散させたりする情報工作者としての側面に光が当たる。戦術の高度化によって判別は極めて難しくSNSの退潮に大きな役割を果たしている。

Twitterのボットの数は、イーロン・マスクが現在進めている440億ドルでのTwitter買収の最大の争点になっている。今月、この億万長者は、Twitterの「収益化可能なデイリーアクティブユーザー」の5%未満がスパムまたは偽物であるという同社の主張（最新のSEC提出書類に記載）を裏付ける詳細を受け取るまで、買収を「一時的に保留」にするとツイートした。

マスクはまたTwitterのフォロワー100人をサンプリングしてボットの数を確認するという、ボットを自ら数える計画の概要を説明し、このアプローチではアカウントの20パーセント以上が偽物であることを示唆しているとツイートした。

Twitter CEOのパラグ・アグラワルのツイートによると、近年、自動化されたアカウントはより洗練され、複雑になってきている。多くの偽アカウントは、機械だけでなく人間によって部分的に操作されていたり、もともと人間が利用していたアカウントの中身が機械へと入れ替わったりしている。アグラワルによると、同社は毎日50万以上のスパムアカウントを停止しており、「通常、利用者がTwitterでそれらを目にする前に」停止しているとのことだ。

Twitterにとってボットが有害になりうることを示した記念碑的な研究として、2014年の「The rise of social bots（ソーシャルボットの台頭）」がある。この論文では、南カリフォルニア大学（USC）のエミリオ・フェラーラ准教授が現代の洗練されたソーシャルボットの特徴と、その存在がオンライン生態系と社会をどのように危険にさらすかについて警鐘を鳴らした。2020年のその続編のひとつとも言える論文では、同年6月から9月にかけての2億4千万件以上の選挙関連のツイートを調査した結果、コロナウイルスやQアノン、ピザゲートなどの政治的陰謀論に関わるツイート全体の20パーセントをボットが占めているとのことだ。この研究では右寄りのボットが左寄りのボットを4対1の割合で上回り、右寄りのボットは誤った陰謀論を広める可能性が12倍以上高かったという。

終始トロールを繰り返すTwitterの帝王のマスクにとって、ボットは好ましい存在だった可能性がある。過去10年間、マスクがテスラの空売りと壮絶な戦いをしている間、ボットの軍勢が同社を助けに来ていたことがメリーランド大学ロバート・H・スミス経営大学院のデビッド・カーシュ准教授によって主張されている。

2013年11月初旬、テスラ・モデルSセダンの発火事故が相次いで報道され、同社の株価は暴落していた。すると11月7日の夜、75分の間に8つの自動ツイッターアカウントが息を吹き返し、テスラに対する好意的な感情を発信し始めた。その後7年間で、3万件以上のツイートが投稿された。

研究者たちは、ボットのツイートと株価の間に直接的な関係があるという証拠をまだ持っていない。また、3万件はTwitterの世界ではあまりに少ない数である。しかし、カーシュの調査では、ボットによるこの種の活動が、テスラの市場価値を従来の財務分析では正当化できないほどの高みに押し上げた「未来株」物語に大きな役割を果たしたと結論付けている。「ミーム株」に熱狂する市場では、セクシーな物語が財務分析よりもはるかに有益であることが証明されていると彼は主張した。

米テクノロジー誌Wiredによると、マスクの提案する手法を検証するため、AI企業のIV.aiは、マスクの自動車会社テスラをTwitterでフォローしている100のアカウントを調査した。100個中20個以上のアカウントがボットである可能性が高いことが判明した。また、これらのアカウントで議論されているトピックを分析した結果、疑われるアカウントのいずれもが宣伝であるという証拠は見つからなかった。しかし、これらのアカウントの多くは、その後すぐに姿を消しており、Twitterがボットをかなり迅速に捕捉していることがうかがえるという。IV.aiのCEOであるヴィンス・リンチはWired誌に対して、怪しいアカウントの特定は本質的に主観的であり、ある程度の不確実性を伴うと述べている。

偽アカウントと格闘しているソーシャルネットワークは、Twitterだけではない。Facebookは毎年、数十億の偽アカウントを削除している。

しかし、Twitterのアカウントがボットであると確信するのは難しい。正規のユーザーはフォロワーが少なかったり、ほとんどツイートしなかったり、奇妙なユーザー名であったりするからだ。また、Twitter全体でどの程度のボットが存在しているのかを把握するのは、さらに困難だ。

マスクのアカウントに比較的高いボットスコアを与えたBotometerアルゴリズムの開発を主導したインディアナ大学のフィリッポ・メンツァー教授は、Wired誌に対して、100のアカウントをサンプルとすることはTwitterの日々のアクティブユーザーを代表するものではなく、異なるサンプルは荒々しく異なる結果を生むと指摘した。マスクの手法は「冗談だと思いたい」とメンツァーはこの方法論について述べている。

メンツァーらは、ボットを見分けるのは猫とネズミのゲームだと言う。しかも、偽アカウントは、説得力のある文章を生成し、首尾一貫した会話を行うことができるアルゴリズムを使用するため、将来的に難易度が著しく高くなる可能性があると付け加えている。

Twitterは、各アカウントに関するより多くのデータにアクセスできるため、機械学習を使ってボットを発見するのに適している。これには、ユーザーの全活動履歴や、使用するIPアドレスやデバイスの違いなどが含まれる。しかし、2011年から2013年までTwitterでスパム検出を担当した機械学習の専門家であるDelip Rao氏は、この仕組みを明らかにすると、個人データやプラットフォームの推薦システムを操作するために使用できる情報が開示される可能性があるため、同社が明らかにできない可能性があると述べている。

参考文献

Emilio Ferrara, Onur Varol, Clayton Davis, Filippo Menczer, and Alessandro Flammini. 2016. The rise of social bots. Commun. ACM 59, 7 (July 2016), 96–104. https://doi.org/10.1145/2818717
Ferrara, E., Chang, H., Chen, E., Muric, G., & Patel, J. (2020). Characterizing social media manipulation in the 2020 U.S. presidential election. First Monday, 25(11). https://doi.org/10.5210/fm.v25i11.11431