ByteDanceがウイグル語を検閲するアルゴリズムを開発しようとしたと、元従業員が主張

TikTokの親会社であるByteDanceの元従業員は、同社がウイグル語のライブストリームを検閲するアルゴリズムを開発しようとしたと主張している。

ByteDanceがウイグル語を検閲するアルゴリズムを開発しようとしたと、元従業員が主張

TikTokの親会社であるByteDanceの元従業員は、同社がウイグル語のライブストリームを検閲するアルゴリズムを開発しようとしたと主張している。

米ProtocolのShen Luとの匿名インタビューの中で、ByteDanceのコアデータ部門の中にある「信頼と安全」チームをサポートする中央技術チームに所属していたByteDanceの元社員は、TikTokの中国市場向け姉妹アプリであるDouyinのために、同社のモデレーションの取り組みを支援するツールを開発したと説明している。

「コアデータ部門は、主にショートビデオプラットフォームの技術開発に専念している。2020年初頭の時点で、私たちが作成した技術は、国内のDouyinとその国際的な同等のものであるTikTokを含む、中国内外での同社のコンテンツモデレーション全体をサポートしていた。製品チームには約50名のスタッフが、技術チームには100~150名のソフトウェアエンジニアが勤務していました。さらにByteDanceは、中国国内のコンテンツを監視するために、約2万人のコンテンツ・モデレーターを雇用していた。彼らは天津、成都(四川省)、済南(山東省)、その他の都市にある、社内で「基地」と呼ばれる場所で働いていた。バイトダンスの社員もいれば、契約社員もいた」(Protocol, "I helped build ByteDance's censorship machine - Protocol")

匿名の元従業員の仕事は、テクノロジーを使って、低レベルのコンテンツモデレーターの仕事を効率化することだった。例えば、ビデオクリップをデータベースに放り込んで、類似のコンテンツを検索できるツールを作ることだった。

元従業員は、バイトダンスが中国の検閲法に違反する可能性のあるコンテンツを迅速に削除するためのツールを構築していることについて説明した。「同人ユーザーがウイグル語を話すと自動的に検出して、ライブストリームのセッションを遮断するアルゴリズムを開発してほしいという要望を何度も受けた」と元従業員は語った。

「モデレーターはウイグル語を理解していないため、これを要求してた。北京語を話す人が理解できない民族言語や方言を話すストリーマーは、北京語に切り替えるように警告を受けることになる」。ユーザーが従わなければ、モデレーターは実際の内容に関係なく、ライブストリームを手動で切断することで対応することになるという。

実際には、削除されたコンテンツのうち、政治的な言論はごく一部を占めるにすぎなかった。中国のネット民は自己検閲に精通しており、何を言ってはいけないかを熟知している。ByteDanceのプラットフォーム - Douyin、Toutiao、Xigua、Huoshan - は、ほとんどがエンターテイメントアプリだ。ポルノ、淫らな会話、ヌード、グラフィック画像、呪いの言葉など、中国政府が道徳的に危険とみなすコンテンツを主に検閲しているほか、無許可のライブストリーミング販売や著作権を侵害するコンテンツも検閲している。

しかし、元従業員は、政治的な言論は依然として大きな問題となっている、と明らかにした。「中国のユーザー生成コンテンツ・プラットフォームが最も恐れているのは、政治的に敏感なコンテンツを削除できずに、後になって政府の厳しい監視下に置かれることだ。これは死活問題だ。ByteDance(バイトダンス)のコンテンツ修正システムが数分間停止することもあった。その数分の間にどんな政治的災害が起こりうるかわからないので、神経をすり減らしていた。若手のユニコーンであるByteDanceは、他のハイテク企業のように政府との強い関係を持っていないため、刻一刻と綱渡りをしている」。

「日々の検閲に関しては、中国のサイバースペース管理局がByteDanceのコンテンツ品質センター(内容质量中心)に頻繁に指示を出していたが、これは同社の国内のモデレーション業務を監督するもので、1日に100以上の指示が出ることもあった。時には1日に100以上の指示を出すこともあった。その後、別のチームに、進行中のスピーチと過去のコンテンツの両方に具体的な指示を適用するように指示を出し、それが許可されているかどうかを判断するために検索する必要があった」。

中国は、数万人のウイグル人が拘置所で拘束されている新疆ウイグル自治区の少数民族で宗教的にも少数派であるウイグル族のイスラム教徒に対する扱いを非難されてきた。

ByteDanceは中国最大級のユニコーンであり、短編動画共有アプリ「TikTok」、そのオリジナル中国語版「Douyin」、ニュースアグリゲータ「Toutiao」の生みの親でもある。昨年、ByteDanceが北京とのデータ共有をめぐる米国の論争の中心となった際には、TikTokを含む海外製品への国内エンジニアのアクセスを削除。TikTokは、ロサンゼルスとワシントンD.C.に2つの物理的なトランスペアレンシーセンターを開設し、コンテンツのモデレーションの実践を紹介する計画を立てている。しかし中国では、コンテンツの適正化はほとんど影で行われている。

700円/月の支援

Axionは吉田が2年無給で、1年が高校生アルバイトの賃金で進めている「慈善活動」です。有料購読型アプリへと成長するプランがあります。コーヒー代のご支援をお願いします。個人で投資を検討の方はTwitter(@taxiyoshida)までご連絡ください。

デジタル経済メディアAxionを支援しよう
Axionはテクノロジー×経済の最先端情報を提供する次世代メディアです。経験豊富なプロによる徹底的な調査と分析によって信頼度の高い情報を提供しています。投資家、金融業界人、スタートアップ関係者、テクノロジー企業にお勤めの方、政策立案者が主要読者。運営の持続可能性を担保するため支援を募っています。
Takushi Yoshida is creating writing/journalism | Patreon
Patreon is a membership platform that makes it easy for artists and creators to get paid. Join over 200,000 creators earning salaries from over 6 million monthly patrons.

投げ銭

投げ銭はこちらから。金額を入力してお好きな額をサポートしてください。

Pay Yoshida Takushi using PayPal.Me
Go to paypal.me/axionyoshi and type in the amount. Since it’s PayPal, it’s easy and secure. Don’t have a PayPal account? No worries.

Special thanks to supporters !

Shogo Otani, 林祐輔, 鈴木卓也, Mayumi Nakamura, Kinoco, Masatoshi Yokota, Yohei Onishi, Tomochika Hara, 秋元 善次, Satoshi Takeda, Ken Manabe, Yasuhiro Hatabe, 4383, lostworld, ogawaa1218, txpyr12, shimon8470, tokyo_h, kkawakami, nakamatchy, wslash, TS, ikebukurou, 太郎, bantou, ysh_tmk.

Read more

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAIは東京オフィスで、日本での採用、法人セールス、カスタマーサポートなどを順次開始する予定。日本企業向けに最適化されたGPT-4カスタムモデルの提供を見込む。日本での拠点設立は、政官の積極的な姿勢や法体系が寄与した可能性がある。OpenAIは法人顧客の獲得に注力しており、世界各地で大手企業向けにイベントを開催するなど営業活動を強化。

By 吉田拓史
アドビ、日本語バリアブルフォント「百千鳥」発表  往年のタイポグラフィー技法をデジタルで再現

アドビ、日本語バリアブルフォント「百千鳥」発表 往年のタイポグラフィー技法をデジタルで再現

アドビは4月10日、日本語のバリアブルフォント「百千鳥」を発表した。レトロ調の手書き風フォントで、太さ(ウェイト)の軸に加えて、字幅(ワイズ)の軸を組み込んだ初の日本語バリアブルフォント。近年のレトロブームを汲み、デザイン現場の様々な要望に応えることが期待されている。

By 吉田拓史