ビッグデータは死んだっぽい

「ビッグデータは死んだ(Big Data is Dead)」というが波紋を広げている。AIトレンドが興隆する中、エンタープライズITや事業戦略を牽引するバズワードの賞味期限切れが迫っているようだ。

ビッグデータは死んだっぽい
Photo by Shubham Dhage on Unsplash

「ビッグデータは死んだ(Big Data is Dead)」というブログが波紋を広げている。AIトレンドが興隆する中、エンタープライズITや事業戦略を牽引するバズワードの賞味期限切れが迫っているようだ。


MotherDuck: Big Data is Dead
Big data is dead. Long live easy data.

ブログの著者は、Google BigQueryのプロダクトリーダー、エンジニアリングリーダー、創業エンジニアを務めたJordan Tigani。Google BigQueryの創業エンジニア。いわゆる「ビッグデータ」を扱うBigQueryに長く関わった人物である。

彼はビッグデータというバズワードが喧伝される一方で、ほとんどのプレイヤーはビッグデータを実際に扱っていなかった、と述べている。「私が学んだ最も驚くべきことは、『Big Query』を使っている人のほとんどが、実際にはビッグデータを持っていないことでした」。

Tiganiの論旨は以下の通り。

彼がBigQueryのチームに在籍していたとき、「大半の顧客は、データストレージの総容量が1テラバイト以下だった。サービスを多用する顧客の間では、データ保存サイズの中央値は100GBをはるかに下回っていた」と言う。「数年前、私はBigQueryのクエリを分析し、年間1000ドル以上使用する顧客を対象にした。90%のクエリが100MB以下のデータしか処理していませんでした」「巨大なデータサイズを持つ顧客は、ほとんど膨大な量のデータをクエリすることはありません」

また、彼が業界アナリスト(Gartner、Forresterなど)と話したとき、彼がBigQueryを通じて持っていた洞察は強化されたようだ。大半の企業は1テラバイト以下のデータウェアハウスしか持っていない、とアナリストは言ったようだ。データウェアハウスのデータサイズは100GBが適正というのが「一般的な意見」だったようだ。

彼は投資家のリサーチも参照した。「投資家のポートフォリオに含まれる最大のB2B企業は約1テラバイトのデータを持ち、最大のB2C企業は約10テラバイトのデータを持っていることがわかった。しかし、大半はもっと少ないデータ量だった」。

ここから分かることは、ほとんどの事業会社は大量のデータを必要とせず、明確で信頼できるデータを収集して手元で分析できれば十分である、ということだ。本当にデータの使用を改善したいのであれば、データの入り口での品質を改善する方が効果的なようだ。

他方、現在ブームのさなかにある機械学習(ML)は大量のデータを扱わなければメインストリームのゲームをプレイできない。ほとんどのプレイヤーにとってはビッグデータは無縁なものの、競争の先端にいるプレイヤーにとっては依然としてビッグデータは必要不可欠なピースである。

ビッグデータブーム時代に様々な企業の中でデータ組織が作られた。コンサルティング・ファームのような外注先でも同様だ。だが、事業会社が実際にはビッグデータを扱っていないことを踏まえ、さらにMLのブームにさらされていることを考えると、「一時代の終焉」の臭いがする。そんなブログだった。

Read more

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAIは東京オフィスで、日本での採用、法人セールス、カスタマーサポートなどを順次開始する予定。日本企業向けに最適化されたGPT-4カスタムモデルの提供を見込む。日本での拠点設立は、政官の積極的な姿勢や法体系が寄与した可能性がある。OpenAIは法人顧客の獲得に注力しており、世界各地で大手企業向けにイベントを開催するなど営業活動を強化。

By 吉田拓史
アドビ、日本語バリアブルフォント「百千鳥」発表  往年のタイポグラフィー技法をデジタルで再現

アドビ、日本語バリアブルフォント「百千鳥」発表 往年のタイポグラフィー技法をデジタルで再現

アドビは4月10日、日本語のバリアブルフォント「百千鳥」を発表した。レトロ調の手書き風フォントで、太さ(ウェイト)の軸に加えて、字幅(ワイズ)の軸を組み込んだ初の日本語バリアブルフォント。近年のレトロブームを汲み、デザイン現場の様々な要望に応えることが期待されている。

By 吉田拓史