エドワード・ソープは理論と実践の双方で圧倒的な業績を残したモンスターのような人物でした。ソープは、ノーベル賞級の発見をした数学の教授であり、連戦連勝のヘッジファンドマネージャーであり、無敵のブラックジャックプレーヤーです。ルーレットに勝つために、彼と情報理論の父であるクロード・シャノンは、史上初のウェアラブルコンピューターを発明しました。確率理論の革新的な応用に加えて、 ソープは「ディーラーをやっつけろ」のベストセラー作家でもあり、この書籍はブラックジャックのハウスアドバンテージがカードカウンティングによって克服できることを数学的に証明した最初の本です。 彼はまた、金融市場での定量的投資手法の先駆者でもありました。

ブラックジャックの勝利戦略を考案するときは、ソープは当時MITに納入されており後に「ハッカー」と呼ばれる人たちが利用していたIBM 704を研究ツールとして使用して、オッズとエッジを隅々まで計算しました。彼は計算に必要な式をIBM 704にプログラムするため、コンピュータ科学者ではないにもかかわらず独学でプログラミング言語Fortranを学びました。彼の前に手計算でゲームの解明に挑んでいたグループは、プレイヤーの勝率がディーラーにわずかに劣る結果を報告していましたが、ソープは胴元の優位性を覆せることを突き止めました。

ソープはここにカードカウンティングを組み合わせることで、プレイヤーの勝算(エッジ)を著しく高められることを発見しました。カードデッキの数が減ったある一定の状況下では、8割を超す、勝率(オッズ)が極端に高い局面を特定することが容易となり、プレイヤーはかなり有利にゲームを進めることができるのです。

ソープがこのブラックジャック攻略に際して、ケリー基準を用いたと説明する書籍がいくつかありますが、実際には自分で考えたロジックで賭け金を制御していた、と本書は説明しています。ケリー基準は、ソープがブラックジャック論文の論文誌掲載で便宜を図った、情報理論の父、クロード・シャノンがベル研究所に在籍していた当時、ジョン・ケリーも同じくベル研究所に在籍しており、しかも、ケリーは、シャノンの情報理論をヒントにケリー基準を生み出したので、どこかでこれらの事実が「有機的」に結びついてしまった、と推察します。

しかし、後年、ソープは ”The Kelly Criterion in Blackjack, Sports Betting, and the Stock Market” (「ブラックジャック、スポーツ賭博、および株式市場におけるケリー基準」)という論文を著しており、彼がカジノを離れ、株式市場を攻略しようとしたとき、ケリー基準を活用したことがわかります。ソープは「(ケリー基準は)30年間で800億ドル相当の『賭け』をするのを助けました」と説明します。

ケリー基準は、ブラックジャックでのカードカウンティングに使用することで、ブラックジャックやその他のギャンブルゲームで発生するさまざまな質問に答えるための便利な方法、とソープは説明します。「ギャンブラーの中心的な問題は、好ましい期待リターンの選択肢を見つけることです。しかし、ギャンブラーは自分のお金をどのように管理するか、つまりどのくらい賭けるかを知る必要もあります。株式市場(より包括的に、証券市場)でも、問題は似ていますが、より複雑です。投資家であるギャンブラーは、『リスク調整後リターン』を最適化する手法を探しています」。

リスク調整後リターンは、得られたリターンに対してどれだけリスクを取っていたかを反映させたものです。仮に過剰なリスクを取って、少ないリターンを得たとき、リターンはポジティブになるが、実際には割に合わない賭けをしたことになります。この状況を勘案したのがリスク調整後リターンであり、この考えに基づけば、「より小さなリスクで、より大きなリターンを獲得できることが望ましい」ということです。つまり、ケリー基準のようなロジックを、ギャンブラーもモデル化されていない形で、メンタルモデルとして保持していることが想像できます。そして論文の中でソープはオンライン賭博を利用し、ケリー基準を適用して得られる成果を実証しています。

さて、ソープのブラックジャック戦略を知った2人のニューヨークの大富豪は、彼のシステムのテストを申し出ました。テストは成功し、ソープ氏はネバダ州のギャンブラーとして成功したキャリアを開始しました。カジノは、より悪質なテクニックは言うまでもなく、複数のデッキを使用し、カードをより頻繁にシャッフルすることによって、ソープの戦略に反撃しました。あるとき、ソープ氏は、彼の車のアクセルペダルを細工され、またあるときには、眠り薬をもられ、極めて危険な状況に陥りますが、幸運にも無傷で生き残ったといいます。

彼はこれに懲りず、次は、シャノンとルーレットの攻略を目指し、結果を予測するために服の下に忍ばすコンピュータを開発をはじめました。当時、ソープは新婚でした。夫が家でひがなギャンブル用のルーレットの模型を作っていましたが、夫人はかなり寛容な性格で特に文句を言わなかったそうです。ただし、夫人の両親は学者だと思っていた娘の夫がギャンブルの研究をするのを心配し始めた、と本書は記述しています。

ソープは、物理学の学部生のときにすでにルーレットの結果を予測する手法を最初に思い描いていました。彼の推測では、軌道を回るルーレットのボールは「正確で予測可能な経路にある惑星のようだ」というものでした。

彼とシャノンが使用した最終バージョンの「ウェアラブルコンピュータ」は、靴に入れることができ、他の人が使用するイヤピースに可聴信号を送信できるタバコの一箱サイズの箱で構成されていました。マシンにはイヤホンが必要でした。 彼らは利用可能な最も細いワイヤーを購入し、髪でそれを隠すために精巧な作りにしたといいます。彼らはペアでカジノに出向き、通常、ソープは回転するボールを見ずにホイールに数字をランダムに書き留め、シャノンはその軌道を観察して適切な賭けの情報を、通信機を通じソープに送信していました。

彼らは、プレイヤーが胴元に対し44%の優位を築けると結論づけたのです。しかし、彼らはこれでお金儲けをする気はありませんでした。

世界で最初の学者が設立したヘッジファンド

ソープはやがて、大学での研究生活に辟易とし、ギャンブルを攻略した後の目標を金融市場に見出しました。彼が設立した、世界初のクオンツヘッジファンド Princeton Newport Partners は、18年以上にわたり、140万ドルを2億7,300万ドルに転換し、四半期ごとの損失を被ることなく、S&P 500の2倍以上の割合で増加しました。ソープは数学、オプション価格設定、(ブラックジャックを攻略するときに独学で習得した)コンピューターの革命的な使用により、大きな利益を上げたのです。

彼は、フィッシャー・ブラックとマイロン・ショールズのオプション価格設定の公式(ブラック・ショールズ公式)を、彼らの数年前に開発しており、彼の統計的アービトラージ戦略に使用していた、と記しています。ブラックがソープの著書『マーケットをぶっちぎれ! 株式市場の科学的必勝システム』(“Beat the Market: A Scientific Stock Market System“)を参考にしており、質問した場面も登場します。ブラックらがブラック・ショールズ公式を発表したとき、彼は他のプレイヤーがそれを即座に活用してくることを恐れていたが、それは起きなかった、と記述しています。

『天才数学者、ラスベガスとウォール街を制す(上) 偶然を支配した男のギャンブルと投資の戦略』エドワード・O・ソープ ダイヤモンド社

ウォーレン・バフェットと非推移的サイコロ

ウォーレン・バフェットととの交流についても記されています。ソープは、1968年、当時はまだ無名だったオマハの投資家と会食し、その会食の間、投資家は非推移的サイコロ(エフロンのサイコロ)の話をし、大いに盛り上がりました。ソープは彼はアメリカで一番の大金持ちになるに違いないと語り、そしてオマハの投資家は後年、アメリカで一番の大金持ちとなり、それがバフェットだったという逸話があります。

非推移的サイコロは、4つの目の設計が異なるサイコロが、じゃんけんのように非対称な強さを相互にもつもので、強さが"巡る"不思議なサイコロです。バフェットはこの非推移的サイコロの話を様々な人に対し行っていたそうです。

本の後半では、ソープは数学ではなく異なる戦略と複利で資産を増やしていくバフェットをたたえながらも、バフェットでさえも、インデックスに勝てなくなっていることを指摘しています。近年の金融市場はコンピュータ化が異常な速度で進んでおり、さらに2012年以降の機械学習の劇的な発展が金融市場にさらなる進化を迫り、機械が市場の操縦桿を完全に握るようになりました。機械学習モデルベースのパッシブ投資が主流となったことが、長期的な明確なバブル崩壊から景気後退に向かう時期を市場から取り去られた理由とする議論が存在するほどです。

短期的なアービトラージ戦略も同様に進化しており、バフェットがかつて見つけることのできた市場の淀みは、いまやもののミリ数秒で、アルゴリズミックトレーダーが活用しており、それとは別に高頻度取引(HFT)業者は、取引の速度で極小のスプレッドを稼ぐことで、リスクを負わずして稼いでいます。HFT業者は、『フラッシュ・ボーイズ 10億分の1秒の男たち』で登場するような、取引所のサーバーに直通する光ファイバーケーブルに頼らず、将来、惑星間通信に応用されそうなもっと高速なマイクロ波によるデータ転送を利用するようになりました。欧米の証券取引所では、スピードバンプを用いた意図的に遅い市場メカニズムや、DPO(Discretionary  Pegged Order)という執行価格に関して取引所が一定の裁量を有する注文タイプが提案され、実用化されています。

そう、時代は、ソープのアルゴリズムによるファンド運用を初めて成功させた記念碑的なブレイクスルーから、さらに先に進んでいます。それでも、彼が打ち立てた功績を余りにも大きく、理論を作り、実践で試し、成功させる彼の業績は、余りにも早すぎたパイオニアだったとの印象を与えます。

天才数学者、ラスベガスとウォール街を制す 偶然を支配した男のギャンブルと投資の戦略(エドワード・ソープ)ダイヤモンド社

A Man for All Markets: From Las Vegas to Wall Street, How I Beat the Dealer and the Marke / Random House Trade Paperbacks; Reprint edition (April 17, 2018)

Photo coutesy of Winton's Youtube Video "Ed Thorp Talks Roulette and Financial Market Investment | Talks at Winton"