2009年、カーネギーメロン大学(CMU)教授のMahadev Satyanarayananは、Victor Bahl、Ramón Cáceres、Nigel Daviesとともに、「The case for VM-based cloudlets in mobile computing」と題する論文を発表した。今日では、この論文は一般的に「エッジコンピューティングの創設宣言」とみなされています。エッジコンピューティングへの理解を高めるため、抜粋・抄訳しました。

1. Introduction

モバイルコンピューティングは分岐点に立っています。多くの研究者による20年間の継続的な努力を経て、私たちは、このまだ急成長を続ける分野の確固たる基盤となる中核的な概念、技術、メカニズムを開発しました。「いつでも、どこでも、指先で情報が手に入る」というビジョンは、1990年代半ばには夢のようなものでした。今日では、世界中の何百万人ものユーザーがBlackBerry、iPhone、Windows Mobile、その他のモバイルデバイスを使って、ユビキタス電子メールやWebアクセスを実現しています。このような状況の中で、モバイルウェブベースのサービスや位置情報を利用した広告が登場し始めています。大きな利益を期待して多額の投資が行われています。

しかし、このままでは、モバイルコンピューティングの真の可能性が見えてこない。モバイルコンピューティングは、音声認識、自然言語処理、コンピュータビジョンとグラフィックス、機械学習、拡張現実、計画と意思決定などの計算集約的な機能を使って、ユーザーの認知能力をシームレスに増強する*全く新しい世界を発見することが待っています。このようにしてモバイル・ユーザーに力を与えることで、私たちは人間の活動の多くの分野を変革することができます。サイドバーでは、そのような変革の一例について考察しています。

この論文では、この変革を阻む技術的な障害について議論し、それを克服するための新しいシステム・アーキテクチャを提案します。このアーキテクチャでは、モバイルユーザは仮想マシン(VM)技術を用いて、近くのクラウドレット(Cloudret、編注:Satyanarayananらの提唱するエッジにあるコンピューティング資源、エッジサーバーとほぼ同義)上でカスタマイズされたサービスソフトウェアを迅速にインスタンス化し、無線LANを介してそのサービスを利用します。モバイルデバイスは通常、サービスに対してシンクライアントとして機能します。クラウドレットとは、インターネットに十分に接続されており、近くのモバイル機器が利用できる、信頼されたリソース豊富なコンピュータのクラスタのことです。

クラウドレットの物理的な近接性とワンホップのネットワーク遅延により、人間の認知能力をシームレスに向上させるために不可欠な、鮮明なインタラクティブ・リスポンシングがこのアーキテクチャでは容易に実現できます。また、クラウドレットを使用することで、HDビデオや高解像度画像などのメディアをインタラクティブに生成したり受信したりする複数のユーザーのピーク時の帯域幅需要を満たすことも容易になります。このアーキテクチャの重要な要件として、多様なアプリケーションに対応したインフラストラクチャの迅速なカスタマイズが挙げられます。本稿では、VM 技術によってこの要件が実際に満たされることを示唆する概念実証プロトタイプの結果を紹介します。

2. リソース不足のモバイルハードウェア

リソースが豊富なモバイルコンピューティング」という言葉は、一見すると矛盾しているように見えます。モバイル・ハードウェアは、静的なクライアントおよびサーバ・ハードウェアに比べて、必然的にリソー スが不足しているということは、長い間認識されてきました。どのようなコストと技術レベルであっても、重量、サイズ、バッテリ寿命、人間工学、放熱などを考慮すると、プロセッサ速度、メモリサイズ、ディスク容量などの計算リソースに深刻なペナルティを課すことになります。

ユーザーの視点から見ると、モバイルデバイスは小さすぎたり、軽すぎたり、バッテリー寿命が長すぎたりすることはありません。モバイルハードウェアは進化と改善を続けていますが、静的なハードウェアと比較すると、常にリソースが不足しています。長時間持ち歩いたり、身につけたりするようなハードウェアでは、サイズ、重量、バッテリ寿命の改善が、計算能力の向上よりも優先されます。これは、現在のモバイルハードウェア技術の一時的な制限ではなく、モビリティに内在するものです。モバイルデバイスでの計算は常に妥協の産物です。

リソースの貧困は、人間の認知能力をシームレスに向上させる可能性のある多くのアプリケーショ ンにとって大きな障害となっています。これらのアプリケーションでは、通常、モバイルハードウェアの能力をはるかに凌駕するプロセスとエネルギーを必要とします。研究室では、十分なコンピューティング・ソースがあれば、顔認識、音声認識、言語翻訳などのアプリケーションのための最先端の技術が、性能と品質において人間に近いものになっています。例えば、図1(a)に示すように、大規模なオンラインコーパスと文脈に基づく機械翻訳(CBMT)アルゴリズムを使用して、100ノードのコンピューティングエンジンで2006年に人間の品質に匹敵するスペイン語-英語翻訳を達成しました。この図で使用したIBM BLEU指標では、0.7以上のスコアはバイリンガルの人間の翻訳者の範囲に入り、0.8以上のスコアは人間の経験豊富なプロの翻訳者の範囲に近づいています。

コンピュータビジョンを利用した顔認識は、過去10年間で急速に進歩したもう一つの分野である。図1(b)は、Adler and Schuckerによる2007年の人間と自動翻訳者の顔認識性能の比較を引用したもので、今日ではコンピュータと人間はこのタスクにおいて同等であることを示しています。このような応用分野では、実用化に向けた技術的な改良がまだ必要であるが、将来の可能性を認識するためには大きな飛躍は必要ない。真の課題は、軽量でエネルギー効率が高く、資源に乏しいモバイルハードウェア上で、高度に変化する条件の下で、その最先端の性能と品質を自然界で維持することにあります。

図1(a) スペイン語-英語翻訳のBLEU指標による評価、図1(b) 自動翻訳者の顔認識性能の比較. Source: Mahadev Satyanarayanan, et al(2009).

3. クラウドコンピューティングの限界

モバイル機器のリソース不足に対する明白な解決策は、クラウドコンピューティングを活用することです。モバイルデバイスは、リソース集約型のアプリケーションを遠くの高性能コンピュートサーバやコンピュートクラスタ上で実行し、インターネットを介してアプリケーションとのシンクライアントユーザのインタラクションをサポートすることができます。残念ながら、後述するように、長いWAN(Wide Area Network)のレイテンシが根本的な障害となっています。

3.1 遅延がもたらす課題

ユーザーとのインタラクションのクリティカル・パスにおけるWANの遅延は、システムのリスポン スの鮮明さを低下させることで、ユーザビリティを損なう可能性があります。クラウド・コンピューティングでは、些細なユーザー・アプリケーション間のインタラクションでさえ、このような遅延が発生します。人間は遅延やジッターに敏感であり、WANスケールでこれらのパラメータを制御することは非常に困難です。遅延が増加すると、アクティブなレスポンスが低下します。ウェブブラウジングのような疎結合のタスクは引き続き使用できますが、拡張現実のような深い意味を持つタスクは、気が散るほどにギクシャクしたり遅くなったりします。これは、ユーザーの認知的関与の深さを低下させます。

Lagar-Cavillaらは、高速な帯域幅にもかかわらず、遅延がインタラクティブなレスポンスに悪影響を与えることを示しています。図2(a)は、可視化アプリケーションQuake Vizによって測定された出力フレームレートを2つの異なる構成で比較しています。ハードウェアグラフィックスアクセラレーションを備えたローカルマシン(Thick)と、VNCを介して出力を表示する100 Mb/sのネットワーク上にあるコンピュートサーバ(Thin)です。高いフレームレートは、インタラクティブなユーザーに滑らかさを提供しているような錯覚を与えます。

図2(a)は、33msのわずかなレイテンシでさえ、フレームレートがシッククライアントで経験したフレームレートから大幅に低下することを示しています。VNCプロトコルはフレームレートを落とすことで追いつこうとしているため、動作がギクシャクしてしまうのです。X windows のような作業性の高いシンクライアントプロトコルでは、フレームは保存されますが、インタラクションが遅くなります。どちらの場合も、ユーザーエクスペリエンスはローカルインタラクションよりもかなり劣ります。図2(b)は、グローバルスケールでの代表的なエンドポイント間のInternet2のレイテンシの測定結果を報告しています。測定された数値は、最後の列の光速の下限値をはるかに超えています。

図2(a)は、可視化アプリケーションQuake Vizによって測定された出力フレームレートを2つの異なる構成で比較、図2(b)は、グローバルスケールでの代表的なエンドポイント間のInternet2. Source: Mahadev Satyanarayanan, et al(2009).

独立して、Toliaらは、シンクライアントのパフォーマンスのユーザーが知覚する品質は非常に多様であり、アプリケーションのインタラクティブ性の程度とネットワークのエンドツーエンドの遅延の両方に依存することを示しています。図3に示すように、写真編集のようなインタラクティブ性の高いタスクのユーザビリティは、中程度のネットワーク遅延(100ミリ秒のRTT)と非常に良い帯域幅(100 Mbps)であっても、容認できないほど低下します。これは、Webブラウジングのようなタスクが対話的に非対応であるのとは対照的です。図3(b)はGIMPの写真編集タスクにおける個々のインタラクションの応答時間の分布を示しています。図3(a) に示された応答時間と品質の主観的な印象との対応付けは、 実証的な研究から生まれた長年にわたって確立されてきた HCIガイドラインに基づいています。

Source: Mahadev Satyanarayanan, et al(2009).

3.2 WANの遅延は改善されそうにない

現在のインターネットの進化の軌跡を見ると、これらの基本的な考慮事項が将来的に変化する可能性は非常に低いと思われます。今日のネットワーキングの改善の主なターゲットは、帯域幅、セキュリティ、エネルギー効率、および管理性です。これらの改善に使用される技術は、多くの場合、レイテンシに悪影響を及ぼします。例えば、ファイアウォールとオーバーレイネットワークは、パケットが通過するソフトウェアパスの長さを長くすることで目標を達成しています。ワイヤレスネットワークでは、一般的な省エネ技術として、基地局でバッファリングされたパケットを受信して確認するために、モバイルデバイスのトランシーバーの電源を短時間だけオンにするという方法があります。これは、パケットの平均的なエンドツーエンドの待ち時間を増加させ、ジッターも増加させます。一方、帯域幅は瞬間的な測定値ではなく集計値であるため、これらの技術の影響をほとんど受けないかもしれません。帯域幅は時間の経過とともに改善していきますが、遅延が劇的に改善することはほとんどありません。むしろ悪化する可能性があります。

3.3 帯域幅に起因する遅延も影響する

インターネットの遅延とジッターに焦点を当ててきましたが、ユーザーが感じる遅延の原因は、ユーザーとマシンの相互作用の狭いループ内で処理する必要がある大規模なデータ項目の送信に起因するものとは全く異なるものもあります。例えば、高解像度のシーン画像や高精細なシーンビデオ上でコンピュータビジョンアルゴリズムを実行することは、高性能なコンピューティングエンジンにオフロードするのに適したプロセッサ集約型のタスクです。この場合のユーザが感じる遅延は、処理時間だけでなく、ネットワークを介した大量のデータ転送にかかる時間も含まれます。この遅延は、ネットワークで利用可能な帯域幅によって決まります。

無線LANの帯域幅は、通常、モバイルデバイスで利用可能な無線インターネット帯域幅よりも 2 桁高いです。たとえば、現在利用可能な最速の無線 LAN(802.11n)と無線インターネット(HSPDA)技術の標準帯域幅は、それぞれ400Mbps と2 Mbpsです。ユーザーのインタラクションの観点から見ると、これらの帯域幅での送信遅延の違いは非常に大きく、4MBのJPEG画像では16秒ではなく80ミリ秒となります。これは、没入感の高いアプリケーションにとっては大きな違いです。無線インターネット帯域幅が一桁改善されたとしても、無線 LAN 帯域幅も大幅に改善される可能性があります。

4. クラウドレットがどのように役立つか

WAN制限を受けずにクラウドコンピューティングのメリットを得ることはできるのだろうか。遠くの「クラウド」に頼るのではなく、近くのリソース豊富なクラウドレットを利用することで、モバイルデバイスのリソース不足に対処することができます。リアルタイムのインタラクティブな応答の必要性は、クラウドレットへの低遅延、ワンホップ、高帯域幅の無線アクセスによって満たすことができます。モバイル・デバイスはシン・クライアントとして機能し、重要な計算はすべて近くのクラウドレットで行われます。クラウドレットの物理的な近接性が不可欠です。クラウドレットで実行するアプリケーションのエンドツーエンドの応答時間は、高速(数ミリ秒)で事前に決定可能である必要があります。近くにクラウドレットがない場合、モバイルデバイスは、遠くのクラウド、または最悪の場合は自社のリソースのみを利用するフォールバックモードに優雅にデグレードすることができます。近くのクラウドレットが見つかった場合、後になって完全な機能とパフォーマンスを回復することができます。

図 4(a)に示すように、クラウドレットは分散型で広範囲に分散したインターネット・インフラストラクチャであり、そのコミュ ューティング・サイクルとストレージ・リソースを近くのモバイル・コンピュータが活用することができます。クラウドレットは「箱の中のデータセンター」と見ることができます。クラウドレットは自己管理型で、必要なものは電源、インターネット接続、セットアップのためのアクセス制御だけです。この管理のシンプルさは、コンピューティング・リソースのアプライアンス・モデルに対応しており、コーヒーショップや医師のオフィスなどの事業所に導入するのに必要なものはほとんどありません。内部的には、クラウドレットは、ギガビットの内部接続性と高帯域幅の無線 LAN を備えたマルチコア・コンピュータのクラスタとみなすことができます。監視されていない場所に安全に配置するために、クラウドレットは、ハードウェアの完全性をサードパーティがリモートで監視する耐タンパー性または耐タンパー性のある筐体にパッケージされている場合があります。図 4(b)は、クラウドレットとクラウドの主な違いをまとめたものです。最も重要なことは、クラウドレットには、他の場所で利用可能なデータやコードのキャッシュ・コピーなどのソフトステ ートのみが含まれているということです。したがって、クラウドレットの損失や破壊は壊滅的なものではありません。

5. クラウドレットのカスタマイズ

私たちは、クラウドレット・インフラストラクチャが現在の Wi-Fi アクセスポイントのように展開される未来を想像しています。実際、クラウドレットとWi-Fiアクセスポイントのハードウェアを、簡単に展開可能な単一のエンティティに統合することは比較的簡単でしょう。重要な課題は、クラウドレットの管理を簡素化することです。クラウドレット・インフラストラクチャのソフトウェア管理が簡単でなければ、クラウドレット・インフラストラクチャの普及は実現しません。管理を簡単にするためにクラウドレット上のソフトウェアを厳しく制限することは、アプリケーションの革新と進化を妨げるため、魅力的ではありません。その代わりに、理想的なクラウドレットは、可能な限り幅広いモバイルユーザーをサポートし、ソフトウェアへの制約を最小限に抑えることができます。

当社のソリューションは、ハードウェア仮想マシン(VM)技術を使用したクラウドレットのインフラストラクチャ*の一時的なカスタマイズです。使用前のカスタマイズと使用後のクリーンアップにより、クラウドレット・インフラストラクチャは、使用後に手動で介入することなく、原状回復されたソフトウェア状態に復元されます。VM は、過渡的な*ゲスト* ソフトウェア環境を、クラウドレット インフラストラクチャの恒久的な*ホスト*ソフトウェア環境からクリーンにカプセル化し、分離します。ホスト環境とゲスト環境の間のインターフェイスは狭く、安定しており、ユビキタスです。これにより、クラウドレットへの投資の長期化が保証され、モバイルユーザーが世界中のどこにいても互換性のあるクラウドレットを見つける可能性が大幅に高まります。リソースが豊富なモバイルアプリケーションの不正なソフトウェアインターフェイスは、ゲスト環境内にカプセル化されているため、クラウドレットの使用前のカスタマイズ時に正確に再作成されます。その結果、VMベースのアプローチは、プロセス移行やソフトウェア仮想化などの代替手段に比べて脆弱性が低い。また、Java や C# などの特定の言語でアプリケーションを記述する必要がある言語ベースの仮想化アプローチに比べて、制限が少なく、より一般的です。

VMの状態をインフラストラクチャに配信するには、2つの異なるアプローチがあります。1つは、すでに実行中のVMを最初に中断し、そのプロセッサ、ディスク、およびメモリの状態を転送し、最後に、中断した場所からVMの実行を目的地で再開するVM migrationアプローチです。このアプローチの基本的な実現可能性は、Internet Suspend/Resume (ISR) システムや SoulPadでの研究や、CollectiveやXen live migrationなどの他の研究で確認されています。

Source: Mahadev Satyanarayanan, et al(2009).

このオーバーレイから派生したベースVMをすでに所有しているクラウドレット・インフラストラクチャに、モバイルデバイスから小さなVMオーバーレイが配信されます。インフラストラクチャは、このオーバーレイをベースに適用して launch VM を導出し、この VM はオーバーレイが導出された正確な状態で実行を開始します。図5にこのアプローチのステップを示します。例えば、ランゲージ翻訳アプリケーションでは、起動VM内のソフトウェアは、モバイルデバイスからキャプチャした音声を受信し、音声認識と言語翻訳を行い、音声合成のために出力を返すサーバになります。クラウドレットがクラスタであれば、Lagar-Cavillaらが述べているように、起動VMを迅速にクローン化して並列性を利用することができます。

クラウドレットでは、比較的少数のベースVM(LinuxとWindows構成のリリースが十数個程度)が、いつでも世界的に普及していると予想されます。そのため、モバイルデバイスが遠く離れた場所にいても、オーバーレイ用の互換性のあるベースを見つけられる可能性は高いと思われます。

ダイナミックVM合成と、ハッシュアドレスの付いたチャンクから大きなファイルをアセンブルするという代替的なアプローチとを対比させるのは有用です。この代替アプローチのバリエーションは、LBFS、Casper、Shark、Internet Suspend/Resumeシステムテンプレート、Collective、KeyChainなどのシステムで使用されています。これらのバリアントはすべて確率的な特徴を持っています。近くで利用できないチャンク(ローカルキャッシュ、ポータブルストレージなど、特定のバリアントに依存します)は、クラウドから取得しなければなりません。クラウドへのバンド幅とチャンクへのヒット率は、アセンブリの速度に影響を与える支配的な要因です。動的VM合成は、2つの重要な点で異なります。第一に、その性能はローカル・リソース(クラウドレットへの帯域幅とクラウドレットの計算能力)によってのみ決定されます。このため、ローカルのハードウェアのアップグレードは、VM合成の高速化に直結します。第二に、WANの障害は合成に影響しません。インターネットから完全に隔離されたクラウドレットであっても、オーバーレイはモーバイルデバイスから配信されるため、使用することができます。この場合、ベースVMを持つクラウドレットのプロビジョニングは、物理ストレージメディアを介して行うことができます。

※6章は割愛

7. 結論

リソースの貧困は、モビリティデバイスで実行できるアプリケーションの種類を著しく制限する根本的な制約です。この制約は、現在の技術の一時的な制限ではなく、モビリティに内在するものです。この論文では、この基本的な制約から解放されるモバイルコンピューティングのビジョンを提示します。このビジョンでは、モバイルユーザは、WAN の遅延やジッターを発生させることなく、近くのコムパターをシームレスに利用して、クラウド計算のリソースの利点を得ることができる。モバイルユーザーは、遠くの「クラウド」に依存するのではなく、近くのインフラストラクチャ上に「クラウドレット」をインスタンス化し、有線LANを介してそれを使用します。クラウドレットが近くにあることで、人間の認知能力を高めるような没入型のアプリケーションでも、鮮明なインタラクティブな反応を実現することが可能になります。私たちは、このビジョンの重要な未検証の側面、すなわちクラウドレット・インフラストラクチャの迅速なカスタマイズが、動的な VM 合成によって実現可能であることを確認しました。まだまだ多くの課題が残されていますが、ここで紹介したコンセプトとアイデアは、いつでもどこでも様々な方法でユーザーのシームレスな認知支援を実現するモバイルコンピューティングの新しい世界への扉を開くものです。

参考文献

M. Satyanarayanan, P. Bahl, R. Caceres and N. Davies, "The Case for VM-Based Cloudlets in Mobile Computing," in IEEE Pervasive Computing, vol. 8, no. 4, pp. 14-23, Oct.-Dec. 2009, doi: 10.1109/MPRV.2009.82.

Photo by Science in HD on Unsplash

Special thanks to supporters !

Shogo Otani, 林祐輔, 鈴木卓也, Mayumi Nakamura, Kinoco, Masatoshi Yokota, Yohei Onishi, Tomochika Hara, 秋元 善次, Satoshi Takeda, Ken Manabe, Yasuhiro Hatabe, 4383, lostworld, ogawaa1218, txpyr12, shimon8470, tokyo_h, kkawakami, nakamatchy, wslash, TS, ikebukurou 太郎.

月額制サポーター

Axionは吉田が2年無給で、1年が高校生アルバイトの賃金で進めている「慈善活動」です。有料購読型アプリへと成長するプランがあります。コーヒー代のご支援をお願いします。個人で投資を検討の方はTwitter(@taxiyoshida)までご連絡ください。

デジタル経済メディアAxionを支援しよう
Axionはテクノロジー×経済の最先端情報を提供する次世代メディアです。経験豊富なプロによる徹底的な調査と分析によって信頼度の高い情報を提供しています。投資家、金融業界人、スタートアップ関係者、テクノロジー企業にお勤めの方、政策立案者が主要読者。運営の持続可能性を担保するため支援を募っています。

投げ銭

投げ銭はこちらから。金額を入力してお好きな額をサポートしてください。

https://paypal.me/axionyoshi?locale.x=ja_JP