Nvidia、AIテレビ会議サービス「Maxine」を発表

Nvidiaは5日、GPUで加速されたAI会議ソフトウェアを開発者に提供し、ビデオ品質を向上させるプラットフォーム「Nvidia Maxine」を発表した。同社はMaxineを「クラウドネイティブ」ソリューションとして説明しており、サービスプロバイダが視線補正、超解像、ノイズキャンセル、顔の再照などのAI効果をエンドユーザーに提供することを可能にする。

Nvidia、AIテレビ会議サービス「Maxine」を発表

Nvidiaは5日、GPUで加速されたAI会議ソフトウェアを開発者に提供し、ビデオ品質を向上させるプラットフォーム「Nvidia Maxine」を発表した。同社はMaxineを「クラウドネイティブ」ソリューションとして説明しており、サービスプロバイダが視線補正、超解像、ノイズキャンセル、顔の再照などのAI効果をエンドユーザーに提供することを可能にする。

開発者、ソフトウェアパートナー、サービスプロバイダは、今週からMaxineへの早期アクセスを申請することができる。

ビデオ会議は、感染リスクを最小限に抑えながらコミュニケーションを取る方法を提供しているため、パンデミックの間に爆発的に普及した。4月下旬には、Zoomが1日の会議参加者数3億人を突破し、月初の2億人、12月の1000万人から増加した。App Annieのレポートによると、3月14~21日の週には、ビジネス会議アプリのダウンロード数が6,200万件を突破したという。

Nvidiaによると、Maxineはテレビ会議の通話に必要な帯域幅を「劇的に」削減するという。このプラットフォームは、ピクセルの画面全体をストリーミングするのではなく、通話中の各人の顔のポイントを分析し、相手側のビデオに映っている顔をアルゴリズム的に再生成する。これは表向きには、インターネット上を行ったり来たりするデータをはるかに少ない量でストリーミングすることを可能にする。Nvidiaは、Maxineを使用する開発者は、帯域幅をH.264規格の要件の10分の1にまで削減できると主張している。

この改善された圧縮を実現するために、NvidiaはGAN(敵対的生成ネットワーク)と呼ばれるAIモデルを採用していると述べている。GANは、サンプルを作成するジェネレーターと、そのサンプルと実世界のサンプルを区別しようとする識別器の2つの部分から構成されるモデルで、メディア合成において優れた能力を発揮している。最高の性能を持つGANは、例えば、実在しない人物のリアルな肖像画や、架空のアパートのスナップショットを作成することができる。

Maxineのもう1つのスポットライト機能は、顔合わせ機能で、通話中に参加者の顔がお互いに向いているように見えるように自動的に顔を調整することができる。視線補正機能は、カメラがユーザーの画面と合っていなくても、アイコンタクトをシミュレートするのに役立つ。自動フレーム機能により、ビデオフィードは、スピーカーが画面から離れても、そのスピーカーを追いかけることができる。また、開発者は、通話参加者に自分のアバターを選択させることができ、その声や声のトーンによって自動的にアニメーションが駆動される。

Maxineはまた、音声認識、言語理解、音声生成のためのAI言語モデルなどの会話機能にNvidiaのJarvis SDKを活用している。開発者はこれらを利用して、人間のような声でメモを取ったり、質問に答えたりするビデオ会議アシスタントを構築することができる。さらに、ツールセットは、参加者が議論されている内容を理解できるように翻訳やテープ起こしを行うことができる。

AvayaはMaxineプラットフォームをいち早く採用した。同社のビデオ会議アプリ「Avaya Spaces」では、背景ノイズの除去、仮想グリーン・スクリーンの背景、プレゼンテーション・コンテンツの上にプレゼンターを重ねて表示できる機能、音声を認識して区別できるライブ・トランスクリプションなどのメリットが得られる。

Nvidiaによると、Maxineのインフラストラクチャ、オーディオ、ビジュアルコンポーネントを支えるAIモデルは、Nvidia DGXシステムで何十万時間ものトレーニングを経て開発されました。この堅牢性と、GPU上のKubernetesコンテナクラスタで稼働するマイクロサービスを活用したMaxineのバックエンドにより、AI機能を同時に稼働させながらも、最大で数十万人のユーザーをサポートすることが可能になった。

Read more

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAIは東京オフィスで、日本での採用、法人セールス、カスタマーサポートなどを順次開始する予定。日本企業向けに最適化されたGPT-4カスタムモデルの提供を見込む。日本での拠点設立は、政官の積極的な姿勢や法体系が寄与した可能性がある。OpenAIは法人顧客の獲得に注力しており、世界各地で大手企業向けにイベントを開催するなど営業活動を強化。

By 吉田拓史
アドビ、日本語バリアブルフォント「百千鳥」発表  往年のタイポグラフィー技法をデジタルで再現

アドビ、日本語バリアブルフォント「百千鳥」発表 往年のタイポグラフィー技法をデジタルで再現

アドビは4月10日、日本語のバリアブルフォント「百千鳥」を発表した。レトロ調の手書き風フォントで、太さ(ウェイト)の軸に加えて、字幅(ワイズ)の軸を組み込んだ初の日本語バリアブルフォント。近年のレトロブームを汲み、デザイン現場の様々な要望に応えることが期待されている。

By 吉田拓史
新たなスエズ危機に直面する米海軍[英エコノミスト]

新たなスエズ危機に直面する米海軍[英エコノミスト]

世界が繁栄するためには、船が港に到着しなければならない。マラッカ海峡やパナマ運河のような狭い航路を通過するとき、船舶は最も脆弱になる。そのため、スエズ運河への唯一の南側航路である紅海で最近急増している船舶への攻撃は、世界貿易にとって重大な脅威となっている。イランに支援されたイエメンの過激派フーシ派は、表向きはパレスチナ人を支援するために、35カ国以上につながる船舶に向けて100機以上の無人機やミサイルを発射した。彼らのキャンペーンは、黒海から南シナ海まですでに危険にさらされている航行の自由の原則に対する冒涜である。アメリカとその同盟国は、中東での紛争をエスカレートさせることなく、この問題にしっかりと対処しなければならない。 世界のコンテナ輸送量の20%、海上貿易の10%、海上ガスと石油の8~10%が紅海とスエズルートを通過している。数週間の騒乱の後、世界の5大コンテナ船会社のうち4社が紅海とスエズ航路の航海を停止し、BPは石油の出荷を一時停止した。十分な供給があるため、エネルギー価格への影響は軽微である。しかし、コンテナ会社の株価は、投資家が輸送能力の縮小を予想している

By エコノミスト(英国)