Nvidia、AIテレビ会議サービス「Maxine」を発表

Nvidiaは5日、GPUで加速されたAI会議ソフトウェアを開発者に提供し、ビデオ品質を向上させるプラットフォーム「Nvidia Maxine」を発表した。同社はMaxineを「クラウドネイティブ」ソリューションとして説明しており、サービスプロバイダが視線補正、超解像、ノイズキャンセル、顔の再照などのAI効果をエンドユーザーに提供することを可能にする。

Nvidia、AIテレビ会議サービス「Maxine」を発表

Nvidiaは5日、GPUで加速されたAI会議ソフトウェアを開発者に提供し、ビデオ品質を向上させるプラットフォーム「Nvidia Maxine」を発表した。同社はMaxineを「クラウドネイティブ」ソリューションとして説明しており、サービスプロバイダが視線補正、超解像、ノイズキャンセル、顔の再照などのAI効果をエンドユーザーに提供することを可能にする。

開発者、ソフトウェアパートナー、サービスプロバイダは、今週からMaxineへの早期アクセスを申請することができる。

ビデオ会議は、感染リスクを最小限に抑えながらコミュニケーションを取る方法を提供しているため、パンデミックの間に爆発的に普及した。4月下旬には、Zoomが1日の会議参加者数3億人を突破し、月初の2億人、12月の1000万人から増加した。App Annieのレポートによると、3月14~21日の週には、ビジネス会議アプリのダウンロード数が6,200万件を突破したという。

Nvidiaによると、Maxineはテレビ会議の通話に必要な帯域幅を「劇的に」削減するという。このプラットフォームは、ピクセルの画面全体をストリーミングするのではなく、通話中の各人の顔のポイントを分析し、相手側のビデオに映っている顔をアルゴリズム的に再生成する。これは表向きには、インターネット上を行ったり来たりするデータをはるかに少ない量でストリーミングすることを可能にする。Nvidiaは、Maxineを使用する開発者は、帯域幅をH.264規格の要件の10分の1にまで削減できると主張している。

この改善された圧縮を実現するために、NvidiaはGAN(敵対的生成ネットワーク)と呼ばれるAIモデルを採用していると述べている。GANは、サンプルを作成するジェネレーターと、そのサンプルと実世界のサンプルを区別しようとする識別器の2つの部分から構成されるモデルで、メディア合成において優れた能力を発揮している。最高の性能を持つGANは、例えば、実在しない人物のリアルな肖像画や、架空のアパートのスナップショットを作成することができる。

Maxineのもう1つのスポットライト機能は、顔合わせ機能で、通話中に参加者の顔がお互いに向いているように見えるように自動的に顔を調整することができる。視線補正機能は、カメラがユーザーの画面と合っていなくても、アイコンタクトをシミュレートするのに役立つ。自動フレーム機能により、ビデオフィードは、スピーカーが画面から離れても、そのスピーカーを追いかけることができる。また、開発者は、通話参加者に自分のアバターを選択させることができ、その声や声のトーンによって自動的にアニメーションが駆動される。

Maxineはまた、音声認識、言語理解、音声生成のためのAI言語モデルなどの会話機能にNvidiaのJarvis SDKを活用している。開発者はこれらを利用して、人間のような声でメモを取ったり、質問に答えたりするビデオ会議アシスタントを構築することができる。さらに、ツールセットは、参加者が議論されている内容を理解できるように翻訳やテープ起こしを行うことができる。

AvayaはMaxineプラットフォームをいち早く採用した。同社のビデオ会議アプリ「Avaya Spaces」では、背景ノイズの除去、仮想グリーン・スクリーンの背景、プレゼンテーション・コンテンツの上にプレゼンターを重ねて表示できる機能、音声を認識して区別できるライブ・トランスクリプションなどのメリットが得られる。

Nvidiaによると、Maxineのインフラストラクチャ、オーディオ、ビジュアルコンポーネントを支えるAIモデルは、Nvidia DGXシステムで何十万時間ものトレーニングを経て開発されました。この堅牢性と、GPU上のKubernetesコンテナクラスタで稼働するマイクロサービスを活用したMaxineのバックエンドにより、AI機能を同時に稼働させながらも、最大で数十万人のユーザーをサポートすることが可能になった。

Read more

コロナは世界の子どもたちにとって大失敗だった[英エコノミスト]

コロナは世界の子どもたちにとって大失敗だった[英エコノミスト]

過去20年間、主に富裕国で構成されるOECDのアナリストたちは、学校の質を比較するために、3年ごとに数十カ国の生徒たちに読解、数学、科学のテストを受けてもらってきた。パンデミックによる混乱が何年も続いた後、1年遅れで2022年に実施された最新の試験で、良いニュースがもたらされるとは誰も予想していなかった。12月5日に発表された結果は、やはり打撃となった。

By エコノミスト(英国)
中国は2024年に経済的苦境を脱するか?[英エコノミスト]

中国は2024年に経済的苦境を脱するか?[英エコノミスト]

2007年から2009年にかけての世界金融危機の後、エコノミストたちは世界経済が二度と同じようにはならないことをすぐに理解した。災難を乗り越えたとはいえ、危機以前の現状ではなく、「新常態」へと回復するだろう。数年後、この言葉は中国の指導者たちにも採用された。彼らはこの言葉を、猛烈な成長、安価な労働力、途方もない貿易黒字からの脱却を表現するために使った。これらの変化は中国経済にとって必要な進化であり、それを受け入れるべきであり、激しく抵抗すべきではないと彼らは主張した。 中国がコロナを封じ込めるための長いキャンペーンを展開し、今年その再開が失望を呼んだ後、このような感情が再び現れている。格付け会社のムーディーズが今週、中国の信用格付けを中期的に引き下げなければならないかもしれないと述べた理由のひとつである。何人かのエコノミストは、中国の手に負えない不動産市場の新常態を宣言している。最近の日米首脳会談を受けて、中国とアメリカの関係に新たな均衡が生まれることを期待する論者もいる。中国社会科学院の蔡昉は9月、中国の人口減少、消費者の高齢化、選り好みする雇用主の混在によってもたら

By エコノミスト(英国)
イーロン・マスクの「X」は広告主のボイコットにめっぽう弱い[英エコノミスト]

イーロン・マスクの「X」は広告主のボイコットにめっぽう弱い[英エコノミスト]

広告業界を軽蔑するイーロン・マスクは、バイラルなスローガンを得意とする。11月29日に開催されたニューヨーク・タイムズのイベントで、世界一の富豪は、昨年彼が買収したソーシャル・ネットワーク、Xがツイッターとして知られていた頃の広告を引き上げる企業についてどう思うかと質問された。「誰かが私を脅迫しようとしているのなら、『勝手にしろ』」と彼は答えた。 彼のアプローチは、億万長者にとっては自然なことかもしれない。しかし、昨年、収益の90%ほどを広告から得ていた企業にとっては大胆なことだ。Xから広告を撤退させた企業には、アップルやディズニーが含まれる。マスクは以前、Xがブランドにとって安全な空間である証拠として、彼らの存在を挙げていた。

By エコノミスト(英国)