コンピュータビジョン - アクシオン

コンピュータビジョン

物議を醸すピーター・ティール出資の顔認識システム新興企業「Clearview AI」

米国の主要な移民法執行機関である司法省、ベストバイやメイシーズなどの小売業者、アラブ首長国連邦の政府系ファンドは、ソーシャルメディアやウェブ上の数十億枚の写真をスクレイピングしてデータベース化し、物議を醸している顔認識スタートアップClearview AIの顧客として世界中の数千の政府機関や民間企業の中にリストアップされている。

AI

MIT CSAIL、肺水腫を分類できるAIシステムを開発

MITコンピュータサイエンス・人工知能研究室（CSAIL）のチームは、ある種の心不全を予測するためにX線を分析できるAIシステムを開発したと主張している。肺水腫として知られる肺の過剰な水分の兆候を検出することで、心不全の重症度を4段階の尺度で半分以上の時間で正確に定量化できると研究者らは言う。

ヘルスケア

FacebookとNYUがコンピュータビジョン技術でMRIスキャンを4倍高速化

この研究は、FacebookのAI研究チーム（FAIR）とNYU Langone Healthの放射線技師との間で進められた[fastMRI](https://fastmri.org/)と呼ばれる共同プロジェクトである。科学者たちは、低解像度と高解像度のMRIスキャンのペアで機械学習モデルを訓練し、このモデルを使用して、通常の入力データのわずか4分の1から最終的なMRIスキャンがどのように見えるかを「予測」する。

コンピュータビジョン

Facebook AI、Transformerを物体検出モデルに適用

Facebook AI Research（FAIR）の6人のメンバーは、Transformerニューラルネットワークアーキテクチャを利用して、エンドツーエンドの物体検出AIを作成した。DETR（Detection Transformer）と名付けられたこのモデルは、1回のパスで画像内の物体を一度に認識することができる。

コンピュータビジョン

MITの研究者が ImageNet データセットに「系統的な」欠点を発見

MITの研究者は、よく知られているImageNetデータセットには「系統的なアノテーションの問題」があり、ベンチマークデータセットとして使用した場合には、根拠となる真実や直接観測との間にずれが生じると結論付けています。

コンピュータビジョン

Google、コンピュータビジョンモデルBig Transferをオープンソース化

Google Brainは、深層学習型コンピュータビジョンモデル「Big Transfer (BiT)」の事前学習モデルとファインチューニングコードを公開した。これらのモデルは、一般に公開されている一般的な画像データセットを用いて事前に訓練されており、わずか数サンプルで微調整を行うだけで、いくつかのビジョンベンチマークにおいて最先端の性能を満たすか、それ以上の性能を発揮することができるという。

AI

Google、選択的注意を模倣したAIエージェントを構築

Googleの研究者たちは「自己注意ボトルネック」を採用したAIソフトウェアエージェントの特性を調査した。研究者らは、これらのエージェントは、難解な視覚ベースのタスクを解くための適性を示すだけでなく、自分を混乱させる可能性のある詳細を無視し、タスクのわずかな変更に取り組むのが得意であると主張している。

ロボティクス

ロボットの空間知覚は可能か？

MIT航空宇宙学助教授ルカ・カルローンらは人間が世界を知覚し、ナビゲートする方法をモデルにした、ロボットのための空間知覚の表現を開発した。ロボットは、人、部屋、壁、その他の構造物などのオブジェクトとその意味的ラベルを付け、ロボットがその環境で見ているであろうものを含む周囲の3Dマップを素早く生成する。