コンピュータビジョン

コンピュータビジョンは、デジタル画像や映像からコンピュータがどのようにして高度な理解を得ることができるかを扱う学際的な科学分野である。工学的な観点から、人間の視覚システムができることを理解し、自動化しようとするものである。 コンピュータビジョンのタスクには、デジタル画像の取得、処理、分析、理解のための方法や、現実世界から高次元データを抽出して数値情報や記号情報を生成するための方法、例えば意思決定の形などが含まれます。ここでいう理解とは、視覚画像(網膜の入力)を、思考プロセスに意味を持たせ、適切な行動を引き出すことができる世界の記述に変換することを意味する。この画像理解は、幾何学、物理学、統計学、学習理論の助けを借りて構築されたモデルを用いて、画像データから象徴的な情報を切り離すことであると見ることができる。

物議を醸すピーター・ティール出資の顔認識システム新興企業「Clearview AI」

コンピュータビジョン

物議を醸すピーター・ティール出資の顔認識システム新興企業「Clearview AI」

米国の主要な移民法執行機関である司法省、ベストバイやメイシーズなどの小売業者、アラブ首長国連邦の政府系ファンドは、ソーシャルメディアやウェブ上の数十億枚の写真をスクレイピングしてデータベース化し、物議を醸している顔認識スタートアップClearview AIの顧客として世界中の数千の政府機関や民間企業の中にリストアップされている。

By 吉田拓史
MIT CSAIL、肺水腫を分類できるAIシステムを開発

AI

MIT CSAIL、肺水腫を分類できるAIシステムを開発

MITコンピュータサイエンス・人工知能研究室(CSAIL)のチームは、ある種の心不全を予測するためにX線を分析できるAIシステムを開発したと主張している。肺水腫として知られる肺の過剰な水分の兆候を検出することで、心不全の重症度を4段階の尺度で半分以上の時間で正確に定量化できると研究者らは言う。

By 吉田拓史
FacebookとNYUがコンピュータビジョン技術でMRIスキャンを4倍高速化

ヘルスケア

FacebookとNYUがコンピュータビジョン技術でMRIスキャンを4倍高速化

この研究は、FacebookのAI研究チーム(FAIR)とNYU Langone Healthの放射線技師との間で進められた[fastMRI](https://fastmri.org/)と呼ばれる共同プロジェクトである。科学者たちは、低解像度と高解像度のMRIスキャンのペアで機械学習モデルを訓練し、このモデルを使用して、通常の入力データのわずか4分の1から最終的なMRIスキャンがどのように見えるかを「予測」する。

By 吉田拓史
Google、コンピュータビジョンモデルBig Transferをオープンソース化

コンピュータビジョン

Google、コンピュータビジョンモデルBig Transferをオープンソース化

Google Brainは、深層学習型コンピュータビジョンモデル「Big Transfer (BiT)」の事前学習モデルとファインチューニングコードを公開した。これらのモデルは、一般に公開されている一般的な画像データセットを用いて事前に訓練されており、わずか数サンプルで微調整を行うだけで、いくつかのビジョンベンチマークにおいて最先端の性能を満たすか、それ以上の性能を発揮することができるという。

By 吉田拓史
Google、選択的注意を模倣したAIエージェントを構築

AI

Google、選択的注意を模倣したAIエージェントを構築

Googleの研究者たちは「自己注意ボトルネック」を採用したAIソフトウェアエージェントの特性を調査した。研究者らは、これらのエージェントは、難解な視覚ベースのタスクを解くための適性を示すだけでなく、自分を混乱させる可能性のある詳細を無視し、タスクのわずかな変更に取り組むのが得意であると主張している。

By 吉田拓史
ロボットの空間知覚は可能か?

ロボティクス

ロボットの空間知覚は可能か?

MIT航空宇宙学助教授ルカ・カルローンらは人間が世界を知覚し、ナビゲートする方法をモデルにした、ロボットのための空間知覚の表現を開発した。ロボットは、人、部屋、壁、その他の構造物などのオブジェクトとその意味的ラベルを付け、ロボットがその環境で見ているであろうものを含む周囲の3Dマップを素早く生成する。

By 吉田拓史