4 articles

Google、コンピュータビジョンモデルBig Transferをオープンソース化

Google Brainは、深層学習型コンピュータビジョンモデル「Big Transfer (BiT)」の事前学習モデルとファインチューニングコードを公開した。これらのモデルは、一般に公開されている一般的な画像データセットを用いて事前に訓練されており、わずか数サンプルで微調整を行うだけで、いくつかのビジョンベンチマークにおいて最先端の性能を満たすか、それ以上の性能を発揮することができるという。 [...]

Takushi Yoshida

Google、選択的注意を模倣したAIエージェントを構築

Googleの研究者たちは「自己注意ボトルネック」を採用したAIソフトウェアエージェントの特性を調査した。研究者らは、これらのエージェントは、難解な視覚ベースのタスクを解くための適性を示すだけでなく、自分を混乱させる可能性のある詳細を無視し、タスクのわずかな変更に取り組むのが得意であると主張している。 [...]

Takushi Yoshida

ロボットの空間知覚は可能か?

MIT航空宇宙学助教授ルカ・カルローンらは人間が世界を知覚し、ナビゲートする方法をモデルにした、ロボットのための空間知覚の表現を開発した。ロボットは、人、部屋、壁、その他の構造物などのオブジェクトとその意味的ラベルを付け、ロボットがその環境で見ているであろうものを含む周囲の3Dマップを素早く生成する。 [...]

Takushi Yoshida
Newsletter
You've successfully subscribed to Axion デジタルビジネスメディア