学術組織「Papers with Code」は8日、プレプリント論文アーカイブのarXivが、研究者が研究論文と一緒にコードを投稿できるようになり、コンピュータ科学者が最先端のAIや可能性のあることの斬新な進歩についての主張を簡単に分析、精査、再現できるようになると発表した。

1週間前に発表されたAI業界の評価によると、現在研究者が投稿した論文のうち、コードを公開しているのはわずか15%にすぎないことがわかった。

コーネル大学が管理しているarXivは、生物学、数学、物理学などの分野の原稿をホストしており、人工知能研究者が自分の研究を公に共有するためのオンライン上の最も人気のある場所の一つとなっている。プレプリント・リポジトリは、研究者が自分の研究成果をすぐに共有する方法を提供し、その後、評判の良い学術雑誌で行われているような長い査読プロセスを経ることができる。arXivで共有されたコードは、Papers with Codeを通じて投稿され、各論文のCodeタブで見つけることができる

「コードをarXiv上に持つことで、研究者や実務者が最新の機械学習研究をより簡単に構築できるようになる」とPapers with Codeの共同作成者であるRobert Stojnicは、ブログ記事で次のように述べている。「私たちはまた、この変更が機械学習以外のより広範な計算科学にも波及効果をもたらすことを願っている。科学は累積的なものだ。コードなどの重要なアーティファクトを利用可能にすることを含むオープンサイエンスは、研究をより簡単に積み重ねることができるようにすることで、進歩を加速させるのに役立つ」。

2018年に開始されたPapers with Codeは、AIモデルの結果の再現性を奨励し、その名の通りコードを使った研究を投稿することに焦点を当てている。Papers with Codeのウェブサイトでは、自然言語処理、コンピュータビジョン、敵対的機械学習、ロボット工学などのAIの主要な分野を横断して、2,000件近い論文とコードを共有している。Papers with Codeは当初、FacebookのAIリサーチのメンバーによって一部設立された。昨年、FacebookとPapers with Codeは、再現性を促すためにPyTorch Hubを立ち上げた。

ここ1年ほどで、研究論文の原稿と一緒にコードを共有することが、主要なAI研究カンファレンスでは標準となっている。ICML 2019では、カンファレンス開始までに70%近くの著者が論文と一緒にコードを提出した。ICMLの主催者によると、コードを提出した研究者の90%はアカデミア出身で、約27%には産業界出身の著者が含まれていた。逆に、全体の84%近くの著者は産業界出身者であり、約27%は学界出身者であった。企業内でソフトウェアやAIを開発している人は、知的財産や財務上の利益を守るために機密性を重要視する傾向があるのかもしれない。

NeurIPSは2019年にコード投稿ポリシーの実験を開始し、今年正式なコード投稿ポリシーを発効させた。AI研究者のための基準の進化についての他のニュースでは、今年初め、NeurIPSはすべての論文投稿に社会的影響に関する記述を含め、潜在的な財務的利益相反を宣言することを義務付けるようになった。