Googleは、20日に発表されたホワイトペーパーの中で、オープンソースのツールを使用して、米国およびその他の国の1億件以上の特許公報に対してBERTモデルを訓練する方法を概説しており、これを使用して特許の新規性を判断し、分類を支援するための分類を生成することができるとしている。

世界の特許は膨大で、毎年何百万件もの新しい特許が発行されている。また、その内容も複雑だ。特許出願は平均約1万語で、発明者、弁護士、特許審査官の手によって丁寧に書かれている。特許出願書類は、素人には理解しがたい言葉で書かれており、文脈に大きく依存している。

これらの理由から、Google は、特許領域は BERT のようなアルゴリズムの応用に適していると考えている。特許は多くの組織に多大なビジネス価値をもたらし、企業は年間数百億ドルを費やして特許可能な技術を開発し、その技術を使用する権利と特許庁との取引を行っていると同社は指摘している。

GoogleのデータサイエンティストであるRob SrebrovicとJay Yonamineはブログ記事で、「我々の提案が、より高度な機械学習技術を用いて内部モデルやツールを改善しようとしている企業の特許部門、特許審査や先行技術調査を支援するために最先端の機械学習アプローチを活用しようとしている特許庁、特許を用いて新しい自然言語処理アルゴリズムのテストや開発を検討していないかもしれない機械学習や自然言語処理の研究者や学者を含む、より広範な特許コミュニティの機械学習の応用に役立つことを期待している」と述べている。「BERTアルゴリズムや他のトランスフォーマーベースのアプローチを特許やイノベーションの研究に応用することを考えていなかったかもしれない特許研究者や学者にとって有用なはずだ」。

特許処理に関してAIの恩恵を受けるのは企業だけではない。米国特許商標庁(USPTO)は、異なるカテゴリーの特許についてAIモデルを構築し、特許要旨のテキストに基づいてモデルを訓練した。これとは別に、USPTOのスタッフは、特許申請をより効率的に処理するためにAIを利用している。同庁は現在、「大手RPAプロバイダー」を利用してボットの取り組みを一元化し、ボットが配備される前にユースケース、開発、テスト、セキュリティを含む適切なプロセスとガバナンスモデルを確保しているという。

Photo by Mitchell Luo on Unsplash