NVIDIAのAIは「人間より優れた設計」のチップを生み出す
NVIDIAはGPU設計を効果的に改善し、高速化するためにAIを使い始めている。GPU設計企業が、設計を円滑に行うためにGPU駆動の機械学習モデルを利用する、というカイゼンの円環だ。
NVIDIAはGPU設計を効果的に改善し、高速化するためにAIを使い始めている。GPU設計企業が、設計を円滑に行うためにGPU駆動の機械学習モデルを利用する、という「カイゼンの円環」だ。
NVIDIAのチーフサイエンティスト、ビル・ダリー(Bill Dally)が3月のGTCカンファレンスで、GPUの自社開発プロセスにおけるAIの利用例を概説している。
「AIを利用して、より優れたチップを設計したいと思うのは、AIの専門家として当然のことだ」とダリーは言う。「私たちはこれを2つの異なる方法で行っている。まず、最もわかりやすいのは、既存のコンピュータ支援設計ツールにAIを組み込む方法だ。例えば、GPUで電力が使用されている場所を取得し、電圧がどの程度低下するかを予測するツールがある。これを従来のCADツールで実行すると3時間かかる」
ダリーは、その代わり、同じデータをAIモデルに学習させ、多くの設計を行ったという。その結果、電圧降下の推論にかかる時間はわずか3秒になったと彼は主張している。「もちろん、特徴抽出の時間を含めると18分だ。そして、非常に早く結果を出すことができる。この場合も同様で、畳み込みニューラルネットワークではなく、グラフニューラルネットワークを使用し、回路の異なるノードが切り替わる頻度を推定するためにこれを行い、これが実際に前の例への電力入力を駆動する。そしてまた、従来のツールよりもはるかに速く、ほんのわずかな時間で、非常に正確な電力推定を行うことができる」とダリーは語っている。
ダリーは、寄生素子を発見する方法についても言及している。寄生素子とは、基本的に部品や設計に含まれる不要な要素で、非効率になったり、意図したとおりに動作しない原因となったりするものを指す。この寄生素子を発見するための工程は「非常に長く、反復的で、非人間的な労働集約型のプロセス」であり、AIにやらせた方が回路設計のステップ数を減らせるという。
さらにダリーは、NVIDIAのチップの配置配線を設計する際の重要な設計上の選択も、AIに助けてもらうことができると説明する。AIは、設計者に配置配線上で「混雑」が起こりそうな場所を事前に警告するだけで、長期的には膨大な時間を節約できる未来が待っているかもしれない。
「これは、チップのレイアウトにおいて非常に重要だ。通常のプロセスでは、ネットリストを作成し、配置配線プロセスを実行する必要があるが、これにはかなりの時間がかかり、数日かかることもある。そして、実際に混雑したときに初めて、最初の配置が適切でないことが判明するのだ。このような赤い領域(下のスライド)を避けるためには、リファクタリングしてマクロを別の場所に配置する必要がある。その代わりに今できることは、場所とルートを実行することなく、これらのネットリストとグラフ・ニューラル・ネットワークを使って、基本的に混雑が起こりそうな場所を予測し、かなり正確にすることができるようになった。完璧ではないが、懸念されるエリアを示すことができ、それに基づいて行動することができる」
さらに興味深いのは、AIを使って実際に設計を行うことだ。ダリーは2つの例を2つ挙げている。一つはNVCellと呼ばれるシステムで、シミュレーテッド アニーリング (SA法) と強化学習の組み合わせにより、基本的にスタンダードセルライブラリを設計する。「新しい技術を導入するたびに、例えば7ナノメートル技術から5ナノメートル技術に移行する場合、セルのライブラリが必要になる。セルとは、ANDゲートやORゲート、加算器のようなものだ。このセルを、新しい技術に対応させるために、非常に複雑な設計ルールで設計し直さなければならないのです」とダリーは言う。
「基本的には、強化学習を使ってトランジスタを配置する。しかし、もっと重要なのは、トランジスタを配置した後、設計ルールのエラーが続出し、まるでビデオゲームのような状態になることだ。実は、これこそが強化学習の得意とするところだ」
「素晴らしい例として、アタリのビデオゲームに強化学習を使っている。ツールはアタリのビデオゲームのようなものだが、スタンダードセルのデザインルールの誤りを修正するためのビデオゲームなのだ。強化学習で設計ルールの誤りを修正していくことで、基本的にスタンダードセルの設計を完成させることができる」
92パーセントのセルライブラリは、このツールで設計ルールなどのエラーを出さずに行うことができたという。また、そのうちの12パーセントは人間の設計したセルよりも小さく、一般に、セルの複雑さに関しては、人間の設計したセルと同じかそれ以上の結果を出している、と彼は述べた。
この自動設計ツールには2つの利点がある。1つは、大幅な省力化だ。「新しい技術ライブラリの移植には、10人程度のグループで1年の大半を費やしていた。それが、数台のGPUを数日間稼働させるだけで、移植が可能になったのだ。そして、自動処理されなかった8パーセントのセルについては、人間が作業することができる。そして、多くの場合、より良い設計ができるようになる。つまり、省力化と人間より優れた設計ができる」
チップ設計におけるAIの活用のライバルはGoogleだ。Googleは「チップフロアプランニング」とも呼ばれるチップ配置に強化学習を応用し、数万から数十万の新しいデザインを、それぞれ数秒のうちに生成し、評価するモデルを生み出した。同社はAIチップで半導体設計に参入し、研究開発を積み重ねている。
参考文献
- Yakun Sophia Shao, Jason Cemons, Rangharajan Venkatesan, Brian Zimmer, Matthew Fojtik, Nan Jiang, Ben Keller, Alicia Klinefelter, Nathaniel Pinckney, Priyanka Raina, Stephen G. Tell, Yanqing Zhang, William J. Dally, Joel Emer, C. Thomas Gray, Brucek Khailany, and Stephen W. Keckler. 2021. Simba: scaling deep-learning inference with chiplet-based architecture. Commun. ACM 64, 6 (June 2021), 107–116. DOI:https://doi.org/10.1145/3460227