特定のハードウェア構成に最適化されたニューラル ネットワーク設計のプルーニング アプローチ
2024-09-23 23:54:09
ニューラル ネットワーク プルーニングは、ディープ ニューラル ネットワーク (DNN) に基づく人工知能 (AI) モデルをモバイル デバイスなどのリソースに制約のあるプラットフォームに展開するための重要な手法です。ただし、ハードウェアの状態とリソースの可用性はプラットフォームによって大きく異なるため、特定のハードウェア構成に最適なプルーニングされたモデルを設計することが不可欠です。