FPGAベースのニューラルネットワークアクセラレータはGPUより優れています
8ビット整数の解像度を使用して、GoogLeNet Inception-v1 CNNとして実証されました。それは毎秒16.8テラ操作(TOPS)を達成し、そして毎秒5,300以上の画像を推論することができる ザイリンクス Virtex UltraScale + XCVU9P-3 fpga。 Fawcett氏によると、モジュール式のスケーラブルなアプローチは、エッジやクラウドでのオブジェクト検出やビデオ処理アプリケーション、さらにはデータセンターやインテリジェントカメラでの推論に適しています。
DPUは、並列DSPアーキテクチャ、分散メモリ、およびさまざまなアルゴリズムに対する論理および接続性の再構成可能性を使用して、機械学習アプリケーションのニューラルネットワークトポロジに最適な計算パフォーマンスを提供するように構成できます。
DPUは、競合するすべてのCNNよりも50%以上高いパフォーマンスを達成し、一定の電力またはコスト予算でGPUを凌駕している、と同社は主張している。 Fawcett氏は、次のように述べています。
同社はまた、fpgasでディープラーニングアクセラレーションを実装するためのテクニックを研究するために、オックスフォード大学でDPhil(PhD0)を後援していると発表しました。
