Software Design 2021年3月号掲載の「ディープラーニングではじめるソフトウェア高速化入門 第5回」のサンプルコードです。
- Ubuntu 18.04 LTS
- CUDA Toolkit 10.0
relu
および matmul
ディレクトリ中で make
コマンドを実行することで対応するプログラムがビルドされます。
- ReLU関数をCPUとGPUで実行し、処理時間の計測と結果の比較を行います。
- 要素数はコマンドライン引数として指定します。
./relu 1048576
- 行列積をCPUとGPUで実行し、処理時間の計測と結果の比較を行います。
- 行列サイズはコマンドライン引数として指定します。
./matmul 2048
- 平櫛 貴章 (株式会社フィックスターズ)
- Apache License 2.0