ubuntu 16.04に、cuda 8.0 とかcuDNN 6.0とかKerasとか。

まず、すでに入れてしまっていたcuda 9.0のアンインストール

sudo apt-get --purge remove cuda-9-0

ちなみに、--purge が必要らしい。→ apt-get install ****** でinstallしたものをuninstallするには? -御世- UNIX・Linux | 教えて!goo

 

さらに、

sudo apt autoremove

が必要。(そうしないとまた9.0が入っちゃう。)

 

で、↓これを実行。

Ubuntu 16.04.3にCUDA 8.0とcuDNN 6.0をインストールして、TensorFlow GPUの環境を作成する - Qiita

ここも見た。

CUDA 8.0とcuDNN 6をUbuntu 16.04LTSにインストールする - Qiita

Ubuntu 16.04 LTSにCUDAとTensorFlowを入れて深層学習環境をつくる

Installing TensorFlow on Ubuntu  |  TensorFlow

 

うまく行かなかったのでここを見たりした。

ubuntu - ImportError: libcudnn.so.6: cannot open shared object file: No such file or directory - Stack Overflow

 

で、.bashrcを書き換えたので

source ~/.bashrc

を。(.bashrcや.bash_profileなどの変更設定をすぐに反映させたい - ITmedia エンタープライズ

 

 インストールしなおしたり散々でしたが、たぶん最後これが効いたのだと思いますが、

sudo rm -rf ~/.nv/

( nvidia - tensorflow-gpu is not working with Blas GEMM launch failed - Stack Overflow 

https://devtalk.nvidia.com/default/topic/1007071/cuda-setup-and-installation/cuda-error-when-running-matrixmulcublas-sample-ubuntu-16-04/post/5169223/

 この後で、kerasのサンプルコードなどが動くようになりました。

 

ちなみに(1)

cuda 8.0のサンプルコードをmakeした際にcudaDecodeGLがエラーとなってしまいコンパイルされない状態になってしまいました。

これは、

/NVIDIA_CUDA-8.0_Samples/3_Imaging/cudaDecodeGL/findgllib.mk

というファイルの中の、

UBUNTU_PKG_NAME = "nvidia-375"

というところを、自分がインストールしたドライバのバージョンにすればmakeが通るようになります。

私の場合は nvidia-384でした。

nvidia - Failure in running CUDA sample after cuda 8.0 installation - Ask Ubuntu

 

ちなみに(2)

20171211時点でcuDNNがらみは動いていないので、まだ下記など見て苦戦中です。

ImportError: libcudnn when running a TensorFlow program - Stack Overflow

python - Error importing tensorflow, libcudnn.so not locateable - Stack Overflow

サンプル cudnn-python-wrappers/example.py at master · hannes-brt/cudnn-python-wrappers · GitHub