Deep Learning 학습을 위한 GPU 연동

작업환경

  • Ubuntu 20.04
  • NVIDIA RTX-2080ti
  • Tensorflow 2.4.1
  • Python 3.7.8

작업순서

  1. NVIDA Driver 설치
  2. CUDA 설치
  3. CUDA 환경 변수 설정

1. NVIDIA Driver 설치

현재 사용 중인 GPU에 맞는 드라이버를 조회한다. 여기에는 2가지 방법이 있다. NVIDIA 홈페이지에서 조회하는 방법과 리눅스 터미널에서 조회하는 방법이 있다.

그전에 나의 경우 원래 CUDA가 설치가 되어 있었기 때문에 모든 것을 삭제 해주고 작업을 진행할 것이다.

  • sudu apt-get purge nvidia
  • sudo apt autoremove

모두 삭제 후 엔비디아 공식홈페이지에서 조회를 해보자.

https://www.nvidia.co.kr/Download/index.aspx?lang=kr

위 경로에서 해당 GPU 유형을 찾아서 조회를 하면 된다.

다음은 리눅스를 통해 조회를 해보자. 커맨드 창에서 다음 명령어를 입력하면 된다.

  • apt search nvidia-driver

그러면 설치가능한 드라이버 목록을 확인할 수가 있고, 해당하는 드라이버를 설치해주면 된다.

나의 경우에는 홈페이지에서 조회한 460 드라이버를 설치해주려고 했는데 당시에 460 일단 보이지 않아서 가능한 리스트 중 450 driver를 설치했다. ( 다 설치한 후에 다시 조회해보니 460 driver 조회가 됨)

설치를 하고 재부팅을 해준다.

  • sudo apt install nvidia-450
  • sudo reboot

2. CUDA 설치

CUDA를 설치하기 위해서 tensorflow 버전과 호환되는 CUDA 버전을 확인해야 한다.

위 경로로 이동하여 tensorflow 버전과 CUDA 버전을 확인하자.

나의 경우 tensorflow 2.4.1 이기 때문에 CUDA 11.0 을 설치하기로 했다.

CUDA 를 설치하기 위해서 아래 경로로 이동하여 설치를 진행하자.

위 경로로 이동하여 해당하는 플랫폼 사양을 선택하면, 커맨드라인 명령어 정보를 얻을 수 있다.

나의 경우 Linux, x86_64, Ubuntu 20.04, deb (local) 옵션을 선택했다. 아래의 명령어를 그대로 진행하면 된다.

  • wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
  • sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
  • wget https://developer.download.nvidia.com/compute/cuda/11.0.3/local_installers/cuda-repo-ubuntu2004-11-0-local_11.0.3-450.51.06-1_amd64.deb
  • sudo dpkg -i cuda-repo-ubuntu2004-11-0-local_11.0.3-450.51.06-1_amd64.deb
  • sudo apt-key add /var/cuda-repo-ubuntu2004-11-0-local/7fa2af80.pub
  • sudo apt-get update
  • sudo apt-get -y install cuda

그대로 진행을 하게 되면 /usr/local/ 경로 아래에 cuda라는 디렉토리가 형성이 된다.

3. 환경변수 설정

위에 생성된 디렉토리 경로를 설정해주자.

  • sudo vi ~/.profile

profile 파일을 열고 아래 내용을 입력하면 된다.

export PATH=/usr/local/cuda/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda/lib64:/usr/local/cuda/extras/CUPTI/lib64

Categories:

Updated: