본문 바로가기

Programming/병렬처리(CUDA)

[CUDA] nVidia GPU의 CUDA 관련상세 Specification 정보 알아보기

출처 : http://icysword.blog.me/140202060932

nVidia GPU의 CUDA 관련상세 Specification 정보 알아보기


CUDA 학습을 하기 위하여 nVidia 그래픽 카드 장착후 해당 GPU의 상세 스펙을 알고 싶은데, 사이트에서 찾을 수가 없다.

(내가 영어가 약해서 잘 찾지를 못하는 건가 ??? ㅠㅠ)


간단한 예제 프로그램으로 해당 정보를 알 수가 있다.


[-] Collapse


위의 Code로 cu 파일을 만들어서 실행하면 화면에 CUDA 관련 상세한 Spec이 출력된다.


cudaDeviceProp 의 각 Property의 의미는 아래와 같다.


[-] Collapse


위의 방법 말고도 CUDA 설치 파일 중에 deviceQuery.exe 파일을 실행해도 된다. deviceQuery의 원본 소스도 같이 제공이 된다.


필자의 경우 deviceQuery.exe의 위치 : C:\ProgramData\NVIDIA Corporation\CUDA Samples\v5.5\Bin\win64\Release

예제 소스의 위치 : C:\ProgramData\NVIDIA Corporation\CUDA Samples\v5.5\1_Utilities\deviceQuery


GTX 770 기준으로 CUDA 상세 스펙은 아래와 같다.


[-] Collapse

devicequery Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "GeForce GTX 770"
  CUDA Driver Version / Runtime Version              6.0 / 5.5
  CUDA Capability Major/Minor version number:    3.0
  Total amount of global memory:                         2048 MBytes (2147483648 bytes)
  ( 8) Multiprocessors, (192) CUDA Cores/MP:     1536 CUDA Cores
  GPU Clock rate:                                              1202 MHz (1.20 GHz)
  Memory Clock rate:                                         3505 Mhz
  Memory Bus Width:                                          256-bit
  L2 Cache Size:                                                524288 bytes
  Maximum Texture Dimension Size (x,y,z)             1D=(65536), 2D=(65536, 65536), 3D=(4096, 4096, 4096)
  Maximum Layered 1D Texture Size, (num) layers  1D=(16384), 2048 layers
  Maximum Layered 2D Texture Size, (num) layers  2D=(16384, 16384), 2048 layers
  Total amount of constant memory:                        65536 bytes
  Total amount of shared memory per block:            49152 bytes
  Total number of registers available per block:       65536
  Warp size:                                                       32
  Maximum number of threads per multiprocessor:  2048
  Maximum number of threads per block:               1024
  Max dimension size of a thread block (x,y,z):      (1024, 1024, 64)
  Max dimension size of a grid size    (x,y,z):        (2147483647, 65535, 65535)
  Maximum memory pitch:                                    2147483647 bytes
  Texture alignment:                                            512 bytes
  Concurrent copy and kernel execution:               Yes with 1 copy engine(s)
  Run time limit on kernels:                                   Yes
  Integrated GPU sharing Host Memory:                 No
  Support host page-locked memory mapping:        Yes
  Alignment requirement for Surfaces:                    Yes
  Device has ECC support:                                  Disabled
  CUDA Device Driver Mode (TCC or WDDM):        WDDM (Windows Display Driver Model)
  Device supports Unified Addressing (UVA):         No
  Device PCI Bus ID / PCI location ID:                   1 / 0
  Compute Mode:
     < Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 6.0, CUDA Runtime Version = 5.5, NumDevs = 1, Device0 = GeForce GTX 770
Result = PASS

 

GTX 750Ti의 Spec.