본문 바로가기

Programming/병렬처리(CUDA)

CUDA driver version is insufficient for CUDA run time version CUDA를 사용하다보면 아래와 같은 오류가 발생하는 경우가 있다. CUDA driver version is insufficient for CUDA run time version 현재 PCL을 이용해서 CUDA를 사용하려고 하고 있는데 검색을 해보니 Tensorflow에서도 CUDA 사용 시 같은 에러가 발생하는 경우가 있다고 한다. 이 때의 해결 방법은 GeForce Experience를 이용하여 그래픽 카드 드라이버를 최신으로 업데이트해주면 해결된다. 더보기
[CUDA] nVidia GPU의 CUDA 관련상세 Specification 정보 알아보기 출처 : http://icysword.blog.me/140202060932 nVidia GPU의 CUDA 관련상세 Specification 정보 알아보기 CUDA 학습을 하기 위하여 nVidia 그래픽 카드 장착후 해당 GPU의 상세 스펙을 알고 싶은데, 사이트에서 찾을 수가 없다. (내가 영어가 약해서 잘 찾지를 못하는 건가 ??? ㅠㅠ) 간단한 예제 프로그램으로 해당 정보를 알 수가 있다. [-] Collapse 위의 Code로 cu 파일을 만들어서 실행하면 화면에 CUDA 관련 상세한 Spec이 출력된다. cudaDeviceProp 의 각 Property의 의미는 아래와 같다. [-] Collapse 위의 방법 말고도 CUDA 설치 파일 중에 deviceQuery.exe 파일을 실행해도 된다. de.. 더보기
[CUDA] 용어 정리 출처 : http://icysword.blog.me/140202059108 SP (Streaming Processor) : GPU 에서 연산을 하는 코어 유닛. 연산을 위한 레지스터, 실수연산용FPU (FP), 정수연산용 ALU (Int), 데이터 로드/스토어용 LSU (move, cmp) . CUDA에서 4개의 Thread를 동작 SFU (Special Function Unit) : Sin, Cos, 역수, 제곱근, Graphic Interpolation 등 특수연산 SM (Streaming Multiprocessor) : 8개 SP, 2개의 SFU, 공유메모리, 캐시로 구성. CUDA에서 워프와 블록을 실행 GTX 770 같은 경우는 8 SM x 192 Core = 1536 CUDA Core 이다. .. 더보기
[CUDA] Visual Studio 2013에서 CUDA 개발 환경 구축 출처 : http://bwoh.tistory.com/79 VS2013에서 CUDA 개발 환경 구축 CUDA설치방법(VS2013).pdf 위의 pdf 파일을 열 수 없으신 분들은 다음의 그림들을 참조하십시오. Microsoft Dream Spark : http://www.dreamspark.comCUDA-Zone : http://developer.nvidia.com/cuda-zoneCUDA 6.5 다운로드: http://developer.nvidia.com/cuda-downloads (아래 그림 링크는 안 열리니 위의 링크를 사용하세요~) 더보기
[CUDA] CUDA C 프로그래밍 예제 출처 : http://blog.naver.com/lsh00124/220648533555 CUDA C 프로그래밍 예제 Standard C Code C with CUDA extensions 호스트, 디바이스 메모리 할당 및 초기화 호스트에서 디바이스로 메모리 카피 커널 실행 디바이스에서 호스트로 메모리 카피(결과값 전달) 호스트, 디바이스 메모리 할당 예제 더보기
CUDA C 확장 키워드(CUDA C Extension) CUDA C extension, 즉 CUDA C에서 확장된 키워드들에 대하여 소개하고자 합니다. 예제 코드를 보면 __global__과 같은 키워드들을 발견할 수 있을 것입니다. 이러한 키워드들이 어떤 의미이며 무슨 역할을 하는지 알아야 보다 효율적인 프로그래밍을 할 수 있을 것입니다. 1. 함수의 수식어 함수의 수식어들은 어디서 호출할 수 있느냐와 어디서 실행되느냐에 따라 나뉩니다. __global__, __device__, __host__, __device__ __host__ 이렇게 총 4가지의 경우가 가능합니다. __global__ 디바이스에서 실행되는 함수를 뜻합니다. 여기서 device란 이전 포스팅에서도 언급했듯이 GPU를 뜻합니다. __global__로 수식된 함수는 host에서 호출할 수는.. 더보기