[CUDA] 용어 정리
출처 : http://icysword.blog.me/140202059108 SP (Streaming Processor) : GPU 에서 연산을 하는 코어 유닛. 연산을 위한 레지스터, 실수연산용FPU (FP), 정수연산용 ALU (Int), 데이터 로드/스토어용 LSU (move, cmp) . CUDA에서 4개의 Thread를 동작 SFU (Special Function Unit) : Sin, Cos, 역수, 제곱근, Graphic Interpolation 등 특수연산 SM (Streaming Multiprocessor) : 8개 SP, 2개의 SFU, 공유메모리, 캐시로 구성. CUDA에서 워프와 블록을 실행 GTX 770 같은 경우는 8 SM x 192 Core = 1536 CUDA Core 이다. ..
더보기
[NEON 산술 연산과 확장
NEON 에서는 벡터 변수 사이의 기본 산술 연산을 지원하고, 포화 더하기와 인접 레인 더하기 등 NEON만의 독특한 산술 연산도 지원한다. 또한 최댓값 및 최솟값 연산과 Long, Wide, Narrow, 포화와 관련된 산술 연산을 지원한다. NEON에서는 나누기와 제곱근 연산은 지원하지 않아서 Shift 연산이나 역수를 이용해야 한다. 1. NEON 기본 산술 연산 (더하기, 빼기, 곱하기, 레인 최댓값, 최솟값, 인접 레인 더하기 함수)(1) 더하기 함수uint16x8_t r = vaddq_u16(uint16x8_t a, uint16x8_t b) a + b 를 r벡터에 저장 (2) 빼기 함수uint16x8_t r = vsubq_u16(uint16x8_t a, uint16x8_t b) a - b 를 ..
더보기