1차 Test
대상 : 644*484 Color이미지의 Red와 Green색상 변경.
코드 : CPU용 이중 for문으로 구성, GPU Cuda 병렬 처리 방식으로 구성.
속도 : CPU 3 msec, GPU 11 msec CPU가 빠르다.(debug, release 같은 현상)
-> Memory 생성 복사가 추가 되었음으로 CPU 쪽에도 추가 ( 속도 변화 없음)
결론 : Data양이 적을때에는 CPU가 3배 이상 빠르다.(GPU로 메모리 복사가 생기지 않음으로)
- CPU : 적은 Data, 복잡한 연산에 적합.
- GPU : 다량의 Data, 단순(CPU에 비해) 연산에 적합.
2차 Test
대상 : 상동
코드 : 각 처리위치 반복 수행 제일 안쪽에서 같은 동작 1000회 반복.
속도 : debug Mode : CPU 2438 msec, GPU 2829 msec
Release Mode: CPU 1180msec, GPU 3 msec(393배 빠름)
*cudaDeviceSynchronize();로 GPU 동작 완료 체크.
추가 : 이미지 크기 9999*7514 크기 Test
1회교환
Debug : CPU 930 msec, GPU : 2598 msec
Release : CPU 139 msec, GPU : 358 msec
100회 교환
Release : CPU 32288 msec, GPU : 378(최초 511) msec
1000회 교환
Release : CPU 측정 불가, GPU : 352 msec
'작업 > Cuda' 카테고리의 다른 글
RTX 2050 CUDA Version 11.0 이상 (0) | 2025.05.22 |
---|---|
NVIDIA Cuda Cores 참고 (0) | 2022.02.24 |
Cuda Block Thread 설정. (0) | 2020.05.26 |
기존 Project Cuda Link時 오류 (1) | 2020.05.06 |
VS2017 - NVIDIA Cuda 연결 (0) | 2019.12.03 |