FAQ-CUDA
홈 > CUDA > FAQ-CUDA

Fermi(페르미 C2050) 최적화

미루웨어

2010-04-19

5821
 

페르미의 최적화를 위해서는 다음의 하드웨어 스펙에 따른 최적화를 고려해야 합니다. 아래 표에서 호환성 2.0 Fermi 칩을 나타내고 있습니다.

Compute Capability

1.0

1.1

1.2

1.3

2.0

Threads / Warp

32

32

32

32

 32

Max Threads / Block

512

512

512

512

1024

Warps / Multiprocessor

24

24

32

32

48

Threads / Multiprocessor

768

768

1024

1024

 1536

Thread Blocks / Multiprocessor

8

8

8

8

8 

Shared Memory / Multiprocessor (bytes)

16K

16K

16K

16K

48K 

32bit Register / Multiprocessor

8K

8K

16K

16K

32K

Local memory per threads

16K

16K

16K

16K

512K 

 

이외에도, 메모리 엔진의 성능 다양한 요소를 고려해야 합니다. 특히, CUDA toolkit에서 제공하는 Visual Profiler 사용하여 Fermi 최적화에 대한 정보를 얻을 있습니다.

 

보다 자세한 CUDA3.0 대한 내용은 다음의 링크를 참고하시면 됩니다.CUDA C Programming Guide 

http://developer.download.nvidia.com/compute/cuda/3_0/toolkit/docs/NVIDIA_CUDA_ProgrammingGuide.pdf

 

호환성 가이드는 다음의 링크를 참고하시면 됩니다. Fermi Compatibility Guide 

http://developer.download.nvidia.com/compute/cuda/3_0/toolkit/docs/NVIDIA_FermiCompatibilityGuide.pdf

 



Fermi(페르미 C2050) 전원은?

Fermi(페르미 C2050) 코어 개수는?
목록보기