FAQ-CUDA
홈 > CUDA > FAQ-CUDA

Fermi(페르미 C2050)의 싱글과 더블 프리시젼 성능은?

미루웨어

2010-04-19

5452
 

배정도 정밀도 실수연산의 이론치 성능은 C2050 스펙에서는 515Gflops 정해졌습니다. GTC 2009 행사와 SC 행사등에서의 데모 벤치마크 성능을 살펴보면, Linpack 결과의 성능이 380Gflops 정도로 알려져 있습니다. 이론 성능보다는 낮은 수치이지만, 실제 어플리케이션이나 연구를 하는데, 참고하실 있습니다.

 

Tesla C1060에서의 배정도 정밀도의 성능은 이론치가 78 Gflops 점과 비교한다면, 거의 8 정도의 속도향상이라는 점을 파악하실 있을 겁니다.  하지만, 배정도 정밀도 실수 연산에 비하여 상대적으로 단정도 정밀도의 실수연산 정수 연산의 속도는 크게 증가되지 않았습니다. Fermi C2050 단정도 실수 연산의 이론치 성능은 1.03 Tflops Tesla C1060 이론치 성능인 993Gflops 비교해보면, 향상이 없는 것을 확인하실 있습니다. 따라서, 사용하는 알고리즘에 따라 Fermi기반의 Tesla C2050 사용하실지 Tesla C1060 사용하실지 고려하셔야 합니다.

 

Fermi C2050 제원표는 다음과 같습니다.

 

요소

특징

CUDA 코어

448

코어 클럭

1.15Ghz

배정도 실수연산 이론치(DP)

515 Gflops

단정도 실수연산 이론치(SP)

1.03 Tflops

메모리

3GB DDR5 (Tesla C2050)

6GB DDR5 (Tesla C2070)

메모리 속도

1.5Ghz

메모리 인터페이스

384 bit (DDR5)

메모리 대역폭

144GB/s

소비전력

247W

인터페이스

PCI-e Gen2 16배속

 

 

 

Fermi(페르미 C2050)을 몇 대까지 장착 가능한가요?

Fermi(페르미 C2050) 캐쉬 메모리는?
목록보기