FAQ-CUDA
홈 > CUDA > FAQ-CUDA

Fermi(페르미 C2050)의 성능 및 장점은?

미루웨어

2010-04-19

6129
 

Fermi 배정도 정밀도 계산의 성능 향상, 케쉬 메모리 사용에 따른 어플리케이션 속도 증가, 통합 메모리 구조를 이용한 C++ 언어 사용가능, DDR5 메모리 사용을 통한 메모리 대역폭 증가 등입니다. 이외에도 ECC 통한 계산의 정확도 보장, 이중 WARP엔진, 이중 메모리엔진 등의 기능을 이용할 있습니다.

 

특히, 순수한 계산부문만을 살펴볼 배정도 정밀도 연산의 속도향상이 가장 특징입니다. 배정도 정밀도 실수연산의 이론치 성능은 연구시 700 Gflops 정도로 알려져 있습니다. 최종 C2050 스펙에서는 515Gflops 정해졌습니다. GTC 2009 행사와 SC 행사등에서의 데모 벤치마크 성능을 살펴보면,  Linpack 결과의 성능이 380Gflops 정도로 알려져 있습니다. 이론 성능보다는 낮은 수치이지만, 실제 어플리케이션이나 연구를 하는데, 참고하실 있습니다.

 

Tesla C1060에서의 배정도 정밀도의 성능은 이론치가 78 Gflops 점과 비교한다면, 거의 8 정도의 속도향상이라는 점을 파악하실 있을 겁니다.  하지만, 배정도 정밀도 실수 연산에 비하여 상대적으로 단정도 정밀도의 실수연산 정수 연산의 속도는 크게 증가되지 않았습니다. Fermi C2050 단정도 실수 연산의 이론치 성능은 1.03 Tflops Tesla C1060 이론치 성능인 993Gflops 비교해보면, 향상이 없는 것을 확인하실 있습니다. 따라서, 사용하는 알고리즘에 따라 Fermi기반의 Tesla C2050 사용하실지 Tesla C1060 사용하실지 고려하셔야 합니다.

 

일반적으로 이미지 영상처리 처리 알고리즘은 대부분 정수와 단정도 정밀도의 실수 연산을 하게 되므로, C1060 사용하시는 것이 가격대 성능비 면에서 장점으로 작용하실 있습니다. 하지만, Fermi 새로운 기능을 이용해야 하는 경우에는 Fermi 사용하셔야 합니다. 연구분야와 사용하시는 내용과 함께 메일(david.yang@miruware.com) 질문해주시면 지금까지의 경험을 바탕으로 미루웨어에서 다양한 컨설팅이 가능할 것으로 생각됩니다.

 

Fermi(페르미 C2050)은 어디서 구매하나요?

Fermi(페르미 C2050)의 종류와 가격은?
목록보기