CUDA 2.2/2.3 의 Run time 비교

이전 포스트에 언급했던 작업결과페이지의 변화로 이제 CUDA MB 의 작업시간도 다른작업들과같이 한눈에 확인할수있게 되었다.

그래서 이번에 이것을 이용해 CUDA 2.2 버전과 2.3 버전의 효율비교를 해보기로했는데, 과연 떠도는 소문들처럼 2.3으로의 업데이트가 30% 의 작업능력 향상을 가져올수있는지 확인해보도록하자.

이번 실험은 AMD Athlon Processor LE-1620 / NVIDIA GeForce 9600 GSO 384MB (Stream Processor 96) 환경에서 2일 동안 처리한 Angle Range(이하 AR) 0.44 인 워크유닛 50개를 비교 표본으로 삼았고 아래 그래프에서 보면 1~21 까지가 CUDA 2.2 구간 22~50 까지가 CUDA 2.3 구간이다.  비교구간안에 간혹 삐죽튀어나온 부분은 AR 이 다른 워크유닛이므로 무시하고, 50 이후 구간에 급격히 낮은 Run Time 을 보이는 표본들은 VHAR 로 AR 이 1.4 근처인 유닛임을 알아두자.

뭐 더 설명할필요가 있을까 싶지만 CUDA 2.2 환경으로 처리했던 21개 워크유닛들은 평균 2600 초, CUDA 2.3 환경으로 처리했던 28개 워크유닛들은 평균 1700 초로 이 짧은 실험결과만으로 봤을때 CUDA 2.3 환경에서 35% 의 성능향상이 있다고 볼수있다.

놀라운건 50 이후 구간의 VHAR 워크유닛들이 예전에 예상했던것과는 달리 Mid Range 유닛에 비해 오히려 더 짧은 Run Time 을 보인다는것이다. 상황이 이렇다면 Reschedule 프로그램은 왜 VHAR 을 GPU 에서 CPU 로 옮기려 하는지 궁금하다. 저걸 CPU 에서 계산하면 더 빠르단 얘긴가?

Creative Commons License

Advertisements

~ by 299,792,458 on November 23, 2009.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

 
%d bloggers like this: