칫솔_초이의 IT 휴게실


글쓴 이 - 칫솔(CHiTSOL, PHILSIK CHOI) | 인사이드 디지털/개인 컴퓨팅 l 2016/05/18 17:40



사용자 삽입 이미지

10세대 그래픽 아키텍처를 담은 지포스 1080과 1070을 처음 공개했던 5월 6일 지포스 이벤트를 끝낸 직후 엔비디아의 테크 에반젤리스트는 세계를 돌며 엔비디아의 새 GPU에 대한 상세 정보를 설명하는 브리핑을 하고 있다. 이들이 한국에서 브리핑을 한 것은 5월 17일. 그런데 이날 브리핑은 5월 6일 발표를 복기한 것만이 아니었다. 한국 시각으로 17일 밤 10시까지 보도 유예를 전제로 세부 제원과 관련 기술에 대한 브리핑도 함께 진행되었기 때문이다. 때문에 앞서 지난 5월 6일 이후 정리한 엔비디아가 지포스 GTX 1080/1070의 특징과 관련 소프트웨어 기술에 대한 소개 외에 엔비디아의 추가 브리핑은 한걸음 더 들어가볼 필요가 있다.

사용자 삽입 이미지

먼저 파스칼 기반 GTX 1080의 구성을 짤막하게 정리하면 이렇다. 엔비디아 GTX 1080은 20개의 스트리밍 멀티프로세서마다 128개의 쿠다 코어를 넣어 모두 2560개의 쿠다 코어를 넣었다. 이는 GTX 980의 2048보다는 512개 더 많고, GTX 980 Ti보다 256개 적다. 텍스처 유닛은 160개로 추정된다. 집적된 트랜지스터는 모두 72억개. GTX 980의 52억개보다 20억개 더 늘어났다. 코어의 기본 클럭은 1607MHz로 종전 GTX 980의 1126MHz보다 높아졌고, 부스트 클럭도 1733MHz까지 올라간다. 이를 통해 GTX 1080은 초당 9테라플롭스를 처리할 수 있는데, 이는 GTX 980 5테라플롭스보다 4테라플롭스나 높은 수치다. 메모리 버스폭은 256비트지만, GDDR5X를 채택해 메모리 효율을 높였다. 또한 8개의 메모리 컨트롤러를 담아 좀더 폭넓게 활용할 수 있도록 했다. 열 설계 전력은 180W로 980의 165W보다 조금 더 높아졌다. 생산은 TSMC에서 16nm 공정으로 출하된다.

사실 GTX 980보다 많은 면에서 발전한 것은 분명하지만, 실제 벤치마크 결과는 예상 이상이라고 말하기는 어려울 수 있다. 기존 벤치마크 프로그램을 통한 테스트 결과로는 4K에서 15% 정도의 성능 향상만 기대할 수 있어서다. 벤치마크 결과를 중시하는 이용자에게 GTX 1080은 큰 변화가 없는 듯 보일 수도 있지만, 사실 벤치마크 성적으로만 말할 수 없는 부분도 적지 않다.

사용자 삽입 이미지

무엇보다 이번 GTX 1080의 눈여겨 볼 키워드는 효율성이다. 파스칼 아키텍처와 기판, 메모리 대역폭의 의미 있는 최적화는 여전히 중요하지만, 한편으로는 오늘날 달라진 그래픽 환경에 GPU가 무엇을 대응해야 하는지 보여준 점이 무엇보다 중요하다.

사용자 삽입 이미지

그 중 하나가 시뮬테이너스 멀티 프로젝션(Simultaneous Multi Projection, 이하 SMP)이다. SMP는 ‘동시 다중 투영법’이라는 매우 어색한 직역에도 불구하고 아마도 많은 이들이, 특히 다중 모니터를 쓰고 있는 게이머들이 바랐을 기술이다. 왜냐하면 SMP는 표시 환경이 다양해짐에 따라 GPU의 렌더링 방법을 바꾸는 것이기 때문이다. 지금 모니터를 두 대 이상 쓸 때도 있고, 더 넓은 해상도를 가진 커브드 모니터도 나오고 있는데다, VR처럼 시점에 따라 출력 결과가 바뀌는 다양한 출력 환경으로 바뀌고 있다는 점을 감안한 것이다.

사용자 삽입 이미지

보통 대부분 게임이나 3D 그래픽 결과물을 볼 때 모니터를 통해 평면적인 이미지를 보게 된다. 때문에 그래픽 카드는 모니터 앞에 있는 이용자를 기준으로 1개의 뷰포트를 렌더링해 모니터에 표시한다. 문제는 종전 그래픽 카드에서 여러 모니터를 연결해도 단일 뷰포트 방식으로 인해 좌우의 렌더링 이미지가 3D 게임이나 3D 그래픽의 좌우가 아니라 화면 중앙을 중점으로 양옆만 보게 된다는 점이다. 우리가 좌우로 고개를 돌려서 볼 때와 다르게 모니터의 양옆 대각선 방향에 있는 그래픽을 좌우 모니터에 표시하는 셈이다.

이는 실제로 보는 것과 상당한 차이가 있다. 이를 테면 3개의 모니터에서 즐기는 레이싱 게임을 보자. 가운데 모니터는 자동차의 운전석에 앉은 듯한 그래픽을 정상적으로 표시하는 반면, 좌우 모니터에 표시되는 그래픽은 사이드 미러가 비정상적인 길게 그려진다. 실제 운전석과 같은 분위기를 내고자 했지만, 왜곡된 그래픽으로 인해 오히려 어색할 수밖에 없다. 이를 피하려면 각 모니터별로 별도의 그래픽 카드를 꽂아야 뷰포트를 늘려야만 한다.

사용자 삽입 이미지

SMP는 하나의 그래픽 카드에서 이러한 왜곡을 줄인다. 단일 뷰포트 대신 최대 16개의 뷰포트를 만들어 각 방향에 맞는 그래픽 렌더링을 하나의 GPU로 처리할 수 있도록 만든 것이다. 때문에 3개의 모니터로 전방 서라운드 모니터 환경을 구축했다면 이제는 왜곡 없는 그래픽을 즐길 수 있다.

SMP가 다중 모니터에서 왜곡된 그래픽을 바로 잡았다면, VR 환경에서 불필요한 렌더링을 하지 않도록 만든다. 보통 VR은 기본적으로 물고기 눈으로 보는 것처럼 왜곡된 렌더링 이미지를 렌즈를 통해 겹쳐 보는 것으로 공간감을 만든다. 이때 파스칼 아키텍처는 왜곡된 렌더링 이미지에 다중 뷰포트를 적용한 뒤 렌즈를 통해서 보게 되는 그 이외의 픽셀 렌더링을 하지 않도록 생략한다. 픽셀 렌더링이 생략되면 그만큼 처리해야 할 데이터가 줄어드는 만큼 더 빠르고 부드러운 가상 현실 그래픽을 경험할 수 있다.

사용자 삽입 이미지

그런데 가상 현실을 위해서 파스칼 아키텍처에 추가한 것은 이것 만이 아니다. 보통 VR을 위해선 좌우 두 개의 그래픽을 렌더링 하는 것이 정석이었다. 우리가 두 눈으로 보면서 공간을 인지하는 것과 마찬가지로 가상 현실도 두 장의 이미지가 필요한 셈이다. 문제는 응용 프로그램이 보내는 좌우 두 개의 그래픽을 동시에 렌더링할 때 그래픽 카드에 걸리는 부하가 그만큼 큰데, 이것이 고화질 가상 현실에서 요구하는 프레임을 떨어뜨리는 이유가 된다.

때문에 엔비디아는 싱글 패스 스테레오라는 기술로 이 문제를 해결하려고 했다. 두 개의 지오메트리 그래픽을 렌더링하던 종전 방식 대신 1개의 지오메트리 정보를 이용해 응용 프로그램이 보내면 GPU가 이를 받아 자동적으로 두 개의 지오메트리를 생성하는 것이다. 즉, 종전에는 처리해야 할 데이터가 두 개였고 출력도 2개였던 반면, 싱글 패스 스테레오 방식은 처리해야 할 데이터는 하나이고 출력은 두개가 되는 셈이다. 실제로 이어진 시연에서 싱글 패스 방식을 쓰지 않을 때 60fps였던 것이 싱글 패스 적용 후 90fps로 증가한 것은 이 방식이 좀더 효율적이라는 것을 보여준 셈이다.

사용자 삽입 이미지

인핸스트 에이싱크 컴퓨트(Enhanced ASYNC Compute)도 종전 맥스웰 아키텍처에서 달라진 부분이다. 이는 GPU가 그래픽 프로세싱 뿐만 아니라 컴퓨팅 프로세싱을 많이 하는 점을 감안해 개선한 부분이다. 물리 엔진에서 대부분의 연산 작업은 그래픽과 관련된 것이지만, 일반적인 연산도 상당부분 처리해야 하기 때문에 GPU는 이 두 가지 일을 하도록 만들어 왔다. 종전 맥스웰은 GPU와 연산 처리를 위해 정적 파티션 개념을 도입했다. 즉, 그래픽 처리를 하는 유닛과 연산 처리를 하는 유닛을 따로 정의한 뒤 그 일만 처리하도록 했던 것이다. 이같은 정적 파티션 개념에서 유닛의 효율성이 문제다. 즉, 연산이든 그래픽 처리든 먼저 처리가 끝난 유닛은 다른 유닛의 작업이 끝나 재 정의될 때까지 놀아야 한다는 점이다. 때문에 파스칼 아키텍처는 이를 보완하는 다이내믹 밸런싱을 도입했다. GPU에서 연산이 끝난 유닛이 곧바로 그래픽 처리로 활용할 수 있도록 해 전반적인 처리 효율을 높인 것이다.

사용자 삽입 이미지

그런데 파스칼 아키텍처는 여기에 파스칼 프리엠션(Preemption)을 더했다. 이는 연산을 우선할 것인지, 그래픽을 먼저 처리할 것인지에 따라 이전 작업을 중단하도 우선 순위의 작업을 먼저 처리한 뒤 나머지 작업을 처리하는 것이다. 이를 도입한 이유는 가상 현실 때문이다. 예를 들어 VR HMD를 움직일 때 그 움직임을 처리하는 연산부터 끝내고 그 뒤에 그래픽을 처리하는 것이 효율적이면서 움직임에 따른 시차가 발생하지 않는 만큼 가상 현실에 더 알맞다고 판단했기 때문이다. 이 때 그래픽 프리엠션으로 인해 작업 중이던 렌더링은 픽셀 레벨에서 중단되고, 반대로 컴퓨팅 프리엠션은 스레드 레벨에서 중단할 수 있다. 이 기술로 인해 이용자가 실제로 보는 방향과 거의 일치하는 그래픽 렌더링을 할 수 있게 되는데, 레이턴시와 렌더링 속도가 동시에 해결된다. 이 프리엠션은 다이렉트X12에서 스레드 레벨에서 작동하며 쿠다(CUDA) 환경에서는 인스트럭션 레벨에서 이용할 수 있다.

사용자 삽입 이미지

이 밖에도 HDR 게이밍과 패스트싱크, 새로운 SLI, GPU 부스트 3.0 등 파스칼 아키텍처는 상당한 변화를 담고 있다. 단순히 벤치마크로만 볼 수 없는 요소들, 특히 가상 현실과 다중 모니터 이용 환경에 대한 의미 있는 변화는 종전 맥스웰 아키텍처의 GPU 에서는 경험할 수 없는 것들이다. 이처럼 현실적인 그래픽 환경에 맞춰 최적화한 파스칼 아키텍처를 얹은 지포스 GTX 1080은 계산된 결과 값이 아닌 눈으로 보는 환경에 맞춘 그래픽 카드다. 지포스 GTX 1080은 5월 27일 정식 출시된다.


Add to Flipboard Magazine.

TRACKBACK :: 이 글에는 트랙백을 보낼 수 없습니다

댓글을 달아 주세요

1  ... 5 6 7 8 9 10 11 12 13  ... 352 
가깝지만 다른 디지털을 말한다by 칫솔

카테고리

전체 (2412)
인사이드 디지털 (1727)
블로그 소식 (80)
하드웨어 돋보기 (267)
칫솔질 (254)
기억의 단편들 (10)
앱 돋보기 (46)
기타 관심사 (4)
스타트업(Start-Up) (5)