쉽게 배우는 인텔 차세대 CPU 아키텍처

사용자 삽입 이미지
인텔이 오는 11월에 출시할 차기 프로세서 아키텍처는 ‘네할렘’입니다. 바꿔 말하면 11월에 지금 쓰고 있는 CPU와 조금 다르게 설계된 새로운 인텔 고성능 CPU가 나온다는 이야기지요. 그것이 ‘코어 i7’이라는 이름을 달고 나오게 됩니다(지금 궁금한 분은 ‘코어 4개짜리 데스크톱 CPU가 기본인 시대 오나?‘를 참고하면 될 듯 합니다. ^^)


이미 기술에 대한 발표는 지난 8월 샌프란시스코 인텔 개발자 회의에서 공개가 되었고요. 문제는 소비자들이 그 많은 특징을 줄줄이 꿰고 사는 것도 아닌데 네할렘을 너무 기술적으로 설명하면 이해할 수 있는 사람은 몇 되지 않을 거에요. 그런데 대만 IDF 첫째 날의 두 번째 기조연설과 둘 째날의 첫 번째 기조연설에서 네할렘의 여러 특징들을 비교적 쉽게 설명했습니다. 이 중에 세 가지 정도의 특징을 사진과 동영상으로 보여드리도록 하겠습니다.

공인된 오버클럭, 터보 부스트 모드
터보 부스트 모드는 CPU의 클럭보다 좀더 높은 클럭으로 작업을 처리하는 것으로 오버클럭 기술입니다. 상황에 따라 이를 적절히 활용함으로써 전력을 줄이면서 성능을 높이는 효과를 내는 네할렘만의 기술입니다.


사용자 삽입 이미지네할렘은 쿼드 코어, 그러니까 4개의 코어를 기본으로 갖고 있는 CPU 아키텍처입니다. 일반적인 쿼드 코어 프로세서는 이렇게 4개의 코어가 정상적인 클럭으로 작동하게 됩니다.


사용자 삽입 이미지하지만 특별히 여러 작업을 동시에 수행할 필요가 없다면 코어마다 하나씩 붙어 있는 파워 게이트로 코어로 공급되는 전원을 차단합니다. 다른 말로 하면 스위치를 내려 전등을 끈다는 이야기지요. 대기 상태가 아니라 완전히 끄는 것입니다. 이렇게 되면 네할렘은 1개 또는 2개의 코어만 갖고도 작업을 처리합니다. 2개 또는 3개 코어가 쉬는 만큼 전력을 아낄 수 있게 되지요.


사용자 삽입 이미지1~2개의 코어로 작업할 때 이를 좀더 빠르게 처리하기 위해서 그 코어의 클럭을 조금 높입니다. 터보 부스트 모드는 1단계와 2단계로 나뉘어지는데, 이는 처리량에 따라서 결정됩니다.

사용자 삽입 이미지
(사진 촬영 및 제공 : 아크로팬 류재용 기자)
물론 4개 코어가 모두 터보 부스트 모드로 작동할 수도 있습니다. 이렇게 되면 그 전력 소비가 엄청나겠죠. 그래도 작업량에 따라서는 그렇게 작동할 것입니다. 아직 많은 애플리케이션들이 멀티 코어에 최적화된 것은 아니기에 이러한 코어 조절이나 터보 부스트 모드는 높은 효율성을 가져다 주리라 봅니다.

돌아온 하이퍼 스레딩
인텔의 펜티엄 4에서 선보여진 기술이었다가, 코어 아키텍처 시절로 넘어오면서 사라졌습니다. 그런데 다시 하이퍼 스레딩이 등장했습니다. 하이퍼 스레딩은 쓰고 있지 않는 실행 유닛에 다른 스레드(작업)을 처리하도록 함으로써 좀더 빠르게 결과를 얻도록 만드는 것인데, 1개 코어가 같은 시간에 2개의 작업을 처리하는 만큼 마치 2개 코어의 효과를 내는 것처럼 비쳐집니다. 이에 관한 간단한 동영상을 하나 보시면 이해가 쉬울 것 같네요.

펜티엄 4에서 하이퍼 스레딩을 없앤 이유는 두 개 작업을 처리하기 위해 코어의 전력을 더 많이 썼던 탓인데, 네할렘에서는 예전보다 오히려 전력 효율성을 강조하면서 등장했습니다. 2개 스레드를 1개 코어에서 실행하더라도 증가되는 전력은 코어 1개를 더하는 것보다는 적다고 보충했습니다.

아, 이전 운영체제는 하이퍼 스레딩이 적용된 펜티엄 4를 2개 코어가 들어 있는 CPU로 인식해 두개의 코어 작동 그래프를 보여줬는데요. 이번 4코어 네할렘의 코어 작동 모습이 잠시 스쳐 지나가면서 8개를 찍고 지나가더군요. ^^

사용자 삽입 이미지
반복 실행 작업의 축소와 제거
CPU가 작업을 처리하기 위해 진행되는 일상적인 실행 과정을 최적화한 요소입니다. 이는 어떤 작업을 실행할 때 반복되는 과정이 있는 작업인지 여부를 반복 스트림 검출기(loop stream detector)가 확인한 뒤 분기 예측(Branch prediction), 페치(fetch), 디코드(decode) 등의 작업을 다시 하지 않도록 해 실행 이전의 단계를 줄입니다.
사용자 삽입 이미지이 사진을 보면 좀더 이해가 쉬울 텐데요. 반복 작업을 해야 하는 같은 스트림을 처리할 때 LSD(loop stream detector)가 있는 쪽의 두 번째 작업은 적재 장소(Queue)에서 진행되지만, LSD가 없으면 맨 처음부터 다시 해야 합니다.
 
복잡한 작업에 알맞는 고성능 프로세서
지금까지 설명한 것들이 어느 정도 성능을 내느냐가 문제겠지요. 사실 네할렘의 성능은 이번에 처음 공식적으로 공개되었습니다. 아래 이미지는 소니 애니메이션 스튜디오에서 네할렘과 쿼드 코어 펜린을 동시에 수행하는 장면을 찍은 것인데요. 네할렘이 두배 빠르게 작업을 완료하는 모습을 보여주더군요. 물론 모든 작업에서 2배 빠르게 된다는 이야기는 아닙니다. 아마도 3D 렌더링이나 게임 등에서 효율적이리라 보입니다.

사용자 삽입 이미지
펜린 VS 네할렘
기조연설이 끝나고 1층 전시장으로 내려가 준비된 네할렘 시스템에서 ‘에너미 테러토리 – 퀘이크 워즈’라는 3D 게임을 즐겨보니 이건 뭐…(할말을 잊은… -.ㅡㅋ). 크로스파이어로 묶은 그래픽카드도 한 몫 했겠지만, 정말 날아다닌다는 표현을 안쓸래야 안쓸 수 없는 그런 상황이었습니다. 머지 않아 우리나라에도 발표할 테니 그 때 보실 수 있을 듯.

위와 같은 두 가지 사례로 보면 네할렘 포지션은 명확합니다. 네할렘의 인텔의 차기 프로세서 기술은 맞지만, 당분간 일상적인 PC 프로세서로 쓰이지는 않을 거라는 점이지요. 고성능 게이밍 PC이나 그래픽 워크스테이션, 서버 등 고성능 시스템 시장을 겨냥합니다. 언제나 차세대 프로세서 기술을 내놓을 때 고성능 제품부터 내놓는 절차를 따르는 것이니 언젠가는 좀더 보편화된 것도 나오게 될 것입니다. 다만 이날 보여준 것만큼 더 좋은 평가를 받을지는 역시 제품이 나와야 알 수 있겠죠? ^^


PHIL CHiTSOL CHOI Written by:

9 Comments

  1. 2008년 10월 23일
    Reply

    다시한번 말하지만 인텔은 정말 대단한 것 같아요….ㅡ.ㅡ;;;;;;;

  2. 2008년 10월 23일
    Reply

    어디선가 확실히 신형 UFO를 주웠나봐요 ㄱ-

    그런데 Intel에서도 AMD처럼 메모리 컨트롤러를 내장을 시키는군요 -ㅁ-

    700 post축하드려요 ㅎ /ㅁ/

    • 칫솔
      2008년 10월 24일
      Reply

      메모리 컨트롤러 뿐만 아니라 그래픽도 내장되겠지요.
      그나저나 대신 셈을 해 주셔서 고맙습니다. ^^;

  3. 2008년 10월 23일
    Reply

    쌩뚱맞은 생각인진 모르겠지만..
    기왕에 오버클럭 인정하는 분위기로 간다면
    아예 그냥 오버해놓은 상태 그대로 출시를 하면 그만이지 왜 유저에게
    오버클럭을 해라말라의 선택권을 주는걸까요 -,.-

    • 2008년 10월 23일
      Reply

      오버클럭을 해라말라의 선택권 같은 것을 메이커가 준적은 사실상 존재하지 않습니다.

      메이커는 CPU를 양산할 때 “이 칩은 2GHz용으로 만들겠다. 이 칩은 2.4GHz용으로 만들겠다.”처럼 미리 의도한 속도에 맞추어서 찍어내는 것이 아닙니다.

      메이커는 양산시에 우선 자신들의 사전 의도대로 설계된 칩을 하나씩 생산하는 것이 아니라, 하나의 커다란 웨이퍼 위에 프로세서 칩을 수백개를 박아낸 후에 하나 하나 떼어내서 각 프로세서 칩을 테스트를 해서 출하합니다.

      이 때 하나의 웨이퍼에서 뜯어낸 칩들인데 불구하고 각각이 특성이 전부 달라서, 어떤 칩은 높은 클락에도 잘 견디지만, 어떤 칩은 낮은 클락에서만 견딥니다.

      이 때 각 칩을 테스트 결과에 따라서 출하시에 자신들의 품질 보장 기준에 따라 패키징(반도체 칩을 우리가 흔히 CPU라고 생각하는 딱딱한 플라스틱 케이스로 싸는 작업)해서 출시하는 것입니다.

      이 때 회사의 품질 보장(유상 A/S 기간으로 명시되는)정책으로 인해서, 칩들을 각 칩의 Red zone에 들어가는 클럭 주파수에 맞춰서 패키징을 할 수 없습니다.

      Red zone에 해당하는 클락으로 프로세서를 돌릴 경우는 칩의 발열량이 크기 때문에 패키징 비용과 번들 쿨러의 제작 단가가 올라가고, 발열이 많으면 프로세서 칩이 사망하실 확률이 높아 소비자 판매 이후 문제가 생길 경우의 후처리 비용(무상 교환 등)이 상승하게 됩니다.

      따라서, 각 칩들의 테스트 결과를 토대로 자신들의 비용면에서 적정 수준의 출하 클럭을 책정할 뿐, 메이커들은 오버 클럭이라는 행위 자체를 출시 시에 고려하지 않습니다.

      단지 모회사 같은 경우에는 인텔 칩에 비해서 그 마진 폭을 크게 잡아놓기 때문에 오버클럭에 유리한 칩이라고 알려진 것 뿐입니다.

      (이는 모회사가 인텔에 비해 총알이 달리기 때문에 자신이 책임지지 않아도 되는 범위를 늘리기 위해서 이렇게 한 것 뿐입니다. 그 뿐 아니라, 후처리 비용 감소로 인해서 프로세서당 제조원가도 낮출 수 있습니다. 결국 싸게 팔 수 있단 거죠.)

      위의 기술은 제가 볼 때는 오버클럭을 인정하는 분위기인 것이 아니라, 짧은 순간만 몇몇 프로세서를 일시적으로 높은 클럭으로 돌려서 부족한 성능(전력 소비 감소를 위해서 다른 코어들을 재워놓았으므로)을 메우려는 시도로 생각됩니다.

      저 상태로 오래 수행을 하다간 코어들이 사망하실 수도 있을 겁니다.

    • 칫솔
      2008년 10월 24일
      Reply

      오버 클럭된 상태로 내놓게 되면 전력의 소모가 상당하겠죠. 또한 유저에게 오버 클럭의 선택권을 주는 것은 아니랍니다. ^^

  4. 2008년 10월 23일
    Reply

    뭔지 몰라도 차 3대의 속도로 컴퓨터를 할수있다니 흐뭇
    (억.._)

    • 칫솔
      2008년 10월 24일
      Reply

      ㅋ… 언제나 차세대의 속도였지요?

  5. 2008년 10월 25일
    Reply

    그래픽 코어 까지 내장되면 PS Emotion Engine을 대체 가능할려나요 ㅋㅋ
    그래픽 카드는 일종의 편법으로 cpu가 처리 못해서 분화되면서 메모리의 양과 버스의 속도가
    늘어나게 된 결정적 원인 제공자이니 말이죠 ㅋ

    방구석에 처박힌 CyrixGX를 인텔이 이제 기술로 커버하고 사용하는 느낌이 듭니다.
    Cyrix(현 VIA)도 AMD도 intel x86 clon이었는데 intel이 그 기술들을 역으로 다시 사용하는 느낌이니
    또 다른 모습의 feedback이라고 해야 할려나요?

    CyrixMedia GX가 정확한 이름인데 제 기억상으로는 최초로 사운드/그래픽을 전부 cpu on-chip화 한것으로 알고 있습니다(on-die 정도는 아닐지도?)

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다