데이터 시대, 옵테인 메모리와 PLC라는 인텔의 방어막

“대체 숨겨 놓은 외계인을 얼마나 고문했길래…”
한계를 모르는 새로운 프로세서를 내놓을 때마다 인텔을 향했던 이러한 찬사는 지금 어디서도 찾아보기 어렵다. 오히려 잠시 성장 동력을 잃고 방황의 시기를 맞이 한 PC 시장에서 혁신의 동력을 제공하기는 커녕 다른 탈출로를 찾아 떠난 인텔을 향한 그리 곱지 않은 시선이 대가로 남았을 뿐이다.

그러한 선택을 두고 인텔은 수십년간 지탱해 온 PC 중심 기업에서 데이터 중심 기업으로 이동 중이라고 말한다. 더 많은 데이터를 처리해야 할 세상을 대비해야 한다는 의미면서 인텔의 주요 수익원이 옮겨졌다는 의미기도 하다. 데이터의 증가 속도가 빠르고 클라우드로 집중되면서 이를 처리할 데이터 센터 같은 대규모 시스템을 위한 제품을 쏟아낼 수밖에 없는 속사정이 있는 것이다.

그런데 인텔이 데이터를 처리하기 위해 꺼낸 것이 프로세서가 아니는 게 흥미롭다. 더 많은 코어를 넣은 데이터 센터용 프로세서의 처리 성능에 목소리를 높일 법한데 다른 문제의 해결에 목소리를 높인 것이다. 특히 데이터를 처리하는 전반적인 과정에서 더 많은 데이터를 효율적으로 처리하는 데 발생하는 간극을 메모리로 지목한 부분은 눈여겨볼 부분이다. 인텔이 인텔 메모리&스토리지 데이(Memory &Storage Day)를 서울에서 개최한 것도 이를 설명하기 위해서다.

폭증하는 데이터 시대에 대한 대비

이 피라미드 구조의 그림은 인텔이 메모리 & 스토리지 데이에서 가장 많이 예시로 든 것이다. 그만큼 인텔이 하고픈 이야기를 이 한 장의 그림에 녹여 놓았다고 보면 된다. 겉으로 볼 땐 매우 어려운 그림일 것 같지만, 사실 컴퓨터 구조를 아는 이들에게 그리 어렵진 않은 그림이다. 이 그림은 프로세서에서 처리해야 할 데이터를 저장하는 장치나 임시로 저장하는 메모리를 속도에 따라 순차적으로 표시한 것이라서다. 처리해야 할 데이터가 가까운 쪽일 수록 피라미드 위쪽에, 멀수록 피라미드 아래쪽에 뒀다. 그러다보니 자연스럽게 캐시, 램, 저장 장치 순서로 보인다.

그런데 10년 전 인텔이 그린 계층 구조 그림은 위와 같다. 이전 계층 그림에 비하면 매우 단순하지만, 더 이해하기 쉬운 구조다. 저장 장치에서 데이터를 읽어 램으로 올리고 램의 데이터 중 즉시 처리에 필요한 데이터를 캐시로 불러 처리하는 구조다. 이 때 인텔은 10년 전 데이터를 저장한 하드디스크를 대신해 X25M이라는 SSD를 만들어 노트북에 실험했고 놀라운 성능을 발견했는데, 이것이 메모리 스토리지의 계층 구조를 바꾸는 첫 계기였다고 회고했다.

이 계층 구조를 반복적으로 설명한 데는 처리해야 할 데이터가 존재하는 장치의 계층에 변화를 줘야 한다는 것을 설명하기 위해서다. 램이나 하드디스크 또는 낸드 플래시에 저장된 데이터를 읽어서 처리하는 기본 구조는 변함이 없지만, 인텔이 말한 10년 전과 비교해 처리해야 할 데이터가 3년마다 2배씩 증가하고 있으나 이 장치들로 그 처리 수요를 감당하기 어렵다고 말한다. 특히 모든 사물의 데이터를 처리해야 할 수백 제타바이트(ZB) 시대에 이르면 기존의 데이터 처리 계층으로는 한계에 이를 수밖에 없다.

인텔은 기존의 데이터를 처리하는 계층 구조에서 이 문제를 보완해야 한다고 보고 있다. 가장 빠른 D램은 용량을 획기적으로 늘려 데이터 증가에 대비하는데 반해, 상대적으로 저장 및 읽기 속도를 끌어 올린 낸드 플래시와 하드디스크 사이에는 점점 간극이 벌어지는 것이다. 계층 그림에서 최상단의 캐시에서 저장 장치 방향으로 10배씩 용량이 증가할 때 성능은 1/10로 낮아지는 규칙성을 더 이상 유지하기 어려워진 것이다. 결국 하드디스크의 느린 속도 증진과 낸드 플래시의 적은 용량 사이에서 벌어진 간극을 메워줄 필요가 생겼고, 인텔은 차세대 옵테인(Optane) 메모리와 펜타 레벨 셀(Penta Level Cell) 낸드 플래시 등으로 이 지점을 공략하는 전략적 선택을 공개한 것이다.

데이터 센터를 파고드는 인텔 옵테인 DC

램은 매우 빠르게 데이터를 쓰고 읽을 수 있지만, 전원이 꺼지면 그 안에 있던 정보까지 사라지는 메모리다. 그런데 램은 다 그런 것이라는 상식을 깨는 메모리가 3D 크로스포인트 메모리다. 인텔은 램처럼 빠르게 작동하면서도 전원을 공급하지 않을 때 데이터를 유지하는 두 가지 성질을 가진 3D 크로스포인트 메모리를 개발한 뒤 이를 기반으로 옵테인 영구 메모리를 내놓고 있다.

일반적으로 램은 트랜지스터의 게이트를 쓸지 말지 결정하는 비트라인과 값을 저장하는 워드라인을 같은 선상에 배치한다. 그런데 3D 크로스포인트 메모리는 아래쪽에 비트라인을, 위쪽에 워드라인을 서로 엇갈리게 배열한 뒤 그 사이 공간에 전자적 속성과 화학적 속성을 고려해 실리콘과 메탈로 된 2가지 소재로 된 셀을 넣어 마치 램처럼 빠르게 데이터를 쓰고 읽는 동시에 셀 안에 데이터를 저장할 수도 있다. 인텔은 현재 2단으로 쌓은 옵테인을 내놓고 있는데, 앞으로 4단으로 쌓은 옵테인을 통해 속도는 유지하고 용량을 더욱 늘릴 계획이다.

이러한 인텔 옵테인의 등장은 인텔이 원하는 메모리와 저장 장치의 벌어진 격차를 좁히는 기회를 만드는 핵심으로 꼽는다. 램으로 접근하면 큰 용량의 메모리면서 저장 장치로는 접근하면 램만큼 매우 빠르기 때문이다. 무엇보다 셀의 밀도를 좁히면서 데이터를 읽고 쓸 수 있기 때문에 램과 같은 크기라고 해도 훨씬 큰 용량으로 확장할 수 있는데다 일반 저장 장치에 비해 수명도 길다는 특징이 있다.(참고로 낸드 플래시가 셀의 밀도는 훨씬 좁다)

데이터 센터를 위한 스트래틱스 10 개발용 보드.

인텔은 옵테인 메모리를 램 슬롯에 꼽는 모듈 형태로 공급하고 있다. 이것이 데이터 센터용인 옵테인 DC 메모리다. 하지만 인텔은 옵테인 DC 메모리를 최근 제온 프로세서와 짝을 이뤄 고성능 워크스테이션에서 활용할 수 있는 길도 열었다. 하나의 옵테인 DC 램 모듈만으로 512GB를 확장할 수 있기 때문에 대량의 데이터를 처리하는 환경까지 고려한 결정이다.

여기에 데이터 센터의 서버에서 램을 늘려야 하는 상황을 감안해 FPGA 기반 인텔 스트래틱스 10(Stratix 10) 컨트롤러를 탑재한 PCI 보드를 꽂고 UPI로 연동하면 PCI 보드에 꽂은 옵테인 메모리를 전부 램으로 인식하는데, 이를 이용하면 램 안에서 모든 데이터를 저장하고 처리하는 인 메모리 프로세싱을 구축해 더욱 빠르게 데이터를 처리할 수 있다.

옵데인 메모리 기반 제품들

그런데 인텔은 옵테인을 램 형태로 고정하진 않는다. 저장 능력이 있는 만큼 다양한 형태의 옵테인 SSD도 이미 출시하고 있는 상황이다. 전송 대역폭으로 인해 PCI 인터페이스로 연결하고 낸드 플래시에 비하면 적은 최대 1.5TB의 용량까지 구현할 수 있지만, 램과 SSD 사이에 발생하는 지연을 잡아주는 저장 매체로 활용될 수는 있다.

인텔은 서울에서 데이터 센터용 1세대 옵테인 DC SSD인 P4800X가 기존 인텔 낸드 플래시 모델은 P4610보다 더 낮은 대기 시간과 수명을 입증한 결과를 공개했다. P4610 낸드 SSD가 초당 입출력(IOPS)이 늘어날 수록 읽기 대기 시간이 늘어나는 반면, 옵테인 DC SSD는 시간에 상관 없이 아주 낮은 가까운 평균 시간을 기록했다.

인텔 SSD와 옵테인 DC SSD, 그리고 차세대 알더 스트림의 IOPS 대비 레이턴시 비교

흥미롭게도 인텔은 2세대 옵테인 DC SSD인 알더 스트림(Alder Stream)이라 부르는 차세대 옵테인 SSD의 성능도 미리 공개했다. 인텔은 1세대 P4800X의 전체 초당 입출력이 50만 IOPS 이상 높아지면 낸드보다는 적지만 불가피한 지연은 발생한다고 말했다. 하지만 알더 스트림은 50만 IOPS가 넘어도 지연이 거의 발생하지 않는다. 또한 데이터 입출력의 실패율도 기존 SSD에 비해 50배 낮출 수 있기 때문에 데이터 센터의 처리 안정성을 높일 수 있다.

QLC에 넘어 PLC을 겨냥하는 인텔

옵테인 DC 메모리와 SSD가 램과 저장 장치 사이의 간극을 메우는 수단이기는 하나 그래도 대용량 데이터를 저장하기 위한 SSD도 함께 개선해야 한다. 낸드 플래시에서 데이터는 셀 안에 저장된다. 그런데 셀 하나에 하나의 데이터만 담는 것은 아니다. 낸드 플래시도 처음 셀 당 하나의 데이터만 담았으나 이후 하나의 셀에 2개(MLC), 3개(TLC), 그리고 4개(QLC)의 비트를 담는 기술 개선이 이뤄졌다. 낸드 플래시 1개의 용량은 이러한 셀들을 여러 단으로 쌓아 올려 늘리게 되고 고용량 낸드 플래시를 여러개 모아서 만든 것이 SSD 같은 저장 장치가 되는 것이다. 인텔은 데이터 센터를 위해 쿼드 레벨 셀(QLC) 기반 SSD를 상용화했다.

인텔 플로팅 게이트 3D 낸드와 차지 트랩 3D 낸드의 차이

낸드 미디어의 셀당 기록 밀도를 높이면 더 많은 데이터를 담을 수 있기 때문에 수많은 낸드 플래시 제조사들이 많은 투자를 하면서 3D 방식으로 단을 높여 더 큰 용량의 낸드 플래시를 만들고 있다. 그런데 인텔은 다른 제조사에서 쓰는 차지 트랩 방식의 3D 낸드가 아니라 플로팅 게이트 셀 방식의 3D 라는 점을 강조한다. 보통 여러 단의 워드라인 관통하는 차지 스토리지 노드가 연속적으로 연결되어 있는 차지 트랩 방식과 다르게 인텔은 하나의 스토리지 노드가 워드 라인의 단을 관통하는 대신 워드 라인과 워드 라인 마다 플로팅 게이트를 각각 분리해 넣음으로써 셀간 신호 간섭을 최소화하면서 전자 수를 2D 낸드 대비 6배 증가시킨다. 인텔은 플로팅 게이트 셀 방식으로 단을 쌓아 올려 완성한 낸드 플래시가 훨씬 안정적으로 데이터를 저장할 수 있고 그 단면을 보더라도 훨씬 밀도를 높일 수 있다고 이야기한다. 인텔은 이미 96단의 3세대 QLC 낸드 플래시를 올해 선보였고 2020년 4세대 144단을 공개할 예정이다.

인텔은 플로팅 게이트 방식으로 셀당 5비트를 저장하는 펜타 레벨 셀의 미래를 생각하고 있다.

현재 QLC 낸드 플래시의 SSD를 내놓고 있지만, 인텔의 눈은 한 셀에 5개의 비트를 저장하는 PLC(Penta Level Cell)로 향해 있다. PLC를 구현하려면 셀 안에서 32개의 속성을 분리해야 하는데, 셀에 저장하는 전기적 특성을 늘릴 수록 아주 미세하게 제어를 해야 하기 때문에 셀과 셀 사이에 생기는 전기적 간섭을 억제하는 것이 관건이 된다. 인텔은 플로팅 게이트 셀 방식이 이 문제를 해결할 수 있을 것으로 말할 뿐, 아직 이를 구현한 제품을 내놓은 것은 아니다. 다만 셀당 비트 수를 늘리면 같은 크기의 다이와 웨이퍼, SSD와 데이터 센터의 저장 장치를 넣은 랙에서 더 많은 데이터를 저장할 수 있는 만큼 그 도전을 멈추지 않고 계속 진행하는 중이다.

소비자 제품군에도 영향을 미치다

인텔 메모리&스토리지 데이는 대체적으로 데이터 센터를 위한 기술과 제품군을 중심으로 소개됐다. 아쉽게도 옵테인 DC 메모리나 옵테인 DC SSD는 소비자용 프로세서와 메인보드 칩셋에서 지원하지 않으므로 지금 쓸 수 없다. 그러나 데이터 센터의 메모리와 스토리지 기술들 가운데 일부는 이미 소비자용 제품에 적용되는 중이다. 일반 이용자의 컴퓨팅 환경에 맞게 변형했다는 의미다.

그 대표적인 제품이 인텔 옵테인 미디어와 낸드 플래시를 결합한 M.2 폼팩터의 QLC SSD다. 이 제품은 16GB 또는 32GB의 옵테인 메모리와 256GB, 512GB, 1TB의 QLC 낸드를 묶은 패키지로 자주 실행하는 프로그램의 실행 속도를 획기적으로 줄여준다. 인텔은 기존 SSD만 있는 노트북에서 여러 프로그램을 동시에 실행해 40초 가까이 걸리는 작업이 옵테인 메모리 미디어와 인텔 QLC 낸드에서 4초 만에 실행할 수 있음을 실시간으로 시연했다. 자주 실행하는 프로그램을 옵테인 메모리에 캐시로 저장한다는 조건이 있기는 하나 실행하는 프로그램이 제한된 이용자라면 놀라운 변화를 경험할 수 있는 것이다.

다만 인텔이 보여준 변화를 소비자가 받아들이려면 좀더 시간이 필요할 듯하다. 비록 놀라운 결과를 만들어내는 최신 기술의 제품이라도 소비자의 믿음을 얻을 때까지 공감대를 형성하기에 소비자의 경험 데이터가 부족해서다. 하지만 이 지점에서 눈여겨볼 점은 소비자 제품의 데이터 계층 구조가 자연스럽게 바뀌어 가게 될 것이라는 점이다. 데이터를 더욱 빠르게 처리할 수 있는 바람은 데이터 센터와 더불어 소비자도 원하는 것이니 말이다.

PHIL CHiTSOL CHOI Written by:

Be First to Comment

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다