작년 말 세상을 떠들썩하게 만든, ‘챗GPT’의 등장. 출시한 지 5일 만에 100만 명, 두 달 만에 1억 명의 가입자를 확보하며 애플리케이션 역사상 가장 빠른 가입률을 기록했다. 이토록 많은 사람이 챗GPT에 열광한 이유는 무엇일까? 질의응답부터 창작까지, 다양한 기능을 제공할 뿐 아니라 인간과 구분하기 힘들 정도의 자연스러운 대화로 강력한 성능을 보여주기 때문이다. 생성형 인공지능(AI)은 2016년 알파고의 등장 이후 또 다른 가능성으로 초거대 AI 시대의 새로운 지평을 열었다.
챗GPT는 파라미터(parameter, 매개 변수)가 1,750억 개에 달하는 수많은 데이터를 기반으로 학습된 언어모델이기에, 원활한 서비스 제공을 위해서는 고성능 반도체가 필수적이다. 이렇게 거대한 데이터의 처리를 위해서 메모리 반도체는 데이터를 빠르게 읽고 쓸 수 있도록 고성능, 고대역폭, 저지연 등 성능을 극대화해야 한다.
이처럼 초거대 AI 시대에는 메모리 기술의 발전과 성능 향상이 중요하다. 삼성전자는 지난 40년간 업계를 선도하며 쌓아온 독보적인 기술 노하우를 바탕으로 AI 반도체 생태계를 확장할 다양한 메모리 제품을 준비해 왔다.
..
AI 시대의 필수요소, 고성능 HBM
삼성전자는 2016년 세계 최초로 고성능 컴퓨팅(HPC) 향 HBM 사업화를 시작하며, AI 향 메모리 시장을 본격적으로 개척했다. 2017년 선보인 8단 적층 HBM2는 당시 가장 빠른 속도의 메모리였던 GDDR5 대비 8배 빠른 속도를 구현했다. 이 제품을 통해 AI·HPC 시대에 필수적인 3차원 스택 기술을 선보일 수 있었다.
이후에도 삼성전자는 고객과 밀접히 협업하여 AI·HPC 생태계를 견인하고 있다. HBM2 제품을 거쳐 HBM2E, HBM3를 양산하고 있으며, 9.8Gbps* 속도의 HBM3E 제품을 개발하여 고객사에 샘플 공급을 시작할 예정이다. HBM4는 2025년을 목표로 개발 중으로 해당 제품에 적용하기 위해 고온 열특성에 최적화된 NCF* 조립 기술과 HCB* 기술도 준비 중이다.
*Gbps(Gigabit per second): 1초당 전송되는 기가비트 단위의 데이터
*NCF(Non-conductive Film, 비전도성접착필름): 적층된 칩 사이에 발생하는 절연과 기계적 충격으로부터 솔더 조인트(Solder joint)를 보호하기 위해 사용하는 폴리머 레이어(Polymer layer)
*HCB(Hybrid Copper Bonding, 하이브리드 본딩): 차세대 본딩 기술로 기존에 솔더(Solder)를 사용한 방식이 아닌 구리(전도체)와 산화막(절연체)을 이용한 접합 방식
또한 올해 초에는 첨단 패키지 기술 강화 및 사업부간 시너지를 극대화하기 위해 AVP(Advanced Package)사업팀을 출범했다. HBM과 함께 2.5차원, 3차원* 첨단 패키지 솔루션을 포함한 첨단 맞춤형 턴키 패키징 서비스도 제공하여 AI·HPC 시대에 최고의 솔루션을 선보일 계획이다.
* 2.5차원 패키지: 단층의 로직 반도체와 다층의 메모리 반도체를 기판 위에 집적한 패키지
* 3차원 패키지: 여러 개의 로직/메모리 반도체를 수직으로 집적한 패키지
.
세계 최고 용량, 최고 성능을 제공할 DDR5 D램
AI 서비스를 위한 하이엔드 급 CPU는 100개가 넘는 코어(Core)와 각 코어를 담당할 충분한 메모리가 필요하다. 또한 제한된 패키지에서 더 많은 용량을 탑재하려면 D램 단일 칩 크기를 최소화하는 공정 기술과 폼팩터 내 구성 요소를 적절히 배치하고 스펙에 맞게 동작하도록 만드는 설계 기술도 필수적이다.
지난달 발표한 32Gb(기가비트) DDR5 D램은 40년 전 개발한 64Kb(킬로비트) D램 대비 용량이 50만 배 크다. 더불어, 동일 패키지 사이즈에서 아키텍처 개선을 통해 16Gb D램 대비 2배 용량을 구현하여, 128GB(기가바이트) 모듈을 TSV* 공정 없이 제작할 수 있게 되었다. 이로써 비용 절감과 생산성 개선이 가능해졌으며, 소비 전력도 10% 개선할 수 있게 됐다.
* TSV(Through Silicon Via, 실리콘 관통 전극): 칩을 얇게 간 다음, 수백 개의 미세한 구멍을 뚫고, 상단 칩과 하단 칩의 구멍을 수직으로 관통하는 전극을 연결한 첨단 패키징 기술
이번 제품으로 최대 1TB(테라바이트) 모듈 구현이 가능해져 고용량을 필요로 하는 데이터센터뿐 아니라 향후 MRDIMM, CXL 등 차세대 메모리 솔루션에서도 사용될 수 있는 기반이 될 것으로 기대한다.
한편, 업계 최선단 기술을 적용한 DDR5 규격의 12나노급 D램은 전 세대 제품 대비 생산성이 약 20% 향상되었다. 차별화된 기술 노하우를 바탕으로 뛰어난 성능과 전력 효율을 구현했고, 최고 동작 속도 7.2Gbps를 지원한다. 이는 1초에 30GB 용량의 UHD 영화 두 편을 처리할 수 있는 속도로, 향후 삼성전자는 고객 수요에 맞춰 데이터센터·AI·HPC 등 다양한 응용처에 공급할 계획이다.
.
메모리의 새로운 패러다임, PIM
폰 노이만 구조에서 기인한 메모리 병목 현상은 챗GPT와 같이 수많은 데이터를 다루는 응용에서 특히 치명적이다. 이러한 한계를 극복하기 위해 삼성전자는 2018년 세계 최초로 메모리 내에서 연산이 가능하고, 높은 에너지 효율을 가진 HBM-PIM(Processing-in-Memory)을 개발했다. 이를 통해 산업계와 학계에서 PIM 플랫폼의 표준화와 에코 시스템 구축을 위한 발판을 마련하였다. HBM-PIM은 D램 내부에 데이터 연산 기능을 탑재해 메모리 대역폭의 병목 현상을 개선하였으며, 음성 인식 등 특정 작업량에서 최대 12배의 성능 향상과 4배의 전력 효율을 달성했다.
이와 관련해 시스템 성능 개선을 목표로 하는 연구도 진행 중이다. 생성형 AI 응용까지의 확장성은 물론, 최근에는 CXL(Compute Express Link) 인터페이스를 사용하는 CXL D램에서 PIM 아키텍처를 구성하는 연구도 함께 진행하고 있다.
.
넥스트 폼팩터로 새로운 시장을 열다
그동안 PC와 노트북에 탑재되는 D램은 일반적으로 So-DIMM*이나 LPDDR*이었다. So-DIMM은 탈부착이 가능하지만 전송 속도와 공간 효율화 측면에서 한계가 있고, LPDDR은 소형화, 저전력 등의 장점이 있지만 온보드(On-board) 방식으로 탑재되어 탈부착이 어려웠다. 두 제품이 갖는 한계를 모두 극복할 수 있는 제품이 바로 LPCAMM(Low Power Compression Attached Memory Module)이다.
* So-DIMM(Small Outline Dual In-line Memory Module): PCB 기판 양면에 D램이 장착되어 있는 모듈로 일반적인 DIMM보다 크기가 작아 노트북 등 소형 시스템에 많이 사용됨
* LPDDR(Low Power Double Data Rate): 스마트폰, 태블릿, 노트북 등 모바일 장치 등에 탑재되는 저소비전력 D램
LPCAMM은 LPDDR D램 기반의 모듈 제품으로, 삼성전자는 최근 업계 최초로 LPCAMM을 개발하여 LPDDR의 새로운 폼팩터 시장을 개척했다. LPDDR이 탑재되어 고성능, 저전력 구현이 가능함과 동시에 모듈 형식이라 탈부착이 가능하여 사용자 필요에 따라 교체와 업그레이드가 가능하다. 또한 So-DIMM 대비 탑재 면적은 최대 60% 이상 줄어 제조사들이 내부 공간을 보다 효율적으로 사용할 수 있다. 더불어 성능은 최대 50%, 전력 효율은 최대 70%까지 개선되어 향후 PC, 노트북 등 모바일 장치에만 국한되지 않고 운영 효율과 저전력을 중요시하는 데이터센터 등 다양한 응용처에서 활용될 것으로 기대된다.
.
반도체 기술로 미래를 그리다
삼성전자는 지난 40여 년간 끊임없는 변화와 혁신을 통해 기술 초격차를 달성해 왔다. 앞으로도 초격차 DNA를 바탕으로 기술적 한계를 극복해 세상에 없는 다양한 메모리 솔루션 제품을 개발해 나갈 것이다. 특히 D램 시장의 큰 변곡점이 될 10나노 이하 공정을 기반으로 AI 시대에 세상이 원하는 초고성능, 초고용량, 초저전력 메모리 제품을 제공할 계획이다.
지금까지 그래왔듯, 앞으로도 세상이 원하는 반도체를 만들기 위한 기술 혁신의 중심에는 언제나 삼성전자가 있을 것이다.
기간 설정