서울대 연구팀이 생성형 AI의 핵심 기능인 확률적 샘플링과 안정적 연산을 하나의 강유전체 메모리 플랫폼에 통합한 AI 반도체 기술을 세계 최초로 구현했다.
왼쪽부터 서울대학교 전기정보공학부 이종호 교수, 구륜한 연구원, 고종현 연구원
서울대학교 공과대학은 전기정보공학부 이종호 교수 연구팀이 강유전체 메모리를 기반으로 생성형 인공지능(AI)의 핵심 기능을 단일 소자 플랫폼에 통합한 AI 반도체 기술을 개발했다고 밝혔다. 이번 연구 성과는 국제학술지 ‘네이처 커뮤니케이션즈(Nature Communications)’에 게재됐다.
이번 기술의 핵심은 생성형 AI 구현에 필요한 ‘확률적 샘플링’과 ‘결정론적 연산’을 하나의 메모리 어레이 안에서 동시에 구현했다는 점이다. 생성형 AI는 문장·이미지·영상 등을 매번 다르게 생성하기 위해 무작위성을 활용하는 확률 기반 연산이 필수적이지만, 동시에 안정적인 계산 기능도 함께 요구된다. 기존 AI 반도체는 주로 분류나 추론 중심의 결정론적 연산에 최적화돼 있어, 생성형 모델 구현 시 별도의 샘플링 회로나 외부 소프트웨어 모듈이 필요했다.
이 때문에 기존 시스템은 회로 면적 증가와 배선 복잡도, 전력 소모, 연산 지연 등의 한계를 안고 있었다. 특히 생성형 AI에 필요한 두 기능을 하나의 메모리 기반 하드웨어 안에서 구현하면서도 CMOS 공정과의 호환성까지 확보하는 것은 기술적 난제로 꼽혀왔다.
연구팀은 하프늄 산화물(HfO₂) 기반 강유전체 메모리의 전압 의존적 특성에 주목했다. 높은 전압 영역에서는 무작위 텔레그래프 잡음(RTN)이 강하게 발생하는 특성을 활용해 확률적 샘플링 기능을 구현했고, 낮은 전압 영역에서는 RTN이 억제되는 대신 비휘발성 다중 전도 상태를 이용해 안정적인 벡터-행렬 곱(VMM) 연산을 수행하도록 설계했다.
강유전체는 외부 전기를 제거한 뒤에도 내부 전기 상태를 유지할 수 있는 특수 물질이다. 연구팀은 이 특성을 활용해 전원이 꺼져도 여러 전기 상태를 유지할 수 있는 메모리 기반 연산 구조를 구현했다. 이를 통해 동일한 메모리 소자가 상황에 따라 서로 다른 역할을 수행하도록 만들면서 생성형 AI 반도체의 집적도와 전력 효율을 동시에 높일 수 있는 가능성을 제시했다.
연구팀은 실제 6인치 웨이퍼에 제작한 NOR형 강유전체 메모리 어레이를 이용해 기술을 검증했다. 이후 전압과 샘플링 시간을 조절해 잠재 벡터 분포를 최적화한 뒤, 생성형 AI 모델인 변분 오토인코더(VAE)에 적용해 얼굴 이미지 데이터셋 ‘CelebA’를 활용한 생성 실험을 진행했다. 그 결과 다양한 얼굴 특성을 반영한 이미지 생성이 가능했으며, 약 10만 회 반복 동작 이후에도 안정적인 생성 성능이 유지되는 것을 확인했다.
이번 연구는 생성형 AI 하드웨어 분야에서 분리돼 있던 샘플링과 디코딩 기능을 CMOS 공정과 호환되는 강유전체 메모리 기반 단일 플랫폼에 통합했다는 점에서 의미가 크다는 평가를 받고 있다. 연구팀은 향후 이 기술이 온칩 생성형 AI 가속기와 뉴로모픽 시스템, 저전력 엣지 AI 반도체 등 다양한 분야에서 면적과 전력 효율 문제를 동시에 개선할 수 있을 것으로 기대하고 있다.
이종호 교수는 “생성형 AI 하드웨어 분야에서는 무작위 샘플링과 결정론적 연산을 동시에 만족시키는 것이 핵심 과제”라며 “이번 연구는 강유전체 메모리의 전압 의존적 특성을 활용해 이 두 기능을 하나의 소자 플랫폼에서 구현할 수 있음을 보여줬다는 점에서 큰 의의가 있다”고 말했다.
논문 주저자인 구륜한 연구원과 고종현 연구원은 현재 서울대학교 전기정보공학부 이종호 교수 연구팀에서 메모리 반도체와 하드웨어 AI, 저전력 뉴로모픽 시스템 관련 연구를 수행하고 있다.
서원호
기자
