반도체는 4차 산업 혁명의 모든 분야에 필수적으로 활용되는 미래 기술의 핵심이며, 경제 및 국가 안보의 주요 자산이다. 인공지능은 생활 및 산업에 쓰이지 않는 곳이 없을 정도로 중요한 기술이다. 반도체 기술 발전은 인공지능의 성능 향상을 견인하고, 인공지능의 가능성에 대한 발견으로 많은 반도체 기업들이 인공지능 산업에 참여하게 되면서 산업 자체의 파이를 키우는 선순환 관계를 갖게 되었다.
하지만 반도체와 인공지능은 단순히 상호보완적인 관계만을 갖는 것이 아니다. 산업이 융합하고 AI가 해결해야 하는 문제가 복잡해짐에 따라 AI 모델의 복합도가 증가하고 대규모 연산량을 요구하게 되었으며, 고성능 저전력 인공지능 전용 반도체가 필요하게 되었다.
AI 반도체란, AI의 학습, 분석, 추론 등의 서비스를 수행하기 위해 대량 연산을 목적으로 만들어진 반도체로서 생활 및 산업에 AI의 활용 범위가 넓어지면서 그 역할은 점차 확대될 것이다. AI 역량이 국가와 기업의 생존을 좌우하는 시대에서는 AI반도체와 같이 대규모 데이터 연산을 빠르고 효율적으로 실행하는 새로운 차원의 컴퓨팅 하드웨어를 통해 획기적인 AI 기술 구현이 필요하다.
AI반도체 생태계는 기존 시스템 반도체 생태계와 인공지능 생태계가 융합된 새로운 산업구조로 바라볼 수 있다. 반도체와 인공지능 생태계가 융합된 특성으로 인해 주요 기업들은 기존의 사업 영역을 유지하면서 융합시장 방향으로 생태계를 확장하고자 하고 있다. 엔비디아, 인텔, 퀄컴 등 기존 반도체 기업들은 칩의 성능을 지속적으로 향상시키면서 호환성을 장점으로 다양한 산업 영역에서 칩 기반의 AI서비스를 제공한다. 구글, 메타와 같은 빅테크 기업들은 초기에는 호환성 측면에서 반도체 기업들의 제품을 활용하였지만, 자사 AI 알고리즘 수행에 최적화된 반도체의 필요성으로 인해 자체 칩을 제작하여 적용하고 있다.
인공지능의 성능은 하드웨어+시스템 SW+응용 SW의 최적화로 결정되기 때문에 하드웨어뿐만 아니라 이를 운영하고 응용 소프트웨어를 지원하는 시스템 소프트웨어, AI 모델, 서비스까지 모두 중요하다. AI반도체 관련 기업들의 개발 동향 및 전략 발표를 종합하여 살펴보면, 하드웨어부터 소프트웨어까지 모든 단계의 제품 및 서비스를 제공하는 형태인 풀스택(Full-stack)3)을 갖추고 AI반도체 성능을 효과적으로 구현하기 위한 생태계를 조성하기 위해 노력 중이다. 팹리스를 포함한 반도체 기업부터 빅테크 기업까지 AI반도체 관련 기업들의 확장 시작점은 하드웨어나 서비스로 각기 다르지만, 풀스택을 확보하고자 하는 목표는 동일하다.
젠슨 황 엔비디아 CEO는 엔비디아는 반도체회사가 아니고 소프트웨어 회사라 말한 바 있다. 엔비디아 GPU는 ‘쿠다(CUDA)’4)라는 플랫폼을 갖고 있어 가치가 있다고도 언급했다. 이러한 사례에서 확인할 수 있듯 AI반도체 기업들의 생태계 확장 전략에서 중요한 요소 중 하나는 자사 칩 기반의 SW 플랫폼이다. 구글의 텐서플로(TensorFlow)의 사용자가 많은 것은 구글 반도체의 성능뿐만 아니라 SW 환경이 주요 요인이기도 하다.
기업이 성장하기 위해서는 소비자가 기대하는 칩의 성능 향상은 기본이며, 칩에 최적화된 인공지능 모델과 AI 컴파일러가 없으면 시장에서 외면받을 가능성이 생긴다. 따라서 AI반도체 기업들은 자사 칩에 맞는 시스템 소프트웨어를 개발하고 사용자에게 활용하도록 함으로써 소프트웨어 개발자들을 자사 생태계에 묶어두는 락인 효과를 기반으로 생태계 확장 및 활성화를 기대하고 있다.
엔비디아엔비디아는 GPU의 선두주자로서 하드웨어인 GPU의 성능 개선 및 데이터센터용 CPU 개발을 진행 중이며, GPU 및 시스템 소프트웨어(CUDA)를 기반으로 다양한 AI 서비스를 제공하고 있다. CUDA는 GPU 컴퓨팅에서 일종의 컴파일러 역할을 하는 도구로, 엔비디아 GPU가 인공지능(AI) 혁명을 견인한 원동력이자 고성능 컴퓨팅(HPC) 분야의 필수 솔루션으로 빠르게 확산된 주요 요인이라 할 수 있다. CUDA를 통해 개발자들은 C/C++, 파이썬(Python), 포트란(Fortran) 등 다양한 프로그래밍 언어를 사용하여 GPU를 활용한 병렬 컴퓨팅 애플리케이션을 쉽게 작성할 수 있다. 또한 CUDA는 딥러닝 프레임워크인 텐서플로(TensorFlow), 파이토치(PyTorch), MXNet 등과 호환되어 다양한 AI 애플리케이션 개발에 사용될 수 있다.
인텔은 CPU의 세계 최대 제조업체로서 하드웨어 기반 소프트웨어 역량 강화 추진 전략으로서 슈퍼컴퓨팅 환경을 구축하고 서비스형 소프트웨어(SaaS, Software as a Services)를 제공하고 있다. 인텔은 2020년 12월 oneAPI 툴킷 출시를 발표했으며, 이 oneAPI 툴킷을 이용하여 개발자는 CPU, GPU, FPGA(통칭 XPU)를 활용한 고성능 교차 아키텍처 애플리케이션을 개발할 수 있다. oneAPI 툴킷은 베이스 툴킷(Base Toolkit), HPC 툴킷(HPC Toolkit), IoT 툴킷(IoT Toolkit), 렌더링 툴킷(Rendering Toolkit), 데이터센터 툴킷(Data Center Toolkit) 등 다양한 분야별로 구성되어 있으며, 각각의 툴킷은 다시 여러 개의 라이브러리와 컴파일러로 구성되어 있다. oneAPI 툴킷은 인공지능(AI), 데이터 분석(Data Analytics), 클라우드(Cloud), IoT(Internet of Things), 게임(Game), 미디어(Media) 등 다양한 산업 분야에서 활용될 수 있다.
AMD는 CPU와 GPU를 모두 제조하는 유일한 기업으로서 하드웨어와 소프트웨어의 조화를 추구하고 있다. AMD는 2022년 3월 새로운 AMD 인스팅트 MI210(AMD Instinct MI210) 액셀러레이터와 ROCm 5 소프트웨어를 발표하며 AMD 인스팅트 생태계를 다시 한번 확장하고자 하고 있다. AMD 인스팅트 MI210은 AMD의 첫 번째 CDNA2 아키텍처 기반 액셀러레이터로서 HBM2E 메모리와 Infinity Fabric 링크(IFL)를 탑재하여 고성능 컴파일러(HPC)와 클라우드 컴파일(CloudComputing)에 최적화되어 있다. ROCm 5 소프트웨어는 AMD의 오픈소스 GPU 컴파일러 소프트웨어 스택으로서 HIP(Heterogeneous-compute Interface for Portability), OpenMP API(Open Multi-Processing Application Programming Interface), OpenCL API(Open Computing Language Application Programming Interface) 등 다양한 프로그래밍 언어와 API를 지원한다. 또한 ROCm 5 소프트웨어는 딥러닝 프레임워크인 파이토치(PyTorch), MXNet 등과 호환되며, AMD 인스팅트 MI210과 함께 사용할 경우 최대 3배의 성능 향상을 보여준다고 한다.
퀄컴은 스마트 폰 시장에서 AP(Application Processor) 칩셋의 절대 강자로서 하드웨어와 소프트웨어의 조화를 추구하고 있다. 2022년 6월 퀄컴은 제조사와 개발자에게 엔드-투-엔드 AI 소프트웨어 및 단일 통합 소프트웨어 스택으로 퀄컴의 AI 소프트웨어를 제공하는 퀄컴 AI 스택을 공개하였다.
국내 업체 동향
인공지능 시장은 현재 엔비디아의 GPU 기반의 시스템이 주류를 이루고 있다. 하지만 1세대 AI반도체인 GPU는 고성능이지만 고비용이라는 단점이 있으며, 엣지 컴퓨팅이나 모바일 기기에 적합하지 않다. 따라서 2세대 AI반도체인 NPU(신경망 처리 장치)가 주목받고 있다. NPU는 인공신경망을 효율적으로 실행할 수 있는 반도체로, GPU보다 낮은 전력 소모와 높은 처리 속도를 가진다.
국내에서는 팹리스 스타트업이 NPU 개발에 앞장서고 있다.
팹리스란 자체적인 반도체 제조 공장을 갖지 않고, 설계만 하고 외부에 제조를 맡기는 기업을 말한다. 팹리스 스타트업은 자본과 인력이 부족한 대신, 빠른 시장 변화에 유연하게 대응하고 차별화된 기술을 개발할 수 있다.
퓨리오사AI는 AI 반도체 설계 분야에서 선도적인 스타트업입니다. 2017년에 삼성전자와 AMD 출신의 백준호 대표가 설립한 이 회사는 자체 개발한 AI 칩 '워보이'로 글로벌 AI 칩 성능 테스트인 MLPerf에 참가하여 아시아 스타트업 중 유일하게 기준치를 충족시켰습니다. 워보이는 AI 서비스 구현에 필요한 대규모 연산을 저전력으로 신속하게 처리하는 시스템 반도체로, 데이터센터와 자율주행 서버 등에서 활용될 수 있습니다. 퓨리오사AI는 최근 2000억원 규모의 투자 유치를 추진하고 있으며, 워보이의 후속작인 '워보이2'의 개발도 진행 중입니다.
AI 칩이 하이퍼스케일러 및 기업의 복잡하고 빠르게 변화하는 요구 사항 메트릭을 해결하는 데 실패할 수밖에 없습니다.
FuriosaAI의 강점은 전체 제품을 구성하는 스택 구성 요소의 강력하고 원칙적인 엔지니어링과 더불어 제품 비전을 향해 끊임없이 혁신하고 진화하는 이러한 기반에서 비롯됩니다. FuriosaAI의 1세대 칩인 WARBOY는 이러한 강점을 여실히 보여줍니다. 클라우드 서버와 엣지 디바이스에서 모두 사용할 수 있다
리벨리온은 반도체 스타트업으로, 맞춤형 인공지능 (AI) 반도체를 설계하는 회사이다. 리벨리온은 2020년 9월에 설립되었으며, 금융, 의료, 자율주행 등 다양한 분야에 적용할 수 있는 AI 반도체를 개발하고 있다. 리벨리온의 첫 번째 제품은 금융 거래에 특화된 AI 반도체 '이온' (ION)으로, 2021년 10월에 시제품이 공개되었다. 이온은 인텔의 고야보다 처리 속도가 30% 빠르고, 전력 소비 효율은 배 이상 높다고 한다. 리벨리온은 삼성전자, 아마존, TSMC 등의 러브콜을 받고 있으며, 내년에는 데이터센터용 AI 반도체 '아톰' (ATOM)을 출시할 예정이다. 리벨리온은 세계 최고의 AI 반도체 기업을 목표로 하고 있다.
딥엑스는 국내 최초로 엣지 디바이스를 위한 인공지능 기술 및 신경망 처리장치(NPU)를 개발하는 AI 반도체 기업이다. NPU의 경량화와 전력 효율성 고도화를 통해 고성능, 저전력, 저비용의 임베디드 인공지능 솔루션을 제공하고 있다.
NPU란 NPU는 Neural Processing Unit의 약자로, 인공신경망을 효율적으로 실행하기 위한 전용 프로세서입니다. 인공신경망은 인간의 뇌와 비슷한 방식으로 데이터를 처리하는 알고리즘으로, 인공지능의 핵심 기술 중 하나이다.
NPU는 인공신경망을 구성하는 기본 단위인 뉴런과 가중치를 병렬적으로 계산하고, 메모리 접근과 데이터 전송을 최적화하여, 일반적인 CPU나 GPU보다 빠르고 저전력으로 인공지능 연산을 수행할 수 있다.
- 최신의 딥러닝 알고리즘을 지원한다. 딥엑스의 NPU는 다양한 형태와 크기의 컨볼루션, 풀링, 활성화 함수, 정규화, 연결 등의 연산을 지원하며, 최신의 딥러닝 모델들을 구현할 수 있다.
- 뛰어난 NPU 효율성을 제공한다. 딥엑스의 NPU는 메모리 대역폭을 최대한 활용하고, 데이터 재사용과 압축을 통해 메모리 접근과 전송을 줄이며, 동적 스케줄링과 파이프라이닝을 통해 병목 현상을 방지하며 이러한 기술들로 인해 딥엑스의 NPU는 최대 200 TOPS (Tera Operations Per Second)의 성능을 달성할 수 있다.
- 고급의 딥러닝 모델 압축 기술을 지원하고 딥엑스의 NPU는 모델 크기와 복잡도를 줄이면서 성능을 유지하거나 향상시키는 다양한 딥러닝 모델 압축 기술들을 지원한다. 이러한 기술들은 엣지 디바이스에서 제한된 자원과 전력 소모를 고려하여 인공지능 모델을 최적화하는데 유용하다.
엣지 디바이스란 클라우드 서버와 네트워크에 의존하지 않고, 현장에서 데이터를 수집하고 처리하고 의사결정하는 스마트한 디바이스를 말합니다.
딥엑스의 NPU 기술의 주요 응용 분야
스마트 모빌리티 : 자율주행 자동차, 드론 등에서 주변 환경 인식, 장애물 회피, 경로 계획 등의 작업을 수행하기 위해 딥엑스의 NPU가 사용된다.
-스마트 시큐리티 : 감시카메라, 스마트 도어락 등에서 얼굴 인식, 동작 감지, 비정상 행동 분석 등의 작업을 수행하기 위해 딥엑스의 NPU가 사용된다.
- 스마트 가전 : 에어컨, 세탁기, 로봇청소기 등에서 사용자 음성 인식, 환경 조절, 자가 진단 등의 작업을 수행하기 위해 딥엑스의 NPU가 사용된다.
- 현대자동차와 기아자동차와 함께 로봇 플랫폼용 AI 반도체 개발에 협력하고 있습니다. 이 반도체는 로봇이 주변 환경을 인식하고 상호작용하며 학습할 수 있는 능력을 제공한다.
- 삼성전자와 함께 AI 스마트 가전 상용화에 앞장서고 있습니다. 이 가전은 사용자 음성 명령에 반응하고 스스로 최적의 성능을 발휘할 수 있는 능력을 제공한다.
- 팹리스 챌린지 대회에서 우수기업으로 선정되어 삼성전자와 함께 5나노 공정 기반 AI 반도체 개발에 참여하고 있습니다. 이 반도체는 초소형 센서부터 AI 서버까지 다양한 분야에 적용될 수 있는 능력을 제공한다.
국내 최대의 AI 반도체 원천기술의 특허를 보유하고 있으며, 다양한 협력사와 함께 실제 상용화에 성공하고 있다.
반도체 칩 설계의 핵심 기능을 개발하여 인공지능 엣지 컴퓨팅 기술을 선도하는 대한민국의 반도체 설계자산 (IP) 플랫폼 전문 기업이다. 오픈엣지테크놀로지는 2017년 12월에 설립되었으며, 2022년 9월 26일에 코스닥에 상장되었습니다. 오픈엣지테크놀로지의 대표는 삼성전자 시스템 LSI사업부 출신인 이성현이다.
인공신경망처리장치 (NPU), 고성능 메모리 시스템 (PHY) 결합을 통한 IP 플랫폼을 구축하고 있으며 오픈엣지의 통합 IP 솔루션은 저전력, 설계면적 최소화 및 DRAM 최적화를 통해 혁신적인 메모리 시스템 IP 솔루션을 제공하며, 누구나 쉽게 AI 기술을 다양한 디바이스로 경험하는 시대를 만들어가며 오픈엣지의 제품은 자율주행차, 보안카메라 등에 들어가는 시스템반도체 IP에 적용될 수 있다.
오픈엣지는 글로벌 ICT 미래유니콘육성기업으로 선정되었으며, 3대 신산업 (BIG3) 시스템반도체 분야에서 우수기업으로 선정되었다. 오픈엣지는 시스템 반도체 생태계의 최전방에서 반도체 칩 설계의 핵심기능을 개발하며 고객과 함께 스마트한 세상을 열어가는 데 앞장서고 있다.
'세상을 지배할 인공지능 이야기' 카테고리의 다른 글
마우저 일렉트로닉스는 AMD의 최신 고성능 컴퓨팅 및 적응형 컴퓨팅 기술 제품을 공급 (0) | 2024.08.25 |
---|---|
생성형 AI의 경제적인 미래 #1 (0) | 2023.07.05 |
구글 바드 요약 : overview of Bard (0) | 2023.05.12 |
AI 언어의 종류 (0) | 2023.04.13 |
chatGPT API 사용후기 (0) | 2023.03.07 |