1분과학·북툰·SOD

[북툰] 챗GPT가 불러온 변화, 차세대 AI 대세는 AI 풀스택?

Buddhastudy 2023. 7. 27. 19:56

 

 

 

1737년 프랑스의 기계공학자 자크 드 보캉송은 놀라운 걸작품을 하나 만들었습니다.

그것은 바로 플루트를 연주하는 자동 인형이었습니다.

이 자동인형은 손가락을 정교하게 움직이고

입으로 공기를 불어 넣으면서

진짜 사람처럼 플루트를 연주했습니다.

 

이전에도 간단한 동작을 하는 인형이 있긴 했지만

보캉송의 인형처럼 사람의 동작을 정교하게 따라 하는 경우는 처음이었습니다.

그 모습은 마치 인형이 인간의 지능을 모방하는 것처럼 보였습니다.

사람들은 이 자동인형을 [오토마타]라고 불렀습니다.

오토마타는 큰 인기를 얻으며 가는 곳마다 화제를 모았습니다.

 

 

현대에 들어 오토마타는 어떠한 일을 자동으로 처리하는 추상적인 기계를 뜻합니다.

그런 의미에서 인공지능은 21세기의 디지털 오토마타라 할 수 있습니다.

디지털 오토마타는 체스 챔피언과 바둑9단을 차례로 꺾으면서

대중들에게 인상적인 신고식을 치렀습니다.

이어서 자율주행차 등 다양한 산업에 빠르게 적용됐습니다.

 

알파고가 사람을 꺾을 때만 해도

대중들은 인공지능이 가져온 변화를 크게 실감하지 못했습니다.

그러나 작년 말에 등장한 ChatGPT는 분위기를 완전히 바꿔놓았습니다.

산업계뿐 아니라 일반 소비자도 인공지능을 체감하는 시대가 온 것입니다.

인공지능은 이제 막연한 기술이 아닌 생활이 되고 있습니다.

 

 

, ChatGPT가 불러온 인공지능 열풍이 거셉니다.

과거 아이폰이 등장하면서 본격적인 모바일 인터넷 세상이 열린 것처럼

ChatGPT의 등장으로 본격적인 AI 세상이 도래할 것이라는 기대감이 높습니다.

 

그에 따라 글로벌 테크 기업들도 발 빠르게 움직이고 있습니다.

마이크로소프트는 ChatGPT기술을 이용해

검색 엔진부터 파워포인트까지 MS의 모든 제품을 AI로 무장하고 있습니다.

 

마이크로소프트가 앞서 나가자 구글도 뛰기 시작했습니다.

메타, 아마존, 애플도 각각 AI 서비스를 선보이고 있습니다.

사실상 거의 모든 글로벌테크 기업들이 AI에 뛰어드는 모양새입니다.

국내 기업들의 대응도 빠르게 이루어지고 있습니다.

이 모든 게 ChatGPT가 출시된지 겨우 반년 만에 일어난 일입니다.

 

 

--

, 오늘은 지난 6개월 동안 일어난 AI 시장의 변화를

4가지 키워드를 중심으로 한번 정리해 보겠습니다.

4가지 키워드만 알아도

소용돌이치는 판세를 이해하는 데 도움이 되리라 생각합니다.

소용돌이 속에서도 어쨌든 업데이트는 필요하니까요.

 

 

--키워드 #1, 생성형 AI

ChatGPT가 나온 이후로 가장 자주 접하는 용어라면

아마 생성형 AI일 겁니다

새로 나오는 언어 분야 AI뿐 아니라

미술, 음악, 영상 분야 AI에도 생성형이라는 수식어가 안 붙는 데가 없습니다.

과연 생성형 AI는 기존의 전통적 AI와 어떻게 다를까요?

 

-전통적 AI가 데이터를 더 잘 분석하는 것에 목적을 두었다면

-생성형 AI는 확보한 데이터를 바탕으로

새로운 결과물을 도출한다는데 차이가 있습니다.

 

예를 들어

강아지와 고양이 사진이 있을 때

-전통적 AI는 둘 중 어느 쪽이 강아지이고

어느 쪽이 고향인지 더 잘 판별하는데 그칩니다.

-반면 생성형 AI는 그에 더해 강아지와 고양이 사진으로

그림을 그리거나 소설을 쓰거나 음악을 작곡합니다.

 

분석에 강한 알파고가 전통적 AI에 가까웠다면

능숙하게 대화하는 ChatGPT는 완전한 생성형 AI입니다.

 

생성형 AI를 조금 더 알아보기 위해 ChatGPT의 이름을 한번 들여다보겠습니다.

ChatGPT는 사람처럼 자연어로 대화하는 생성형 AI이며

방대한 데이터로 사전 학습한 트랜스포머입니다.

트랜스포머, 물론 범블비나 옵티머스 프라임을 얘기하는 건 아닙니다.

트랜스포머는 딥 러닝 모델 중 하나입니다.

트랜스포머는 주어진 문장을 보고 다음 단어가 뭐가 올지 확률적으로 예측합니다.

 

예를 들어

‘1+1에 답을 사람처럼 계산을 통해 얻는 게 아니라

자신이 학습한 데이터 중에서

1+1 다음에 가장 자주 나오는 단어를 선택하는 식입니다.

이 때문에 ChatGPT‘1+1같은 질문에는 쉽게 답하지만

29,486 + 5,959는 처럼

데이터가 많지 않을 법한 질문에는 오답을 내기도 합니다.

 

다시 말해 트랜스포머는 삶과 거짓을 답하는게 아니라

가장 그럴듯한 말을 내놓도록 학습한 모델입니다.

 

만약 한국의 예능 관련 데이터만으로 학습시킨 트랜스포머가 있다면

‘1+1의 답을 귀요미라고 할지도 모르겠네요.

 

어쨌든 최근에 나오는 생성형 AI는 대부분 트랜스포머 모델을 사용하고 있습니다.

 

 

--키워드 #2, 초거대 AI

좀 전에 트랜스포머는 딥 러닝 모델 중 하나라고 했는데요

딥 러닝은 머신러닝 중에서도 인간의 두뇌 속 신경망을 모방한 학습 방법입니다.

우리 두뇌는 뉴런과 뉴런을 이어주는 시냅스를 통해 정보를 전달하고 처리합니다.

딥 러닝도 시냅스에 해당하는 매개변수를 통해 정보를 처리합니다.

그래서 딥 러닝은 매개변수가 많을수록 더 정교한 학습을 할 수 있습니다.

ChatGPT에 쓰인 매개변수는 무려 1750억 개나 됩니다.

 

이 정도 매개변수에

3000억 개의 단어와 5조 개의 문서로 사전 학습을 시키니

사람들이 깜짝 놀랄 결과가 나온 것입니다.

 

이처럼 매개변수가 무수히 많고 방대한 데이터로 학습시킨 AI

보통 초거대 AI라 부릅니다.

트랜스포머도 결국 초거대 AI라 할 수 있습니다.

 

초거대 AI의 성능은

모델 자체의 우수성보다 매개변수와 데이터의 규모에 달려 있습니다.

평범한 모델이라도 매개변수가 많거나, 데이터가 많거나, 아예 둘 다 많거나 하면

뛰어난 인공지능이 될 수 있다는 얘기입니다.

 

이 때문에 초거대 AI 개발 경쟁은 군비 경쟁과 비슷한 양상입니다.

군비를 많이 투입할수록 상대편보다 군사력이 강해집니다.

너도나도 초거대 AI를 개발하지 못하는 이유도

기술 부족보다 군비 경쟁에서 이길 자신이 없기 때문입니다.

 

초거대 AI를 개발하고 운용하는 데에는 천문학적인 돈이 듭니다.

방대한 데이터를 제공하고 사전학습을 시키는 데에도 돈이 많이 들지만

진짜 돈 먹는 하마는 하드웨어 쪽에 있습니다.

바로 인공지능 연산에 최적화된 AI 반도체입니다.

 

어떻게 보면 변화를 맞이하는 모든 산업은 그 변화의 중심에 늘 돈이 있습니다.

따라서 돈 먹는 하마인 AI 반도체를 알면

AI 산업의 변화도 한눈에 알아볼 수 있겠습니다.

 

 

--키워드 #3, AI 반도체

컴퓨터에는 연산을 담당하는 CPU가 있습니다.

CPU의 연산 방식은 데이터를 순서대로 처리하는 직렬연산입니다.

직렬연산으로도 AI 알고리즘을 계산할 수 있지만 속도가 느립니다.

특히 딥 러닝처럼 데이터를 동시에 처리해야 하는 알고리즘이라면 병렬연산이 필수입니다.

 

고심하던 엔지니어들에게 뜻밖의 묘수가 떠올랐습니다.

다름 아닌 그래픽 카드로 쓰이는 GPU를 써먹는 겁니다.

GPU는 원래 이미지나 영상을 모니터에 빨리 띄우기 위해

수많은 화수를 동시에 계산하는데 특화된 반도체입니다.

 

이와 같은 동시 계산 능력이 인공지능의 병렬연산에도 딱 들어맞은 겁니다.

그림 잘 그리는 사람이 머리도 좋다는데

이게 반도체에도 해당되는 얘긴 줄 몰랐네요.

 

2012년에 열린 한 AI 경진대회에서

GPU의 병렬연산 성능이 확인되자

이때부터 거의 대부분의 인공지능 학습에 GPU가 쓰이게 됩니다.

현재 NVIDIA 인공지능 반도체 시장 점유율은 약 80%에 달합니다.

 

문제는 GPU가 너무 비싸다는 겁니다.

엔비디아의 A100이라는 GPU1초에 무려 312번을 더하기 빼기를 할 수 있습니다.

ChatGPT는 이런 A101만개나 사용합니다.

1만개의 제품 가격도 만만치 않지만 막대한 전기와 냉각수에 드는 돈

엔지니어 기술 지원비와 관리 운영비까지 포함하면

초거대 AI 학습에 수천억 원이 됩니다.

 

또한 ChatGPT는 검색 1회당 약 26원의 비용이 됩니다.

1억 명이 한 달에 10번만 검색해도 260억원이 드는 셈입니다.

학습비에서 운영비까지

웬만한 회사는 GPU를 이용해 초거대 AI를 개발하기 어려운 금액입니다.

 

이렇게 비용이 많이 드는 이유는

결국 GPU가 진정한 AI 반도체가 아니기 때문입니다.

범용으로 쓰이는 GPU는 아무래도 AI 연산에 있어서 효율이 떨어질 수밖에 없습니다.

이를 해결하려면 GPU를 대신할 AI 반도체를 개발해야 합니다.

내 컴퓨터에 GPU가 비싸고 비효율적이라고 스스로 만들어 쓰는 게이머들은 많지 않겠지만 기업이라면 가능합니다.

구글은 GPU에 대응할 목적으로 2016년에 AI 학습 전용 반도체 TPU를 개발했습니다.

awsAI 반도체를 별도로 개발했습니다.

그 외 기업들도 장기적으로 AI 반도체를 자체 개발하는 것을 목표로 하고 있습니다.

 

AI 반도체의 세대교체는

이보다 훨씬 복잡한 양상이지만 핵심은 간단합니다.

범용이면서 비싼 GPU에서 벗어나

전용이면서 효율적인 AI 반도체로 나아가는 것

나만의 AI 반도체를 가지게 된다면 나머지는 비교적 쉽습니다.

 

그래서 앞으로의 AI 경쟁 양상은 이렇게 전개될 가능성이 높습니다.

AI 반도체를 자체 개발해 독자적인 AI 인프라를 구축하고

이를 바탕으로 고객에게 통합적인 AI 서비스를 제공함

이것이 바로 최근 주목받고 있는 AI 풀스택입니다.

 

, 그러면 마지막 키워드이자 소용돌이 판세의 종착점인 AI 풀스택을 한번 알아보겠습니다.

 

 

--키워드 #4, AI 풀스택

풀스택(Full-stack, 차곡차곡 가득 쌓은 더미)이란 용어는

주로 IT 관련 영역에서 소프트웨어와 하드웨어 전반을 다 다룰 줄 아는 개발자를 뜻하는 말입니다.

그런데 이 모든 분야를 정말로 다 다룰 줄 아는 풀스택 개발자는

사실 불가능에 가깝습니다.

그저 해당 영역 전반에 대한 이해도가 높은 개발자

정도가 현실적인 의미이겠습니다.

 

하지만 사람이 아닌 시스템이라면 어떨까요?

시스템이라면 진정한 의미의 풀스택을 달성할 수 있지 않을까요?

 

AI 반도체를 비롯한 AI 인프라를 자체적으로 구축하고

이를 바탕으로 기업체와 소비자에게 맞춤형 AI 서비스를 제공하는

하나의 시스템

바로 AI 풀스택입니다.

 

AI 풀스택을 구축하려면 막대한 투자가 필요합니다.

석유화학이나 철강처럼 장치 산업을 키우듯이

장기적이고 지속적인 투자가 뒤따라야 합니다.

 

그럼에도 불구하고 AI 풀스택에 대한 관심은 높습니다.

AI 반도체 개발 경쟁이 심화되면

결국 AI 서비스 전반을 갖춘 몸집 싸움으로 확대될 가능성이 크기 때문입니다.

 

국내에서도 역량을 갖춘 기업들이 AI 풀스택을 구축하려는 움직임을 보이고 있습니다.

그 중에서 ktAI 풀스택을 구축하는데 필요한 환경을 이미 갖추고 있습니다.

 

kt는 작년 말에 기자간담회를 열어

2023년에 한국형 AI 폴스텍을 완성하겠다는 계획을 발표했습니다.

그렇다면 한국형 AI 풀스택의 진행 상황을 한번 알아보겠습니다.

 

kt는 지난해 AI 반도체 설계회사인 리벨리온과 AI 인프라 솔루션 회사인 모레에

전략적 투자를 하면서 AI 인프라 환경을 구축했습니다.

 

산학협력체를 통해서는 최신 AI 알고리즘을 연구하고 있습니다.

이를 바탕으로 올해 안에 초거대 AI를 상용화할 계획입니다.

그리고 이미 AI 기술을 적용 중인 인공지능 컨택센터, 로봇, 물류 AI

기존 사업 영역에도 초거대 AI를 적용할 계획입니다.

 

kt의 데이터센터인 ‘KT 클라우드에서는 필요한 만큼

GPU를 빌려 쓸 수 있는 종량제 인프라 서비스를 출시했습니다.

지난 28일에는 KT 클라우드 삼성전자와

한국형 AI 풀스택 구현을 목표로

차세대 메모리 기술 협력을 위한 업무협약을 맺었습니다.

무엇보다 의미있는 진행 상황은 AI 반도체 개발에 청신호가 켜졌다는 것입니다.

 

지난 46일 리벨리온의 AI 반도체 ATOM이 첫 선을 보였습니다.

ATOM은 국내 최초로 트랜스포머 계열의 자연어 모델을 지원하는 AI 반도체입니다.

언어 모델뿐 아니라 이미지 검색 같은 비전 모델로도 활용이 가능합니다.

아톰은 언어 모델로는 퀄컴과 엔비디아보다 최대 2배 빠른 속도를 보였고

비전 모델로는 최대 3배 이상 빨랐습니다.

전력 소모는 엔비디아의 20% 수준까지 줄였습니다.

 

ATOM이 상용화 될 경우 엔비디아의 GPU를 점차 대체할 수 있게 됩니다.

그렇게 되면 한국형 AI 풀스택도 서서히 경쟁력을 갖추리라 생각합니다.

 

 

 

한국형 AI 풀스택을 구축한다는 건 어떤 의미일까요?

아마 우리만의 AI 인프라 위에서

국내 많은 기업들이 AI 서비스를 활용하고

또 새로 개발해내는 장면을 상상할 수 있을 겁니다.

 

국내 기업의 업종별 니즈에 따라 맞춤형 AI 솔루션이 제공되고

일반 소비자에게는 한글 데이터로 학습한 초거대 AI 서비스가 제공됩니다.

인공지능 시대의 미래를 예측하는 건 무척 어려운 일이지만

산업적인 측면에서만 본다면 AI 풀스택은 AI 산업의 토대가 될 수도 있습니다.

 

우리나라가 1990년대에 전국적인 광케이블망을 깔면서

2천년대 IT 강국으로 올라설 수 있었듯이

한국형 AI 풀스택이 구축된다면 미래의 글로벌 AI 강자를 배출해낼지도 모를 일입니다.

 

디지털 오토마타의 출연이 피할 수 없는 선택이라면

우리에게 더 맞는 디지털 오토마타를 만들고

지켜보는 것도 방법이 아닐까요?