"인공지능을 만드는 회사?"하면, 보통 OpenAI나 구글을 떠올립니다. 반면 엔비디아는 거대 언어 모델이 발달하면서 인공지능 산업이 커지자 수혜를 받은 기반 산업 같은 느낌이였죠. 인공지능 모델을 돌리기 위해 필요한 GPU를 만드는 회사니까요. 저도 어제까지만 해도 엔비디아가 칩만 만드는 회사라고 생각했는데요. 아니었습니다. 엔비디아는 그보다 훨씬 더 커다란 기업이였습니다. 오늘은 엔비디아에 대해 무지했던 제가, 엔비디아가 진짜로 요즘 뭘 하고 있는지 뉴스를 통해 정리해보았습니다. (갑분, 기업분석 느낌) AI안테나 구동!
by. 에디터 D
엔비디아, AI계 파운드리를 향한 꿈(관련 내용)
TSMC는 반도체 파운드리 회사입니다. 반도체 칩의 설계도를 가져가면, 칩을 만들어주는 회사죠. 엔비디아도 그런 파운드리 역할을 하겠다는 포부를 담아 발표한 서비스가 AI Foundry입니다. 다른 회사에서 만들고 싶은 AI에 대한 설계도가 있다면(데이터나, 뭐 도메인 지식이나, 뭐든..) 엔비디아로 가져오세요! 챗GPT 뺨치는 맞춤형 생성 AI 모델을 구축해드립니다! 라고 광고하고 있네요.
AI 파운드리라는 서비스는 지난 7월 23일에 발표됐습니다. AI 파운드리 서비스에서는 여러 AI 모델을 제공하기도 하는데, 엔비디아가 만든 AI모델도 있고요. 메타에서 공개한 누구나 사용할 수 있는 라마 3.1 모델도 있습니다. 이런 모델을 사용하면 좀 더 쉽게 자신의 도메인 영역에 적용한 "슈퍼 모델"을 개발할 수 있다고 하고요. 출력되는 값도 사용자가 정하거나, 더욱 정확한 답을 내놓기 위해 최적화된 NIM 추론 마이크로서비스도 선택할 수 있다고 합니다. (홈페이지에 이미지랑 보도자료, 첨부파일에 미디어 연락처까지 적혀있는 걸 보니 꽤 중요한 뉴스였던 것 같습니다. 엔비디아 젠슨 황이랑 메타의 주크버그의 말도 한 마디씩 인용했고요.)
엔비디아, AI 서비스를 위한 인프라 깔기에 열일중(관련 내용)
AI모델이 엄청나게 빠르게, 엄청나게 많이 나오고 있습니다. 그렇다면 우후죽순으로 개발되는 모델들을 어떻게 하면 실제 서비스에 적용시키고, 대용량의 모델을 안정적으로 운영할 수 있을까요? 이런 문제를 해결하기 위해서 엔비디아는 AI 모델을 쉽게 배포하고 운영할 수 있게 하는 소프트웨어 NIM을 개발했다고 합니다. 그리고 최근에는 NIM이 Google Kubernetes Engine이라는 대규모 애플리케이션 관리도구 안에 통합되었습니다. (*GKE는 Google Cloud 인프라를 사용하여 컨테이너화된 애플리케이션을 대규모로 배포하고 운영하는 데 사용되는 관리형 Kubernetes 서비스)
저도 써보지 않아서 정확히 감이 오지는 않은데, 앱스토어처럼 구글 클라우드 마켓이 있고 거기에 엔비디아 NIM을 다운받아서 AI 모델을 서비스하는 일련의 과정들을 쉽게 관리할 수 있다는 것 같습니다. AI 시스템을 구축할 때 많은 것들을 초기화하고 설정해줘야 하는데, 이걸 손쉽게 자동화해줬다는 장점이 있고, 또 AI 모델도 오픈소스 모델이나 엔비디아 기반 AI, 맞춤형 모델 등 다양한 모델을 지원합니다.
다른 회사에서 AI모델을 만들면 엔비디아는 모델을 최적화해준다?(관련 내용)
대표적인 예가 Meta의 Llama 모델인데요. 3.1, 3.2 버전과 405B에 달하는 가장 큰 모델을 최적화했습니다. 모델의 소프트웨어를 고친 것은 아닌 것 같고요, 맞춤형 양자화 레시피(무슨 뜻인지 전혀 감이 오지 않는 말이네요)와 모델을 여러 GPU에 분할하여 넣는 병렬화 기술이 사용됐다고 설명하는데, GPU를 발전하는 모델 특성에 맞춰서 잘 만들어서 모델의 성능을 최고로 끌어올렸다는 말 같습니다. (저는 그렇게 이해했습니다. 하핫 정확하지 않을 수 있으니 자세한 건 위 관련 내용 링크를 눌러 확인해보세요.) 소프트웨어와 하드웨어의 상호발전의 모습이 엿보이는 것 같습니다.
'소식들' 카테고리의 다른 글
[AI안테나] AI 교과서, 올해는 '먼저 써보고 결정하세요' (0) | 2025.01.11 |
---|---|
[AI안테나] 중국의 AI 역전극, 생성형 AI 특허 70% 장악... 미국은 긴장 (0) | 2025.01.10 |
[AI_Antenna] EXAONE 3.5 모델이 공개됐다 (0) | 2024.12.10 |
[📡AI Antenna] 자정까지 29분, 통제되지 않는 AI를 향한 공포 (11) | 2024.10.16 |
AI와 관련된 테크 미디어들 (11) | 2024.10.01 |