본문 바로가기

공부방

[LLM] 너무 많아서 헷갈리는 챗GPT & 클로드 모델 한방에 정리

다들 AI 잘 쓰고 계시나요? 

저는 클로드와 챗gpt, 그리고 최근에 나무증권에서 1년 공짜로 쓸 수 있게 된 퍼플렉시티까지 3개 정도를 쓰고 있어요.

저는 작년부터 본격적으로 AI를 공부하면서, 그리고 직접 클로드와 챗지피티를 사용하면서 대략적인 이들의 변천사를 체감하기도 했습니다. 그런데 처음 쓰시는 분들은 인공지능에 종류가 너무 많아서 뭘 사용해야 하는건지 헷갈리실 것 같기도 하더라고요. (이러다 베스킨라빈스 되겠어..)그래서 준비해보았습니다. 

지금까지 나온 LLM 모델들 총 정리! (여기서 LLM은 우리가 주로 사용하는 챗지피티나 클로드같이 대형 모델들을 말합니다. 사실 인공지능 모델에는 이렇게 큰 모델 말고도 자잘자잘하고 다양한 작업에 특화된 소형 모델들도 아주 아주 많습니다만, 우리가 쓸 일은 없으므로 패스.)

그런데 들어가기에 앞서, 최신 모델만 알면 되는데 옛날 모델들도 알 필요가 있을까요? 당연히 알면 좋습니다! 

왜냐고요?

흠 이런 비유를 드는 게 조금 민망하기는 하지만, 혹시 어릴 때 컴퓨터 운영체제 기억하시나요? 윈도우xp를 잘 쓰고 있었는데 갑자기 vista라는 게 나오면서 한번 훅 구려지고, 나중에 윈도우7 이렇게 나갔던 기억이 나요. 윈도우 vista가 너무 구려서 그냥 xp로 다시 내려가는 사람들도 많았어요. 바로 이런 비슷한 일이 모델에서도 나타날 수 있습니다.

최신 모델이 나왔는데, 내가 하려는 작업에는 알맞지 않을 수가 있어요. (적당한 예는 지금 떠오르지는 않지만) 마트 가는데 차 타고 가도 되는데 초음속 제트기 타고 가는 느낌? 이전 모델로도 충분하거나 더 잘 대답하는 경우도 있기 때문이죠. 그렇기 때문에 옛날 모델들도 알아두면 좋다는 얘기를 길게 주저리 해봤고요. 

 

그럼 이제 바로 오픈AI 모델들부터 살펴보겠습니다. 

2022년 11월, ChatGPT가 혜성처럼 등장했습니다. 사실 챗지피티는 gpt-3의 업그레이드 버전인 gpt-3.5를 대화형 챗봇 형태로 만든 것인데요. 이전부터 gpt 모델들이 gpt1, gpt2, gpt3 순서대로 나오고 있었습니다. 하지만 우리에게 챗지피티라는 이름으로 알려진 것이 gpt-3.5였고, 2023년 3월이 되자 gpt-4가 나왔습니다. 3.5까지는 텍스트 입력만 할 수 있었는데, 4부터는 이미지나 오디오를 넣어서 질문할 수 있게 됐죠. 그리고 성능 또한 크게 향상됐는데,  3.5는 대학교 학부생 수준, 4는 대학원생 수준이라고 흔히 비유합니다. 

gpt-4가 나오고 약 1년 뒤인 2024년 5월, gpt-4o와 4o-mini가 나왔습니다. 성능도 좋아졌지만, 결정적으로 mini가 나오면서 비용이 크게 싸졌습니다(!) 이게 나름 결정적이였는데, api를 호출해서 토큰을 사용하지 않는 일반적인 사용자 입장에서는 뭐가 싸졌는지 체감하기는 어려웠죠. (mini는 더 작고 싼 모델이라고 생각하시면 됩니다.

그리고 5가 나오려나 싶었는데, 2024년 12월 o1이 출시됐습니다. o1은 추론 모델에 특화된 모델입니다. 이전까지는 그냥 대답을 잘 하는 모델들이였다면, o1 모델부터는 복잡한 문제에 대해서도 논리적이고 일관된 추론이 가능하다는 것입니다. Chain of Thought라는 키워드도 이때 나왔습니다. 그래서 수학 문제나 과학적 가설 검증, 코딩 같은 능력이 향상됩니다. 

가장 최근인 2025년 1월에 o3-mini 모델을 내놓은 뒤에 2월에는 gpt4.5를 내놓았습니다. 4.5는 방대한 데이터를 학습해 더 자연럽게 대화할 수 있다고 하며, 환각이 많이 줄었다고 하네요. 

만약 여러분이 chatgpt plus 요금제에 가입해서 사용하고 계시다면, 질문을 던질 때 아마 선택지가 있을 겁니다. 

특정 문제에 대한 답을 풀어야 한다면 -> o3-mini나 o3-mini-high, o1 을 사용하시면 됩니다. 이중에서 가장 고급 모델은 o3-mini-high이고요, o1이 가장 오래된 모델이네요. 그냥 대화하고 놀고싶거나 특정 지식에 대해 묻거나, 보고서 작성과 같은 걸 시키고 싶다면 4.5를 사용하시면 됩니다. 참고로 올해 2월에는 Deep research가 출시됐는데, 전문적인 보고서나 논문 쓰기에 활용될 수 있을 정도라고 합니다. (하지만 저는 아직 사용해보지 못했습니다ㅠㅠ)

올해 안에 gpt5도 공개될 예정이랍니다. 

다음은 앤트로픽의 클로드 모델입니다. 저는 클로드만 쭉 유료구독해서 사용하고 있습니다. 

많은 분들이 아시다시피, 앤트로픽은 오픈AI의 직원들이 나와서 차린 회사입니다. 오픈AI가 너무 상업적으로 가는 모양새가 마음에 안들었던 직원들이 나와서 만들었다고 소문이 나있는데요. 그래서 오픈AI 모델들보다는 출시가 좀 늦은 편이였습니다. 

2023년 3월에 클로드1이 처음 출시됐는데, 소수의 사용자들만 쓸 수 있었습니다. 이후 2023년 7월, 클로드2가 일반 사용자들에게 공개가 됐는데, 제 어렴풋한 기억에 클로드가 '언어'를 잘 다룬다는 후기들을 들었던 기억이 있어요. 

그리고 2024년 3월에 Claude 3 Opus가 나오면서 클로드3 시리즈가 본격적으로 등장했습니다. 10월에는 3.5 sonnet이 나왔고 이때부터 '코딩은 클로드다'라는 말이 정설이 되어갔던 것 같습니다. (저도 그래서 클로드를 사용했고요.) 3.5 haiku 모델도 비슷한 시기에 나왔는데 경량화 모델이라, 가끔 클로드가 안돌아갈 때 한번씩 써주는 정도입니다. 

2025년 2월에 클로드 3.7 sonnet이 나오면서 한번 더 업그레이드가 됐습니다. 클로드는 따로 추론형 모델이 없지만, 3.7 소넷이 하이브리드 추론 방식을 도입해서 복잡한 문제를 잘 풀 수 있다고 합니다. 클로드는 그냥 언어도 잘하고 문제도 잘 푸는 천재인 걸로! (쓰다보니 클로드 예찬이 되버렸네요..ㅋㅋㅋ 챗지피티를 제가 안써서 자연스럽게 그렇게 되는 것 같습니다.)

 

다음 편에는 챗지피티와 클로드를 제외한 다른 LLM들에 대해서 소개드리겠습니다. 일론 머스크가 만드는 그록이라던가, 최근에 중국에서 나와서 핫해진 딥시크도 있고요. 인셉션의 머큐리라는 새로운(?) 것도 있는데 이건 저도 한번도 안써봤네요. 

그럼 다음 편에서 또 봐요!