본문 바로가기

국비지원

패스트캠퍼스 Upstage AI Lab 부트캠프 4기 | 과정 종료 회고 2025. 02. 147개월의 부트캠프 과정이 종료됐습니다. 벌써 회고를 쓸 시간이 됐다니, 늘 느끼는 거지만 정말 시간 빠르네요. 부트캠프 과정을 전반적으로 되돌아보면서, 뭘 배웠고 어떤 것들을 해왔는지 굵직하게 한번 정리해보겠습니다. 저는 "패스트캠퍼스 Upstage AI Lab 부트캠프 4기" 과정으로 7월 16일에 개강하고, 2월 14일 수료식으로 마무리를 했습니다. 개강 후부터는 줌 수업부터 온라인 강의로 쭉쭉- 달리기 시작했는데요. 전반적인 과정 내용을 기억나는대로 정리해보았습니다. 스타트!이제 안녕~~ 매일 들어갔던 슬랙이랑 출첵 시간마다 울렸던 알람도 모두 끝이다! 알람을 삭제하니 조금씩 실감이 난다.  Computer Science일주일 정도를 '컴퓨터 공학 개론'이라고 해서 줌 강의와 .. 더보기
패스트캠퍼스 Upstage AI Lab 부트캠프 4기 | 기업 연계 프로젝트 부트캠프 마지막 과정이 시작됐다! 마지막 과정은 '기업 연계 프로젝트'인데, 이번 우리 기수에서는 3개의 기업에서 총 4가지 주제가 주어졌다. 그중에서 수강생들이 주제를 선택하여 팀을 짜고 기업과 피드백을 거치면서 프로젝트를 완성하는 방식이다.기간은 1월 13일부터 2월 7일까지. 1월 13일에는 기업 담당자들이 직접 프로젝트를 소개하고 어떤 것을 원하는지 설명해주는 오티가 진행됐다. 그리고 일주일 정도 기업과 미팅도 하면서 서로 목표와 목적을 맞춰나가는 싱크업 기간을 가지고 17일에 이를 바탕으로 기획안을 발표했다. 총 4가지 주제가 있었는데, 굵직하게 나눠보자면 1. 보안 도메인에서 올라오는 사용자들의 리포트를 AI모델로 최대한 개선하기2. 한글로 된 리포트를 영어로 바꾸기3. 전문가들이 작성한 리포.. 더보기
패스트캠퍼스 Upstage AI Lab 부트캠프 4기, IR 경진대회(feat. RAG) 2024년 막바지를 향해 달리는 중,짧고 굵게 후다다닥 지나갔지만 동시에 배운 것도 정말 많은 IR 경진대회에 대해 리뷰한다. 기간은 단 4일! 월요일에 서버 만들고 데이터 다운로드해서 베이스라인 땅! 시작하고,수요일에 멘토링을 한 번 받은 뒤에, 목요일까지 결과를 제출하고, 금요일에 발표 및 랩업 세미나로 정리하는 타이트하고 빡센 일정이였다.  - "질문"이 들어오면, 질문과 연관된 "적절한 문서"를 찾고, 그 문서를 참조해서 적절한 답변을 생성한다.- 대회에서는 답변을 확인하지 않고, 답변을 위해 참조한 문서 3개(top k)를 뽑아서, 이 3개 문서가 잘 추출됐는지로 평가한다. - 임베딩 생성 모델, 검색 엔진, LLM을 활용할 수 있다. - 학습 데이터로 주어지는 문서와 쿼리 모두 jsonl 형태.. 더보기
패스트캠퍼스 Upstage AI Lab 부트캠프 4기, 과정 중간 회고 2024년 7월 16일, 부트캠프가 시작된 이후로 절반 좀 넘게 지난 것 같다. 패스트캠퍼스 업스테이지 AI Lab 부트캠프를 선택했던 가장 큰 이유였던 '프로젝트'를 정신없이 하다보니, (그리고 지금도 하고 있고..) 각잡고 회고할 기회가 많지 않았던 것 같다. 이번 기회에 과정 중간 회고를 딥하게 해보았다. 1. 프로젝트에 관하여7월부터 11월 말을 향하고 있는 지금까지 프로젝트를 벌써 5개(!)를 했다. 랭체인 프로젝트: 올림픽 경기 규칙 RAG머신러닝 경진대회: 아파트 실거래가 예측MLOps 프로젝트: 사용자가 디스플레이에 숫자를 그리면, 숫자를 인식해서 출력하고, 데이터베이스로 관리되면서 모델이 계속해서 업데이트되도록 하는 파이프라인 구성CV 경진대회: 17가지 문서 또는 차량 관련 이미지를 주.. 더보기
패스트캠퍼스 Upstage AI Lab 부트캠프 4기, "Upstage 경진대회 CV편" 새로운 공부를 하니 시간이 정말 천천히 가는 것 같으면서도 또 순삭이네요. 첫 경진대회인 아파트 실거래가 예측하는 머신러닝 경진대회가 지나고, 바로 MLOps를 지나, CV 경진대회까지 쉴틈없이 달리는 중인데요. 이번 포스팅에서는 지난 주에 마무리했던 CV 경진대회에 대한 이야기를 해볼까 합니다.  이번 대회는 CV, Computer vision domain에서 중요한 이미지를 분류하는 태스크가 주제였습니다. CV의 아주 클래식한 예시처럼, 강아지 사진을 넣고 모델이 강아지인지 고양이인지 맞추게 하는 것처럼 말이지요. 대회에서 주어진 이미지들은 총 17가지 클래스로 구분되어 있었는데요. 1570장의 학습 이미지가 주어지고, 각 이미지는 클래스1(자동차 번호판), 클래스2(이력서), 클래스3(진료확인서) .. 더보기
학습일지 | 딥러닝과 파이토치 딥러닝 = 텐서 연산 모음파이토치는 데이터를 텐서 객체로 다루기 때문에 데이터를 텐서로 바꿔야 한다. 그리고 모델을 불러와 학습시키고 예측 결과를 내놓게 한다. 결과가 나오면 오차를 손실함수로 수치화하고, 손실 함수가 최소가 되도록 하는 최적화 알고리즘을 거치면서 모델이 최적의 파라미터를 찾아 업데이트한다.  전이학습(Pretrained Model)말 그대로 이미 한번 학습을 시켜놓은 모델. 학습한 task에 대해서 일반적인 성능을 가지고 있다. 갓 업계에 입문한 쌩신입에게 기본적인 것을 가르쳐준 단계랄까. 아무것도 모르는 사람을 처음부터 가르쳐서 전문가로 만드는 것보다 기본은 알고 있는 사람에게 좀 더 심화 지식을 가르치는 것이 수월한 것처럼, (누군가 이미 잘 만들어놓은) 프리트레인된 모델을 가져와 .. 더보기
학습일지 | MLOps에 대한 대략적인 소개 올 것이 왔다. 최대 난관이 찾아온 것 같다. 이름도 생소한 ML Ops가 뭔지, 강의 들으면 알겠지 했는데 들으면 들을수록 더 모르겠다.두둥 ML Ops (수업 내용에 새로운 개념이나 처음 들어보는 단어가 너무 많아서 힘들었다. 동시에 그만큼 많이 배우기도..)ML Ops는 머신러닝 모델을 개발하고 배포, 운영하는 전체적인 과정을 관리하는 영역이다. DS(데이터 사이언티스트를 부르는 것 같음. 보통 DS가 주피터 노트북으로 모델을 개발한다고. 하지만 이걸 곧바로 배포할 수는 없음)가 모델을 만들어서 올리면 그걸 가지고 운영을 시작하는 게 ML Ops의 영역이고, 이 분야는 새로 생긴지도 얼마 되지 않아 통일된 방법론(?)이나 툴이 존재하지 않는다. 백엔드와도 맞닿아 있는 부분. (난 백엔드에 대해 아무.. 더보기
경진대회 Fast-Up Report 오늘은 경진대회를 마무리하고 각 팀마다 어떻게 모델을 만들었는지 발표하고 각자 배운 점과 어려웠던 점을 공유하는 세미나를 가졌다. 다른 팀의 발표를 보면서 엄청나게 동기부여를 받았는데, 그 기세를 몰아 이 밤에 Fast-up report를 작성하고 있다. 1. 어떤 대회였나?인공지능 AI 부트캠프 4기 학생들이 모여서 아파트 가격 실거래가를 예측하는 대회. 2024. 09. 09~09. 13까지 일주일 동안 진행. 2. 목표는 무엇인가? 나는 2조였는데, 우리 조의 경우에는 최대한 많은 외부 데이터를 수집했고, 그 외부데이터를 활용해 기존에 주어진 결측치 많은 데이터를 대체하고 실거래가를 예측하려는 것이였다. 수치적으로는 RMSE 값을 최대한 낮추는 것이 목표였다. (실제 가격과 예측한 가격의 오차를 줄.. 더보기