본문 바로가기

머신러닝

패스트캠퍼스 Upstage AI Lab 부트캠프 4기 | 과정 종료 회고 2025. 02. 147개월의 부트캠프 과정이 종료됐습니다. 벌써 회고를 쓸 시간이 됐다니, 늘 느끼는 거지만 정말 시간 빠르네요. 부트캠프 과정을 전반적으로 되돌아보면서, 뭘 배웠고 어떤 것들을 해왔는지 굵직하게 한번 정리해보겠습니다. 저는 "패스트캠퍼스 Upstage AI Lab 부트캠프 4기" 과정으로 7월 16일에 개강하고, 2월 14일 수료식으로 마무리를 했습니다. 개강 후부터는 줌 수업부터 온라인 강의로 쭉쭉- 달리기 시작했는데요. 전반적인 과정 내용을 기억나는대로 정리해보았습니다. 스타트!이제 안녕~~ 매일 들어갔던 슬랙이랑 출첵 시간마다 울렸던 알람도 모두 끝이다! 알람을 삭제하니 조금씩 실감이 난다.  Computer Science일주일 정도를 '컴퓨터 공학 개론'이라고 해서 줌 강의와 .. 더보기
패스트캠퍼스 Upstage AI Lab 부트캠프 4기 | 기업 연계 프로젝트 부트캠프 마지막 과정이 시작됐다! 마지막 과정은 '기업 연계 프로젝트'인데, 이번 우리 기수에서는 3개의 기업에서 총 4가지 주제가 주어졌다. 그중에서 수강생들이 주제를 선택하여 팀을 짜고 기업과 피드백을 거치면서 프로젝트를 완성하는 방식이다.기간은 1월 13일부터 2월 7일까지. 1월 13일에는 기업 담당자들이 직접 프로젝트를 소개하고 어떤 것을 원하는지 설명해주는 오티가 진행됐다. 그리고 일주일 정도 기업과 미팅도 하면서 서로 목표와 목적을 맞춰나가는 싱크업 기간을 가지고 17일에 이를 바탕으로 기획안을 발표했다. 총 4가지 주제가 있었는데, 굵직하게 나눠보자면 1. 보안 도메인에서 올라오는 사용자들의 리포트를 AI모델로 최대한 개선하기2. 한글로 된 리포트를 영어로 바꾸기3. 전문가들이 작성한 리포.. 더보기
패스트캠퍼스 Upstage AI Lab 부트캠프 4기, IR 경진대회(feat. RAG) 2024년 막바지를 향해 달리는 중,짧고 굵게 후다다닥 지나갔지만 동시에 배운 것도 정말 많은 IR 경진대회에 대해 리뷰한다. 기간은 단 4일! 월요일에 서버 만들고 데이터 다운로드해서 베이스라인 땅! 시작하고,수요일에 멘토링을 한 번 받은 뒤에, 목요일까지 결과를 제출하고, 금요일에 발표 및 랩업 세미나로 정리하는 타이트하고 빡센 일정이였다.  - "질문"이 들어오면, 질문과 연관된 "적절한 문서"를 찾고, 그 문서를 참조해서 적절한 답변을 생성한다.- 대회에서는 답변을 확인하지 않고, 답변을 위해 참조한 문서 3개(top k)를 뽑아서, 이 3개 문서가 잘 추출됐는지로 평가한다. - 임베딩 생성 모델, 검색 엔진, LLM을 활용할 수 있다. - 학습 데이터로 주어지는 문서와 쿼리 모두 jsonl 형태.. 더보기
패스트캠퍼스 Upstage AI Lab 부트캠프 4기, 과정 중간 회고 2024년 7월 16일, 부트캠프가 시작된 이후로 절반 좀 넘게 지난 것 같다. 패스트캠퍼스 업스테이지 AI Lab 부트캠프를 선택했던 가장 큰 이유였던 '프로젝트'를 정신없이 하다보니, (그리고 지금도 하고 있고..) 각잡고 회고할 기회가 많지 않았던 것 같다. 이번 기회에 과정 중간 회고를 딥하게 해보았다. 1. 프로젝트에 관하여7월부터 11월 말을 향하고 있는 지금까지 프로젝트를 벌써 5개(!)를 했다. 랭체인 프로젝트: 올림픽 경기 규칙 RAG머신러닝 경진대회: 아파트 실거래가 예측MLOps 프로젝트: 사용자가 디스플레이에 숫자를 그리면, 숫자를 인식해서 출력하고, 데이터베이스로 관리되면서 모델이 계속해서 업데이트되도록 하는 파이프라인 구성CV 경진대회: 17가지 문서 또는 차량 관련 이미지를 주.. 더보기
패스트캠퍼스 Upstage AI Lab 부트캠프 4기, "Upstage 경진대회 CV편" 새로운 공부를 하니 시간이 정말 천천히 가는 것 같으면서도 또 순삭이네요. 첫 경진대회인 아파트 실거래가 예측하는 머신러닝 경진대회가 지나고, 바로 MLOps를 지나, CV 경진대회까지 쉴틈없이 달리는 중인데요. 이번 포스팅에서는 지난 주에 마무리했던 CV 경진대회에 대한 이야기를 해볼까 합니다.  이번 대회는 CV, Computer vision domain에서 중요한 이미지를 분류하는 태스크가 주제였습니다. CV의 아주 클래식한 예시처럼, 강아지 사진을 넣고 모델이 강아지인지 고양이인지 맞추게 하는 것처럼 말이지요. 대회에서 주어진 이미지들은 총 17가지 클래스로 구분되어 있었는데요. 1570장의 학습 이미지가 주어지고, 각 이미지는 클래스1(자동차 번호판), 클래스2(이력서), 클래스3(진료확인서) .. 더보기
기계학습에서 딥러닝까지, AI는 어떻게 똑똑해졌을까 인공지능 공부를 하면서 든 생각어렸을 때 이런 상상을 했다. 공부가 필요 없는 세상. 미래에는 검색만 해도 모든 정보가 나와서 굳이 공부할 필요 없이, 잘 찾기만 하면 되는 그런 세상이 오지 않을까 기대했다. 요즘 내가 클로드나 챗지피티에게 궁금한 걸 물어보고 답을 찾는 것을 보면 이미 그런 세상은 와있는 것 같기도 하다.그렇다고 공부가 없어지지는 않았다. 인공지능에게 뭐든 물어볼 수 있는 세상이 오면 공부할 필요도 없을 거라고 생각했는데, 아이러니하게도 나는 인공지능에 대해 (얕게나마) 공부하고 있다. (공부를 무엇으로 정의하느냐에 다르겠지만.) 그리고 궁금했다. 인공지능은 어떻게 이렇게까지 똑똑해진 것일까. 인공지능은 기계이지만, 기계는 어떻게 '공부(학습)'를 했길래 무엇이든 물어보면 척척 답을 내.. 더보기
패스트캠퍼스 Upstage AI Lab 부트캠프 4기, “MLOps 프로젝트” 지난 주 금요일, 부트캠프에서 진행한 3번째 팀 프로젝트 MLOps 프로젝트가 끝났습니다! (얏호!)그래서 이번 편은 MLOps 프로젝트가 어떻게 진행됐는지 그리고 후기를 풀어볼까 합니다. 끝난 지 얼마되지 않은 따끈따끈한 팀플 후기입니다.여러분은 MLOps라는 단어를 들어보셨나요? 저는 이번에 프로젝트를 시작하면서 처음 들어봤습니다. 다른 기수에서는 하지 않았던 수업과 프로젝트이고, 오직 4기(!)에서 최초로 시작했다고 하는데요. 다음 기수도 이걸 할 수 있을지는 모르겠군요. 저희의 평가에 따라서 달라지겠죠? 어쩌면 흔치 않은 수업이였고, 프로젝트라서 더욱 남길 가치가 있는 것 같습니다. 인공지능이 핫하게 떠오른 지가 얼마되지 않은만큼, MLOps라는 분야도 막 태어나 커져가는 신생 분야라고 할 수 있.. 더보기
머신러닝 경진대회 1 | 데이터 탐색 EDA 2024.09.02 - [프로젝트] - 머신러닝 경진대회 1 | 데이터 분석 EDA 혼자 해보기지난 포스팅보다 좀 더 본격적으로, EDA를 책을 보며 따라가봤다. 먼저 데이터 탐색을 위해 복사본을 생성한다.traindata = pd.read_csv('/data/ephemeral/home/data/train.csv')traindata_copy=traindata.copy() 각 피쳐의 특징을 조사해보자info() 메서드를 사용해 데이터에 대해 간략한 개요를 확인한다. 확인할 수 있는 주요 정보는, 52개의 컬럼(피쳐)과 1118822개의 행(row)가 있다는 사실, 인덱스의 범위는 0부터 1118821까지이며, 각 컬럼의 이름과 컬럼의 데이터 특성을 알 수 있다. 숫자 아니면 object인데 object에 .. 더보기