본문 바로가기

공부방/Upstage AI Lab 4기

패스트캠퍼스 Upstage AI Lab 부트캠프 4기 | 과정 종료 회고 2025. 02. 147개월의 부트캠프 과정이 종료됐습니다. 벌써 회고를 쓸 시간이 됐다니, 늘 느끼는 거지만 정말 시간 빠르네요. 부트캠프 과정을 전반적으로 되돌아보면서, 뭘 배웠고 어떤 것들을 해왔는지 굵직하게 한번 정리해보겠습니다. 저는 "패스트캠퍼스 Upstage AI Lab 부트캠프 4기" 과정으로 7월 16일에 개강하고, 2월 14일 수료식으로 마무리를 했습니다. 개강 후부터는 줌 수업부터 온라인 강의로 쭉쭉- 달리기 시작했는데요. 전반적인 과정 내용을 기억나는대로 정리해보았습니다. 스타트!이제 안녕~~ 매일 들어갔던 슬랙이랑 출첵 시간마다 울렸던 알람도 모두 끝이다! 알람을 삭제하니 조금씩 실감이 난다.  Computer Science일주일 정도를 '컴퓨터 공학 개론'이라고 해서 줌 강의와 .. 더보기
기업연계 프로젝트가 끝났다, 이제 부트캠프도 곧 끝! 2025년 2월 7일 금요일, 부트캠프의 마지막 과정이였던 기업연계 프로젝트가 끝이 났습니다! 부트캠프도 이제 일주일 뒤면 끝이 나고요. 참 사람이 이상한게요, 막상 부트캠프를 하고 프로젝트를 열심히 하고 있을 때에는 빨리 끝났으면 좋겠고, 이거 언제 끝나나~ 끝이 보이지 않는 것만 같은데 시간이 훌쩍 지나서 이렇게 막바지에 오면 또 이렇게 아쉽고, 더 열심히 할껄, 이것도 저것도 더 해볼껄 하는 후회가 남는 것 같아요. 그렇기 때문에 결국 우리가 할 수 있는 건 오늘 하루하루를 최선을 다해서 살아가는 것이겠죠? 프로젝트 최종 발표가 끝나고 멘토링을 해주셨던, 강사님께서 그런 말씀을 해주시더라고요. 기억에 많이 남아 있을 때 정리를 많이 해두라고. 고. 지금은 딱 '기록'을 해야하는 시기인 것 같아요. .. 더보기
[RAG] 인터뷰용 챗봇 만들기 설 연휴 중에 관심을 끄는 공고를 찾았다! RAG 관련한 콘텐츠를 많이 만드는 곳인데 나도 한번 지원해보려고 이력서와 자소서를 쓰던 중... 문득 아이디어가 떠올랐다.내 이력서와 자소서, 각종 문서들을 넣어주고이걸 참조해서 대답하게 하는 챗봇을 만들어서 보여주면 어떨까?특히나 내가 지원한 곳이 RAG를 하는 곳이였기 때문에, 겸사겸사 RAG에 대한 대략적인 이해도도 증명할 수 있겠다 싶었다. 챗봇은 streamlit을 이용해서 써볼 수 있게 하는 방식으로 데모 화면을 준비할 수 있으니, 담당자가 원한다면 챗봇에게 나에 대해 궁금한 것을 마음껏(?) 부담없이 질문하면서 나에 대한 정보를 파악할 수 있다.단, 주어진 시간은 단 3일!!! 성능은 모르겠고, 일단 어떻게든 구현이나 해보자라는 마음에 시작했다. .. 더보기
[기업연계] GPU 쿠다 세팅하기 GPU 개발환경 구축하기!현재 서버 컴퓨터에 CUDA 버전을 확인 :NVIDIA 드라이버와 기본 CUDA 런타임 환경nvidia-smiCUDA 버전: 12.2NVIDIA 드라이버 버전: 535.86.10GPU 모델: NVIDIA GeForce RTX 3090메모리: 24576MiB (24GB)현재 사용 중인 메모리: 3MiB (거의 사용하지 않는 상태)전력 사용량: 18W / 350W온도: 29°CGPU 사용률: 0% 딥러닝 모델 학습을 위해서는 추가로 CUDA Toolkit이 필요.개발 도구 제공:CUDA 컴파일러(nvcc)디버깅 도구성능 분석 도구GPU 프로그래밍에 필요한 라이브러리들딥러닝 프레임워크와의 호환성:PyTorch, TensorFlow 등의 프레임워크들이 CUDA Toolkit의 특정 버전.. 더보기
[git] gitignore을 먼저 만들어두고 레파지토리에 연결 .gitignore 파일을 먼저 만듭니다:# .gitignore 파일 내용*.envopenai_key.env__pycache__/*.pyc.DS_Storevenv/그 다음에 git 초기화부터 시작# git 초기화git init# 파일 스테이징git add .# 첫 커밋 생성git commit -m "Initial commit"# 메인 브랜치를 main으로 변경git branch -M main# GitHub 레포지토리 연결git remote add origin https://github.com/hannakhw/Interview_chatbot.git# 푸시git push -u origin main 안그러면 개꼬인다 더보기
패스트캠퍼스 Upstage AI Lab 부트캠프 4기 | 기업 연계 프로젝트 부트캠프 마지막 과정이 시작됐다! 마지막 과정은 '기업 연계 프로젝트'인데, 이번 우리 기수에서는 3개의 기업에서 총 4가지 주제가 주어졌다. 그중에서 수강생들이 주제를 선택하여 팀을 짜고 기업과 피드백을 거치면서 프로젝트를 완성하는 방식이다.기간은 1월 13일부터 2월 7일까지. 1월 13일에는 기업 담당자들이 직접 프로젝트를 소개하고 어떤 것을 원하는지 설명해주는 오티가 진행됐다. 그리고 일주일 정도 기업과 미팅도 하면서 서로 목표와 목적을 맞춰나가는 싱크업 기간을 가지고 17일에 이를 바탕으로 기획안을 발표했다. 총 4가지 주제가 있었는데, 굵직하게 나눠보자면 1. 보안 도메인에서 올라오는 사용자들의 리포트를 AI모델로 최대한 개선하기2. 한글로 된 리포트를 영어로 바꾸기3. 전문가들이 작성한 리포.. 더보기
[Coding] LinkedLists, Listnode Leetcode를 풀다가 처음 알게된 개념(?).. 유명하고 중요한 개념이라고 하는데 알고리즘이나 코딩을 제대로 배워본 적이 없는 나에게는 넘 생소한 개념이였다. 그래서 이왕 알게된 겸, 블로그에 정리하면서 공부해봄.  Merge two sorted listsYou are given the heads of two sorted linked lists list1 and list2.Merge the two lists into one sorted list. The list should be made by splicing together the nodes of the first two lists.Return the head of the merged linked list.여기서 linked list가 주어진다. 말.. 더보기
데이터셋 분할 방법 대회를 처음 시작할 때 해야하는 것: 검증 데이터셋 만들기- 검증 데이터셋과 평가 데이터셋의 분포가 비슷한지? - 검증의 점수가 높으면, 평가 점수도 높아지고, 검증 점수 낮으면 평가 점수도 낮아지도록, 이런 경향성을 잘 따르는지?=> 검증 데이터와 평가 데이터의 경향성을 최대한 비슷하게 만들어야 한다. 그래야 모델 학습, 실험이 제대로 될 수 있어! 분할 방법:1. Holdout가장 기본적인 분할 방법. 전체 데이터를 9:1, 8:2로 분할. 가장 최근 데이터 20%만 검증 데이터로 사용 등... 시계열 특성이 강한 데이터에 대해서 많이 활용함. 데이터가 크거나, 학습이 오래 걸리는 경우 많이 씀. 검증 데이터와 평가 데이터를 얼라인할 때, 실험할 때는 홀드아웃을 하고 나중에 배포나 제출할 때 k-fo.. 더보기