공부방/Upstage AI Lab 4기
MLflow | 어제 했던 실험 결과가 오늘 다시 들어가보니 안보일 때
Eddie_D
2024. 10. 31. 11:24
추가)
터미널에서 mlruns가 있는 폴더로 이동 후에
mlflow ui --host 0.0.0.0 --port 5000
첨엔 local host에서 접근을 제한했습니다? 이런 에러가 떴는데, pkill -f mlflow 다시 해주고 재시작을 반복... 기다리니 뜬다.
왜 한번에 안되는거니ㅠ... 미스테리..
tracking URI 경로 설정을 확인!!
이번 경우에는 MLflow가 두 개의 다른 위치에 저장소를 만들었는데, 어제까지 쓰던 저장소는 exp라는 실험하던 폴더 안에 있었고, 오늘 다시 실험을 돌렸을 때에는 저장소가 home안에 새롭게 만들어져 있는 상태였음. 저장소는 새로 만들어놨지만, 기록은 어제 쓰던 저장소에 하고 있는 상황.
mlflow_tracking_uri: str = "/data/ephemeral/home/exp/mlruns" # 여기로 통일
experiment_name: str = "document_classification"
model_save_dir: str = "/data/ephemeral/home/exp/saved_models"
output_dir: str = "/data/ephemeral/home/exp/outputs"
run_name: str = None
#ui 들어갈 때
mlflow ui --backend-store-uri file:///data/ephemeral/home/exp/mlruns --host 0.0.0.0 --port 5000
#이렇게만 쳐도 현재 작업 디렉토리의 mlruns 폴더를 찾음
mlflow ui
ㅎㅎ 날아간줄알고 깜짝 놀랐쨔나흐ㅠ
그나저나 왜 capable-auk-759 이거는 왜 자꾸 생기는 건지 모르겠음.... 첨에는 안생겼는데ㅠ