boostcamp ai tech 3기 5주 회고

2월 14일 월요일

이번 주는 일정이 여유롭다. 여유로운만큼 복습하고 정리할 수 있는 좋은 기회가 될 것 같다.

AI 서비스 개발의 전반적인 내용에 관해 배우기 시작했다. 오늘은 ‘서비스 향 AI 모델 개발하기’를 들었는데 무겁지 않은 내용이라 편하게 수강했다. 그리고 시각화 강의가 이번 주까지 이어지는데, 오늘부터 interactive 시각화 내용을 배우기 시작했다. 이것저것 만져보니 신기했다. 언젠가 시각화만 따로 시간을 내어서 공부해도 괜찮을 것 같다. 지루하지 않고 재밌다라는 생각밖에 들지 않는다.

피어세션 때 할 얘기는 별로 없었다. 여유로운 일정이니만큼 캐글로 실습 한 번 해보자는 의견이 나와서 동의했다. 아직 많이 부족하고 할 수 있을지 모르겠다만 강의 노트를 바탕으로 할 수 있는 데까지 도전해봐야겠다. 오늘의 알고리즘 문제는 ‘수 이어 쓰기 1’. 멘토님께서 올렸던 브루트포스 문제집에서 가져왔다. 브루트포스라 해서 아무 생각 없이 시도했다가 시간초과 결과만 두 번 받았다. 곧바로 풀긴 했다만 브루트포스보다 수학 및 구현 문제집에 들어가는 게 더 적절하다고 생각되었다.

2월 15일 화요일

깃허브 블로그 게시물 밀림 현상이 발생하는 이유를 아직도 알아내지 못했다.

머신러닝 프로젝트 라이프 사이클과 Linux & Shell Command 강의를 들었다. 내일은 도커에 관한 수업을 들을 건데 기대가 된다. 예전부터 알고는 있었지만 어떤 개념이고 어떻게 사용하는지 몰랐던 부분이다.

피어세션 시간에 ‘동물원’ 문제를 최지민님께서 고르셔서 다 같이 풀었다. 예전에 풀었던 문제지만 다이나믹 프로그래밍은 매번 어렵게 느껴진다. 다행히 쉽게 규칙을 찾아서 점화식을 세울 수 있었다.

부캠 스몰톡 시간에 제페토라는 플랫폼으로 여러 사람들을 만날 수 있었다. 다만 플랫폼이 최적화가 잘 되어 있진 않은 것 같다. 크롬에서 너무 버벅거려서 엣지로 재접속해야만 했다. 여기저기 기웃거리면서 다른 사람들에 대한 이야기를 들었다. 그뿐이었다. 공통된 관심사를 가진 마음이 맞는 팀원을 어떻게 효율적으로 찾을 수 있을지 모르겠다. 이분 매칭 알고리즘이 생각난다…오?

2월 16일 수요일

시간이 빠르다. 벌써 수요일이다. 처음 이 여정을 시작할 때 5개월이 아주 긴 시간일 거라 생각했는데 짧게 느껴질 것 같다.

이번 주는 계속해서 AI 서비스 개발 흐름과 현업자 특강으로 공부하고 있다. 어렵지 않지만 정말 유익한 내용들이라 평소보다 더 집중하게 되는 것 같다. 오늘은 Docker랑 MLflow를 공부했다. 특히 도커는 예전에 들어봤고 직접 잠깐이나마 실습을 해봤던 개념이지만 이번 기회로 확실히 어떤 것인지 알게 되었다. 실습이 있었는데 환경 문제 때문인지 잘 되지 않아서 속상하다. 찾아봐도 확실한 답은 아직 구하지 못했다.

  • Docker 설치해서 MySQL 실행하기
  • 도커 이미지 만들기
  • MLflow 설치 및 experiment 실습?

위의 세 가지를 해봤어야 했는데 제대로 하지 못하고 실패했다. 이거 한다고 어쩌다보니 우분투랑 WSL이라는 걸 설치해보고 Window PowerShell도 처음 써봤다. Window PowerShell 이 아이가 기존 명령 프롬프트랑 뭐가 다른지, 우분투 그거랑 뭐가 다른지 잘 모르겠다.
첫 번째 미션은 쉽게 성공했다. 근데 도커 이미지 만드는 과정이 이해가 안갔다. 뭔가 중간 과정이 생략된 느낌.

사실 도커쪽은 그러려니 하는데 MLflow가 더 답답했다. MLflow를 설치 후에 “mlflow experiments create –experiment-name my-first-experiment” 이 코드를 쳤는데 “mlflow’은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는 배치 파일이 아닙니다.” 라는 에러 문구가 뜨면서 막혔다. 검색해보면 환경 변수 설정 관련 문제인 거 같은데 결국 문제 해결을 못했다.

피어세션 시간에 멘토님이 추천한 데이터로 그동안 배운 걸 써먹어 보자는 것에 얘기했다. 우선 과제에 있었던 기본 코드부터 써볼 생각인데 잘 할 수 있을진 모르겠다. 알고리즘 문제는 전태양님이 ‘오르막 수’를 골라서 같이 풀어보는 시간을 가졌다. 네 달 전에 풀었던 기록이 있고, 비슷한 문제를 몇 달 전에 풀었던 기억은 나는데, 볼 때마다 쉬우면서도 은근히 구현 과정 때문인지 까다롭게 느껴지는 문제다.

2월 17일 목요일

멘토링 시간만 기억에 남는다. 일찍이 수업을 다 듣고 끝낸 주라서 오늘부턴 할 게 거의 없었다. 다만 이미지 분류 모델 만드는 걸 시도해보고 있다.

오늘의 멘토님 말씀 : 공식 문서 읽는 걸 습관화하자.

피어세션 알고리즘은 최진혁님께서 ‘1, 2, 3 더하기 4’를 고르셨다. 어려웠다. 중복을 제외하지 않는 케이스는 규칙을 알기 쉬웠는데 중복을 제거해야 했기에 어려웠다.

2월 18일 금요일

이미지 분류 모델 만들기를 각자 연습하고 있다. 근데 데이터 로드하는 과정부터 막힌다. 우선 코랩에서 쓰기 위한 데이터를 불러오는 시간이 오래 걸릴 뿐더러, 데이터를 스플릿 하는 것도 문제였다. 더 나아간 팀원에 의하면 이미지 사이즈도 다 다르다고 한다. 직접 해보니까 확실히 좋은 경험이 되는 것 같다.

스페셜 피어세션 시간이 즐거웠다. 다들 대화를 잘 풀어가시는 분들이라 한결 편하게 얘기를 나눌 수 있었다. 언제나 시간이 1시간밖에 안되는 게 너무나 아쉽다.

피어세션 알고리즘은 주정호님께서 ‘연속합 2’를 고르셨다. 이 문제 또한 어려웠다. 어제에 이어서 오늘도 피어세션 시간 내에 풀지 못했다.