boostcamp ai tech 3기 18주 회고

5월 16일 월요일

일요일에 팀원들과 만나서 합의한 최종프로젝트는 다음과 같다.

소개 : 음성 데이터에서 정보를 추출해서 새로운 형식으로 가공한다. 이를 통해 새로운 비즈니스 가치를 창출할 수 있도록 한다.

  • 개발 배경 및 필요성

    일상에서 사람 간에 가장 많이 쓰이는 정보 전달 수단은 말(음성)이다. 글에 비해 말은 훨씬 풍부한 정보를 빠르게 전달할 수 있다는 장점이 있지만, 시간이 지난 뒤에 이를 활용하려 할 때 필요한 부분이나 핵심 내용을 탐색하는 데에 시간이 오래 걸린다는 특징이 있다. 따라서 음성 데이터를 다른 형태로 가공해서 쉽고 빠르게 정보를 추출할 수 있는 서비스를 제공하려고 한다.

  • 기능
    1. 음성 데이터(녹취록)을 그대로 글로 변환.
    2. 음성 데이터(녹취록)의 정보를 글로 변환한 후, 이를 요약해서 제공.
    3. 음성 데이터(녹취록)으로부터 불건전 정보 탐지.
  • 기대 효과 및 활용 분야

    우선 해당 서비스를 통해 대화 내용을 문자 형태로 전부 기록하거나 요약할 수 있다. 예를 들어 오랜 시간 진행된 회의에서 등장한 대화 내용을 저장해서 추후에 필요한 정보를 확인하거나 증거 자료로써 보관할 수 있을 것이다. 특히 대량의 음성 데이터를 정제해서 핵심 내용만 문자 형태로 파악할 수 있다. 뿐만 아니라 대량의 음성 데이터에서 혐오 표현을 탐지해서 위치를 표시할 수 있을 것으로 기대된다.

문제는 네이버 클로바에서 유사한 기능을 이미 잘 구현했다는 것이다. 따라서 주제 변경에 대한 얘기가 나와서 논의 중이다.

5월 17일 화요일

멘토님께 상담 받고 정리한 결과

  • 심리상담 봇대화(심리상담)(어려움, 입력이 꼭 질문 만은 아님, dialogue 방법들 찾아보기, )
    • 사용 시나리오 짜기(사용자 입력, 최종 아웃풋 등, 기존의 방법들과 차이점 생각해서)
      • 시각화, 순서도 ..
    • 각 팀원 역할, (PM역할 누구)
    • 정량적 평가 방법 고민
    • 일정 짜고, 일정에 따른 목표들
    • 우리팀만의 아이디어를 살릴 수 있는 방법들 고민하기
      • MBTI 한국어(일기…) 입력 → MBTI 예측(classfication?) 쉬운데, 번역한거 말고 한게 뭐야?
      • 명언 생성, 테스크를 선택(쉬움, 명언생성, 인용구 생성)
      • 관련 다른 데이터셋 더 찾아보기
      • 부속, 질문이 들어오는데 질문에 혐오표현이 있을때 감지를 한다 (김성현 마스터 언스마일데이터셋, 순화는 못하고, 감지)

5월 18일 수요일

무엇을 해야할지 거의 마무리 지었다.

5월 19일 목요일

데이터 수집했다. 정제된 한글 데이터가 없었고, 저작권 문제도 있어서 직접 수집해야 했다.