boostcamp ai tech 3기 18주 회고

일요일에 팀원들과 만나서 합의한 최종프로젝트는 다음과 같다.

소개 : 음성 데이터에서 정보를 추출해서 새로운 형식으로 가공한다. 이를 통해 새로운 비즈니스 가치를 창출할 수 있도록 한다.

개발 배경 및 필요성

일상에서 사람 간에 가장 많이 쓰이는 정보 전달 수단은 말(음성)이다. 글에 비해 말은 훨씬 풍부한 정보를 빠르게 전달할 수 있다는 장점이 있지만, 시간이 지난 뒤에 이를 활용하려 할 때 필요한 부분이나 핵심 내용을 탐색하는 데에 시간이 오래 걸린다는 특징이 있다. 따라서 음성 데이터를 다른 형태로 가공해서 쉽고 빠르게 정보를 추출할 수 있는 서비스를 제공하려고 한다.
기능
1. 음성 데이터(녹취록)을 그대로 글로 변환.
2. 음성 데이터(녹취록)의 정보를 글로 변환한 후, 이를 요약해서 제공.
3. 음성 데이터(녹취록)으로부터 불건전 정보 탐지.
기대 효과 및 활용 분야

우선 해당 서비스를 통해 대화 내용을 문자 형태로 전부 기록하거나 요약할 수 있다. 예를 들어 오랜 시간 진행된 회의에서 등장한 대화 내용을 저장해서 추후에 필요한 정보를 확인하거나 증거 자료로써 보관할 수 있을 것이다. 특히 대량의 음성 데이터를 정제해서 핵심 내용만 문자 형태로 파악할 수 있다. 뿐만 아니라 대량의 음성 데이터에서 혐오 표현을 탐지해서 위치를 표시할 수 있을 것으로 기대된다.

문제는 네이버 클로바에서 유사한 기능을 이미 잘 구현했다는 것이다. 따라서 주제 변경에 대한 얘기가 나와서 논의 중이다.

멘토님께 상담 받고 정리한 결과

무엇을 해야할지 거의 마무리 지었다.