가끔 회의 나 통화를 녹음 하는 경우가 있다.
이런 경우 하나하나 다시 들어보고 정리 하기도 하는데..
다른 방법이 없을까??
찾아보니 자료가 많다.
많은 사람들이 나와 같은 고민을 했구나 싶다.. ^^
녹음 파일을 PC 에서 play 시킨다.
그리고 speaker로 나오는 소리를 PC의 mic 로 다시 흘려 보낸다.
그리고 google 문서도구의 음성입력 기능을 이용하여
google에 사운드를 흘려보내면 이게 text 로 변환이 되서
문서에 작성이 되는 방법이다.
흔히 말하는 STT (speech to text) 기능을 공짜로 사용 할 수 있다.
검색된 자료들은 대체로
realtek 사운드카드의 stereo mix 기능을 이용하는 듯 하다.
근데 내 노트북 LG gram 은 conexant 이다. stereo mix 가 없다. ㅠ.ㅠ
응용해서 도전해 본다.
win + R 을 이용하여 제어판으로 들어가 소리 메뉴를 선택한다.
realtek 같은 경우는 여기에 stereo mix 가 나타난다.
그러면 마이크를 사용안함으로 하고 stereo mix 를 사용함 으로 해서 한다
여기에는 stereo mix 가 없으니 빨리 포기하고..
녹음에서 마이크를 선택하고 속성으로 들어간다.
수신대기 창에 있는 이 장치로 듣기 를 선택한다.
그리고 녹음파일을 play 한다.
이어폰을 끼우거나 bluetooth 를 연결해 놓으면 안된다.
pc speaker 로 소리가 나와야 한다.
단 소리를 아주 작게 1 로 해 두어도 인식은 된다.
아무리 작게 해 두어도 조용한 사무실에서는 신경이 쓰인다.
구글 문서도구로 돌아가서
위의 음성입력 메뉴를 선택하면 나오는 마이크를 누른다
음성인식이 시작되면 이렇게 빨간 마우스로 변경이 되고
문서에 인식된 text 가 열심히 작성이 된다.
신기 신기 ^^
단점 :
개행처리가 안된다. 쉼표도 없어서 계속 읽다보면 숨 넘어 갈 수도..
생각보다 인식률이 떨어진다. 전반적인 내용의 흐름을 인식 하고 수작업으로 수정 보완 해야 한다.
녹음 파일의 시간만큼 play 를 해야 한다.
중간에 다른 작업을 못 한다. 다른걸 선택하는 순간 구글문서의 마이크가 중지된다.
장점 :
무료로 STT 기능을 활용할 수 있다.
녹음파일을 들으면서 정리하는거 보다 전체 흐름을 정리하는데 훨씬 수월하다.
점심시간이나 저녁 퇴근 때 즈음에 시켜놓고 가면 된다. 구글문서 이기 때문에 집에서 실시간 확인 가능.
확실히
ok google에 또박또박 이야기 할 때랑 편안한 대화를 녹음한 걸 처리 하는 거랑
인식률은 엄청 차이가 난다.
아쉽지만 그래도.. 써본다.
점점 좋아지겠지..
실제 상담센터에서 사용하는 것들은 그 상황에 맞춰 만들어진 솔루션으로 수억에서 수십억 하는데
이렇게 공짜로 흉내내서 사용할 수 있다는 것에 만족한다.
구글문서의 음성입력 메뉴는 chrome 에서 열었을 때만 나온다..
답글삭제