2020. 9. 2.

구글문서로 녹음파일 텍스트 변환하기

가끔 회의 나 통화를 녹음 하는 경우가 있다.

이런 경우 하나하나 다시 들어보고 정리 하기도 하는데..


다른 방법이 없을까??


찾아보니 자료가 많다.

많은 사람들이 나와 같은 고민을 했구나 싶다.. ^^


녹음 파일을 PC 에서 play 시킨다.

그리고 speaker로 나오는 소리를 PC의 mic 로 다시 흘려 보낸다.

그리고 google 문서도구의 음성입력 기능을 이용하여

google에 사운드를 흘려보내면 이게 text 로 변환이 되서 

문서에 작성이 되는 방법이다.

흔히 말하는 STT (speech to text) 기능을 공짜로 사용 할 수 있다.




검색된 자료들은 대체로 

realtek 사운드카드의 stereo mix 기능을 이용하는 듯 하다.

근데 내 노트북 LG gram 은 conexant 이다. stereo mix 가 없다. ㅠ.ㅠ


응용해서 도전해 본다.


win + R 을 이용하여 제어판으로 들어가 소리 메뉴를 선택한다.



realtek 같은 경우는 여기에 stereo mix 가 나타난다.

그러면 마이크를 사용안함으로 하고 stereo mix 를 사용함 으로 해서 한다


여기에는 stereo mix 가 없으니 빨리 포기하고..

녹음에서 마이크를 선택하고 속성으로 들어간다.



수신대기 창에 있는 이 장치로 듣기 를 선택한다.

그리고 녹음파일을 play 한다.


이어폰을 끼우거나 bluetooth 를 연결해 놓으면 안된다.

pc speaker 로 소리가 나와야 한다.

단 소리를 아주 작게 1 로 해 두어도 인식은 된다.

아무리 작게 해 두어도 조용한 사무실에서는 신경이 쓰인다.


구글 문서도구로 돌아가서

위의 음성입력 메뉴를 선택하면 나오는 마이크를 누른다





음성인식이 시작되면 이렇게 빨간 마우스로 변경이 되고

문서에 인식된 text 가 열심히 작성이 된다.


신기 신기 ^^



단점 :

개행처리가 안된다. 쉼표도 없어서 계속 읽다보면 숨 넘어 갈 수도..

생각보다 인식률이 떨어진다. 전반적인 내용의 흐름을 인식 하고 수작업으로 수정 보완 해야 한다.

녹음 파일의 시간만큼 play 를 해야 한다.

중간에 다른 작업을 못 한다. 다른걸 선택하는 순간 구글문서의 마이크가 중지된다.


장점 :

무료로 STT 기능을 활용할 수 있다.

녹음파일을 들으면서 정리하는거 보다 전체 흐름을 정리하는데 훨씬 수월하다.

점심시간이나 저녁 퇴근 때 즈음에 시켜놓고 가면 된다. 구글문서 이기 때문에 집에서 실시간 확인 가능.




확실히 

ok google에 또박또박 이야기 할 때랑 편안한 대화를 녹음한 걸 처리 하는 거랑

인식률은 엄청 차이가 난다.

아쉽지만 그래도.. 써본다.

점점 좋아지겠지..


실제 상담센터에서 사용하는 것들은 그 상황에 맞춰 만들어진 솔루션으로 수억에서 수십억 하는데

이렇게 공짜로 흉내내서 사용할 수 있다는 것에 만족한다.




댓글 1개:

  1. 구글문서의 음성입력 메뉴는 chrome 에서 열었을 때만 나온다..

    답글삭제