ICT 레이더/인공지능(AI)

방송 오디오를 글자로 변환하는 방법 2

kusson 2023. 7. 24. 11:08
반응형
728x170

 저번 시간에는 유튜브에서 나오는 오디오를 글자로 변환하는 방법을 알아보았고 이번 시간에는 그 외 모든 방송에서 나오는 소리를 글자로 변환하는 방법에 대해서 알아보겠다. 이를 위해서는 곰 녹음기나 다른 녹음 어플을 켜서 pc 스피커를  입력으로 선택해 둔다.

 

 

 

이제 브라우저를 활성화 시키고 방송이나 유튜브 또는 소리가 나오는 영상을 켠다. 그리고 소리를 녹음하기 원하는 시점에서 곰녹음기의 녹음 버튼을 클릭한다.

 

 

  소리녹음을 끝내고 싶은 부분에 이르면 곰녹음기의 종료 버튼을 눌러 소리녹음을 중지한다.

 

 

곰녹음기에서 방금 녹음이 끝난 파일 위에 커스를 가져다 두고 클릭한다. 파일명의 번호가 가장 큰 것이 방금 녹음한 파일이다.

 

 

녹음 파일을 클릭하면 재생 버튼을 비롯한 간단한 편집툴이 나타난다. 여기서 폴더 아이콘을 클릭한다.

 

 

 곰녹음기에서 녹음된 파일이 저장된 폴더가 열리면서 지금까지 저장된 모든 파일이 나타난다. 여기서 방금 녹음한 파일의 이름을 수정해 준다. 헷갈리지 말라고 하는 작업이니까 원래의 이름 그대로 사용해도 상관은 없다.

 

 

 

 이제 네이버에서 제공하는 클로바 노트를 오픈한다. 처음 사용하는 사람은 로그인을 해서 간단한 개인정보를 입력하는 절차가 필요하다. 화면 중간에 있는 '클로바 노트 시작' 버튼을 클릭한다.

 

 

클로바 노트 편집창에 들어가면 좌상단의 '새 노트 만들기' 버튼을 클릭해서 새 노트를 오픈한다.

 

 

 새로운 노트가 열리면 하단에 '파일 첨부'라는 버튼이 있다. 음성 파일은 180분까지 가능하고 m4a, mp3, amr, wav 파일 등을 사용할 수 있다. 곰녹음기 폴더에서 녹음된 파일을 드래그해서 클로바 노트의 '파일 첨부' 부분에 투척한다.

 

 

 좀더 정확한 음성 분석을 위해 음성의 종류가 어떤 형태인지를 물어보는 창이 열리는데 음성파일의 형태에 따라 적당한 종류를 선택한다. 그런데 어떤 형식인지 잘 모르겠다면 아무거나 선택해도 대체로 잘 인식한다.

 

 

 음성 파일의 길이에 따라 다르겠지만 1분 내외의 파일이라면 5~6초 만에 음성을 문자로 변환해 준다. 이 문자를 복사해서 필요한 곳으로 가지고 가서 편집 작업을 하면 된다. 물론 소리가 명확하지 않은 부분은 변환이 안되거나 이상한 글자를 보여주는 경우도 있다. 최소한 한 번쯤은 전체 내용을 읽어보고 이상한 부분이 있다면 수정하는 작업을 거쳐야 한다.

 

 이번 시간에는 PC에서 나오는 오디오를 문자로 변환하는 방법을 알아보았다. 물론 이 방법외에도 다양한 방법들이 있다. 클로바 노트 외에도 소리를 문자로 변환해 주는 프로그램도 존재한다. 어떠한 프로그램이든 사용자가 익숙한 방법이 있다면 그것을 쓰길 추천하며 이 방법을 처음 안 분이라면 클로바 노트를 쓰는 것도 아주 좋은 방법이다.

반응형
그리드형