최근 한창 이슈가 되고 있는 Deep Learning 중에서 GAN 이라 불리는 방법으로 만든 알고리즘이라고 합니다. <div><br></div> <div>손석희, 문재인, 박근혜 목소리로 글을 읽어주는데, 약간 기계음 느낌이 없다면 진짜 해당하는 사람이 읽은 거 녹음한 줄 알겠습니다. ㄷㄷ</div> <div><br></div> <div>아래 링크 들어가시면 다양한 예제들을 확인해보실 수 있습니다.</div> <div><br></div> <div><a target="_blank" href="http://carpedm20.github.io/tacotron/" target="_blank">http://carpedm20.github.io/tacotron/</a></div> <div><br></div> <div>아래는 "이거 실화냐?"를 읽은 예제입니다.</div> <div><br></div> <div>손석희 버젼</div> <div><embed src="http://carpedm20.github.io/tacotron/audio/son/really.mp3"><br></div> <div><br></div> <div>문재인 버젼</div> <div><embed src="http://carpedm20.github.io/tacotron/audio/moon/really.mp3"><br></div> <div><br></div> <div>박근혜 버젼</div> <div><embed src="http://carpedm20.github.io/tacotron/audio/park/really.mp3"><br></div> <div><br></div> <div>이게 왜 어려우면서 놀라운 기술이냐면, 그냥 글 읽어주는 거야 글자별로 읽는 거가 아니냐 싶겠지만, 글자간의 연결음, 문장의 시작과 끝, 띄어쓰기 등에서 톤과 발음이 바뀌기 때문에 이러한 모든 것을 다 녹음해서 처리할 수가 없기 때문입니다. 예전에 남녀 탐구생활에서 모노톤으로 나레이션이 들어가는 게 이목을 끌었듯이, 그냥 녹음해서 읽는 거라면 모노톤일뿐만 아니라 연결음 자체가 엄청 부자연스러워집니다. 그래서 자연스럽게 글을 읽는 것과 함께 이렇게 각 사람의 목소리를 흉내낼 수 있다는 게 신기하고 대단한 기술인 겁니다.</div> <div><br></div> <div>마무리는 문재인 대통령 목소리인데 너무 실감나게 읽는 것 같아서 하나 더 남깁니다. ㅋㅋ</div> <div><br></div> <div>"그리고 정마담한테 주려는거 이거 이거, 이거 이거 장짜리 아니여?"</div> <div><embed src="http://carpedm20.github.io/tacotron/audio/moon/sudda.mp3"><br></div>
댓글 분란 또는 분쟁 때문에 전체 댓글이 블라인드 처리되었습니다.