작성자인 ukiyojingu 님의 허가를 받아 번역 및 게시합니다.

원링크
https://note.com/ukiyojingu/n/n8e440dcafb37

2023.03.09 작성

 

 

들어가며

 

ㅤ3월 9일, 대학의 연구실에 HDD를 반납한 뒤 도서관에서 교토학파에 관한 책을 읽으려고 했는데 휴관일이었다. 나는 어쩔 수 없이 다른 대학으로 발을 옮겼는데, 그쪽도 오늘은 휴관이었다. 갈 곳을 잃고 교토시 북부를 방황하다가, 절묘하게 먼 거리에 있는 공공 도서관으로 향하는 것도 귀찮아져 집에 돌아가기 시작하니 19시 경이었다. 요즘은 옥외 활동도 잦고 꽃가루도 많이 날려서 이 시기가 되면 눈을 뜨기도 힘겨워진다. 그래서인지, 오늘이 3월 9일으로 「미쿠의 날」이라는 것도 방금 막 생각해냈다.

 

 

ryo - 멜트

 

ㅤ내가 하츠네 미쿠의 매력을 처음으로 느낀 시점은 「Tell Your World」 어귀였지만, 처음으로 목소리를 들은 것은 좀 더 예전이었다. 지금으로부터 약 13년 전, 중학생 때 교내 방송으로 흘러나왔던 「멜트」가 하츠네 미쿠와의 첫만남이었다. 당시엔 아직 「보카로 = 오타쿠에 아싸」라는 이미지가 있어 기피하는 경향이 심했는데, 하츠네 미쿠가 사람이 아니라는 사실조차 몰랐던 나는 그저 「위화감이 엄청나다」라는 순수한 이유로 보카로를 좋아하지 않았다. 몇 년이 지나서야 하츠네 미쿠가 음성 합성 엔진이며, 본질적으로 인간이 아니라는 사실을 알게 되었다.

 

 

「기분 나쁨」의 가능성

 

ㅤ하츠네 미쿠의 목소리는 설령 「멜트」처럼 인간이 부를 수 있는 멜로디 라인으로 구성되어 있어도, 특징적인 기계음으로 인해 우리들에게 위화감을 갖게 한다. 위화감은 어쩌면 하츠네 미쿠, 그리고 보컬로이드 음악 특유의 개성이라고도 여겨진다. 하지만, 이러한 개성은 2010년 이후 보다 발전한 음성 합성 엔진의 세계에서 서서히 변화하고 있다.

 

ㅤ필자가 이전에 기고한 『음성 합성 엔진 음악의 세계 2021』에서는, VOCALOID 엔진에 한정되지 않은 소프트웨어가 대두하고 있다고 지적하였다. 또한 종래의 「보컬로이드」가 아닌 「음성 합성 엔진」의 시대가 도래하였다고 서술하였다. 2010년대에 서서히 주목받게 된 CeVIO나 Synthesizer V 등의 엔진은, VOCALOID 엔진의 위치를 위협할뿐만 아니라, 보컬로이드 특유의 목소리와 그 목소리로 인해 형성된 문화 자체를 뒤흔들고 있다. 보카로 문화를 동물에 빗댄다면, 동물이 움직일 수 있게하는 심장이라 할 수 있을 엔진이 바뀌고 있다. 종래의 하츠네 미쿠가 갖고 있던 위화감, 이른바 「불완전함」은 CeVIO AI 「카후」의 진화한 인터페이스와 Synthesizer V 「코하루 릿카」의 인간을 쏙 빼닮은 숨소리와 목소리를 통해 소실되었다. 그 결과 보컬로이드는 지금까지와는 완전히 다른 국면에 접어들었다. 우리들은 지금, 그 과도기에 서있다. 그렇다면 역시 시대의 변화를 목전에 두고, 우리는 「보컬로이드」에서 「음성 합성 엔진」로 나아가야 할지 말아야 할지를 우리는 확실히 정해야 한다.

 

하치나나 - 레터팩으로 현금 보내라는건 전부 사기입니다 feat. SynthVs

 

ㅤ인터페이스의 진화와 리얼한 목소리는, 음합엔 소프트웨어의 발전의 상징임과 동시에 이전엔 드러나지 않았던 문제를 내포하고 있다. 종래에는 엄격하게 유지되어왔던 「표피」와 「내부」의 경계선에 관한 문제는 앞으로 더 큰 문제로 다가올 것이다. 우리는 하츠네 미쿠와 후지타 사키의 관계와 동일하게, 코하루 릿카와 아오야마 요시노(*코하루 릿카의 성우)의 관계를 인식할 수 있을까.

 

 

하츠네 미쿠의 표피 — 보컬로이드 15년과 '하츠네 미쿠'와 '우리들'

작성자인 ukiyojingu 님의 허가를 받아 번역 및 게시합니다. ukiyojingu 보카로P, 작곡 및 비평. 대학 교원(인문사회정보학), 대학 도서관 사서. 원링크 https://note.com/ukiyojingu/n/n030cd9534da1 --- 본 기획은 obs

chohot-touhou.tistory.com

 

ㅤ하츠네 미쿠와 후지타 사키는 이른바 「표피」와 「안쪽 사람」이며, 본질적으로는 뗄레야 뗄 수 없는 관계라는 사실은 자명하다. 그러나 보컬로이드 문화를 깊게 이해하는 사람일수록, 문화권 속에 후지타 사키라는 성우가 존재하지 않는다는 것을 알고 있다. 왜냐하면 하츠네 미쿠에게 후지타 사키는 「안쪽 사람」이긴 하지만, 하츠네 미쿠의 표피를 벗겨냈을 때 드러나는 「안쪽 사람」은 절대 후지타 사키가 아니기 때문이다. 「표피」와 「안쪽 사람」은 결단코 완전한 이퀄을 이루지 못한다. 그 이유는 역시 하츠네 미쿠의 목소리가 인공적으로 만들어져 위화감을 띠기 때문이다. 보카로P가 「나만의 미쿠」라는 캐치 프레이즈와 함께 독자적인 조교로 하츠네 미쿠에게 노래하게 하는 행위는, 인공적인 목소리가 지닌 불완전함을 완전함으로 승화시키는 행위다. 그녀가 지닌 불완전함을 완전함으로 승화시키는 과정 속에서 보카로P는 창의성을 발휘하고, 「나만의 미쿠」라는 개념을 성립시킨다. 하츠네 미쿠의 불완전한 목소리는 기분나쁜 인상을 줄지도 모르나, 그러한 것들이 존재하기 때문에 「나만의 미쿠」라는 개념이 완성된다. 이러한 개별적이고 구체적인 보카로P들의 「나만의 미쿠」가 쌓이고 쌓여서, 하츠네 미쿠의 「안쪽 사람」을 집합체로서 구성한다.

 

ㅤ이렇게 보면, 「표피」의 안쪽에는 「후지타 사키」만 존재하지 않는다는 사실은 확실하다. 안쪽에는 개별적이고 구체적인 협력 관계에 있으면서도 공통된 필드에서 전개되는, 우리들이라는 집합적인 존재가 있다. 철학자 엔도 카오리遠藤薫는 이러한 고정되지 않는 관계성을 복제기술의 상상 행위라고 정의하며 하츠네 미쿠를 긍정적으로 바라보고 있다.

 

 

「표피」와 「안쪽 사람」의 긴장성

 

ㅤ이러한 하츠네 미쿠의 「안쪽 사람」의 복잡성을 이해한 우리들이, 어떻게 「카후」나 「코하루 릿카」를 직시할 수 있을까. 새로운 음합엔 소프트와 기나긴 역사를 지닌 하츠네 미쿠를 단순히 비교하는 것은 바람직하지 않지만, 신기술을 접목한 소프드웨어들은 인터페이스 면으로도 목소리 면으로도 혁신을 거듭했다. 정당한 진화를 이룬 음합엔 후발주자들은 이전과 같이 조교할 필요도 없고, 간단한 조작으로 인간과 빼닮은 목소리를 낼 수 있다. 이것은 분명히 매력적인 부분이다. 하지만 「나만의 미쿠」라는 개념처럼 복잡성으로 인해 성립한 보카로라는 우주가, 후발주자들의 세계에도 형성될 수 있을까. 내가 중학생 시절에 느낀 위화감은 인간과 똑같은 목소리로 점점 소실되어가지만, 위화감이 「나만의 미쿠」를 만들어낸다면, 이 변화를 어떻게 받아들여야 좋을지 참 어렵다. 「나만의 미쿠」에는 하츠네 미쿠의 위화감, 기분 나쁨이 필요하다.

 

irori - 구르는 바위, 네게 아침이 내린다 covered by 코하루 릿카

 

ㅤ숨소리가 없고 위화감으로 점철된 기분 나쁜 하츠네 미쿠의 목소리가 있어야만, 하츠네 미쿠라는 표피에 우리라는 집합적 존재를 접합시킬 수 있다면, 코하루 릿카와 아오야마 요시노의 경우는 어떠할까. 음합엔의 목소리가 인간의 목소리와 구별 불가능한 시대가 도래한다면, 우리는 오리지널의 목소리와 음합엔의 목소리 사이에 생기는 경계선을 인식하고 유지할 수 있을까. 물론 코하루 릿카라는 캐릭터성이 아오야마 요시노와 코하루 릿카 사이에 경계선을 긋고 있지만, 보다 리얼한 목소리가 만들어질 미래에는 코하루 릿카라는 표피가 아오야마 요시노라는 「안쪽 사람」을 완전히 덮어버릴 가능성도 없지 않다.

 

ㅤ이성적인 사고가 제거된 오늘날의 정동적(靜動的 statnamic) 커뮤니케이션은 그 가능성을 가속시키고 있다. 사회학자 이토 마모루伊藤守는 누구나 간단히 커뮤니케이션을 나눌 수 있는 2010년대에, 주어진 상황이나 개념을 스스로 사고하지 않고 직관적으로 판단하는 일이 이전에 비해 크게 늘어났다고 지적하였다. 우리가 SNS에서 정보를 확산시킬 때, 그 정보의 내용이 옳은지 그른지에 대한 판단은 수반되지 않는다. 애시당초 「읽지도 않은」 정보를 확산시키는 경우도 많다. 물론, 이 기사조차 마지막까지 읽히지 않을 가능성이 있다. 어떠한 그림을 인간이 그렸는지 AI가 그렸는지도 점차 판단하기 어려워져 「그냥 좋은 그림이니까」라는 이유만으로 확산하는 작금에 있어서, 과연 「목소리」의 독자성은 언제까지 담보될지 의문스럽다. 왜냐하면, 정동적 커뮤니케이션의 시대에 있어서 우리는 상시 「맘에 드는 정보」만 제대로 섭취하기 때문이다. (또는 「맘에 드는 정보」만 흘러들어오는 상황에 있기 때문이다.) 이것은 필터 버블(Filter bubble)의 문제로 오래간 논의되어온 문제기도 하다.

 

 

끝마치며

 

ㅤ철학의 난제로 「태세우스의 배」라는 것이 있다. 지속적인 수리로 원형을 완전히 잃어버린 배를, 과연 원래 있던 배와 같은 것이라고 말할 수 있는가 없는가라는 역설, 자기동일성에 대한 문제다. 만약 아오야마 요시노에 견주어 손색없는 목소리를 코하루 릿카가 낼 수 있게 됐을 때, 그것은 아오야마 요시노가 아닌가라는 문제가 곧 생길지도 모른다. 그 문제를 앞두고 우리는 코하루 릿카를 어떻게 다뤄야 할까. 모든 목소리가 간단히 음합엔이 될 수 있는 시대는 이 문제를 심화시키고 있다. 이 문제는 하츠네 미쿠에게는 존재하지 않았지만, 바꿔 말하자면 2010년대를 거치며 음성 합성 엔진이 비약적으로 진화했다는 확실한 근거라고도 말할 수 있다.

 

ㅤ상술한 「표피」의 문제가 나타났다는 것 자체가, 복잡성과 기분 나쁨으로 구성된 「보컬로이드」 문화와는 다른 「음성 합성 엔진」의 문화권에 우리들이 진입했다는 사실을 시사한다. 전술한대로 하츠네 미쿠의 「안쪽 사람」은 「우리들」이었다. 이러한 상황은 간단한 조작과 리얼한 목소리로 인해 서서히 전개되고 있다. 하츠네 미쿠의 「위화감」과 그것이 가져오는 「기분 나쁨」은 음합엔의 진화와 맞바꿔 망각되어 간다. 그렇다면, 「기분 나쁨」은 하츠네 미쿠라는 소프트웨어가 지니는 하나의 커다란 가능성이다. 기계음의 위화감은 음합엔의 시대에 대한 보컬로이드의 대답으로써, 앞으로도 계속 검토되어야만 한다.

 

 

---

 

irori의 구르는 돌 코하루 릿카 커버는 확실히 재미있는 상황이었다.

릿카 성능이 워낙 좋다보니 봇치더락 원본이랑 큰 차이가 없기도 했고..

 

시모다 아사미 - 악의 딸

 

시모다 아사미 - 악의 하인
 

Crescent Moon ver. Fūga Naoto

Crescent Moon ver. Fūga Naoto [音楽・サウンド] 前回のカンタレラに引き続き、黒うさPさんの大好きな歌「上弦の月」をたくさんのかたのおかげでUPす...

www.nicovideo.jp

 

좀 다른 경우지만 시모다 아사미의 카가미네 린・렌 노래 커버나, 후우가 나오토의 상현의 달 커버도 생각난다. 시모다 아사미는 린렌의 목소리 제공자고, 후우가 나오토는 KAITO의 목소리 제공자였다.

 

최근엔 모바일게임의 캐릭터 목소리를 추출해 AI음성을 만들어 노래를 커버하게 하기도 하던데, 앞으로 계속 보카로-음합엔의 정의와 지위는 흔들릴 것 같다. 신스비나 체비오에 비해 부자연스러운 기계음이라는 아이덴티티를 계속 유지중인 크립톤은 그것을 차별점으로 갖고가려는걸까.

  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기