DeepVoice AI - Text To Voice / 생성형 AI 게임 성우

유니티 에셋스토어 봄 세일 : 4월 17일 8시 ~ 5월 8일 8시 (태평양표준시)

 

에셋스토어 봄 세일이 시작되었습니다. 상단 배너 클릭시 50% 할인 목록 페이지로 연결됩니다.

 

 

# 유니티 에셋스토어 링크

https://prf.hn/click/camref:1101l7zGS/destination:https://assetstore.unity.com/packages/tools/generative-ai/deepvoice-ai-text-to-voice-251738

 

DeepVoice AI - Text To Voice | 생성형 AI | Unity Asset Store

Get the DeepVoice AI - Text To Voice package from AiKodex and speed up your game development process. Find this & other 생성형 AI options on the Unity Asset Store.

assetstore.unity.com

 

 

 

#. 어떤 에셋인가요?

최근 AI 생성물로 게임 리소스를 제작하는 시도가 많아지고 있다.

DeepVoiceAI는 그중에서 인 게임 내 '성우'의 리소스를 AI로 제작할 수 있는 생성형 AI 에셋이다.

 

텍스트를 게임 목소리로 변환해 주는 솔루션 

 

리뷰수 95 (5점), 찜 수 1296로 평가가 좋은 편이다.


주요 기능은 다음과 같다.
- 텍스트에서 음성을 생성

- 생성된 오디오 파일을 다듬고, 결합하고, 이퀄라이징

- 95개 이상 준비된 목소리 모델

- 가입 없음API 키 없음반복 결제 없음구독료 없음, 추가 비용 없음, 음성 모델에서 한 번의 클릭으로 쉽게 추론할 수 있습니다.

- 사용량 월 6만 자 (12포인트 텍스트 기준 18페이지), 매월 1일 초기화

- Unity 에디터 내부의 편집 모드 또는 재생 모드에서 실시간으로 작동

   (단. 생성시간이 8~15초라서 실시간으로 사용하지는 못할 것 같다.)

 

처음 이 에셋을 에셋스토어목록에서 보고 처음 예상했던 인상은

'다른 솔루션들처럼 무늬만 에셋스토어고 자체 사이트 가입하고, 결제해서 API 구독하고 에셋스토어는 유니티랑 연결된 부분만 제공해주지 않을까' 하는 생각이었다. 

 

하지만 예상과 다르게

DeepVoiceAI는 외부 연결 없이 완전히 독립적으로 유니티 에디터에서 음성을 생성하는 솔루션이다. 

 

#. 사용법

우선 임포트 해보면 EditorCoroutines 패키지가 필요하다는 경고창이 표시된다.

EditorCoroutines 패키지는  Unity Registry 탭에서 찾을 수 있다.

 

임포트 후에는 상단 탭 Window-DeepVoice 에서 팝업을 열 수 있으며,

실행 시 팝업 최상단에 인보이스 번호(영수증 번호)를 입력하는 란이 있다. 

 

인보이스 번호는 에셋스토어서 아이디 클릭 - 내 주문 내역에서 확인할 수 있다.

인보이스가 확인되었다는 로그가 출력되면 완료된 것.

 

#. 대사 생성하기

DeepVoice의 모델은 4개가 존재한다.

 

한국어는 Deep Voice Multi 속성에서만 사용할 수 있으니 Deep Voice_Multi를 선택한다.

 

Text 필드에 생성하기 원하는 대사를 입력하고, Voice에 원하는 음성모델을 선택한다.

그 후 Generate Voice를 눌러주면 바로 대사파일이 생성된다.

 

Variability(가변성) : 목소리톤. 값이 작을수록 음성이 더 표현력 있어지지만 불안정해질 수 있다.

(높을수록 나레이션 톤, 낮을수록 연기톤인 듯하다)

Clarity(선명도) : 값이 높을수록 음성이 선명해지고 일관적인 목소리가 되지만, 너무 높으면 아티팩트 발생.

 

생성형 AI는 설정값이 동일하더라도 생성할 때마다 다른 결과물이 생성됩니다.

따라서 원하는 결과가 나올 때까지 여러 번 시도해야 될 수 있습니다.

 

 

 

 

#. 대사 커스텀하기

1. 머뭇거림(말 사이에 잠시 멈춤) 추가하기

텍스트에는 대시 (-) 긴 대시 (—) 줄임표(…) 를 추가해서 머뭇거림을 추가할 수 있다.

줄 바꿈 하면 줄 사이에 잠시 멈춤을 추가할 수 있다.

그렇지만- 이건- 내가 원한게 아니야

 

2. 감정을 넣어서 말하기

대사 앞뒤로 \"를 추가해 주면 감정을 추가해서 말한다. (따옴표 앞에 백슬래시 반드시 필요)

\" 정말인가요? \" 그는 혼란스러워하며 말했다. 

 

 

#. 그 외의 기능 : 자르기, 잇기, 피치 조절

말 그대로 오디오 파일을 자르고, 이어붙이고, 음량과 피치를 조절할 수 있는 기능이 포함되어있다.

그냥 오디오 클립기반으로 작동하기 때문에

솔루션으로 생성된 오디오 뿐만아니라 모든 오디오 클립을 조절할 수 있다는 것도 장점. 

 

#. 개인평가

여러 테스트를 해보고 느낀 점은 나레이션톤의 대사는 만들기 쉽고 퀄리티도 수준급이지만 

스토리 게임에서의 대사는 원하는 대사를 만들려면 많은 시도가 필요해 보인다.

 

나레이션 생성용으로는 수준급, 감정 대사는 많은 시도 필요.

 

감정이 들어간 대사는 그때그때 결과값이 다르기 때문에 원하는 결과값을 얻어내려면 수십 번을 생성해서 골라야 할 것으로 보인다.

 

전체적으로 결과물은 영어가 학습 데이터가 많기 때문에 퀄리티가 더 좋은 것으로 보인다.

 

 

 

#. 마치며

스타크래프트 같은 RTS나 다키스트 던전같이 나레이션 대사가 적극 활용되는 게임을 만든다면

충분히 활용할 여지가 있는 솔루션으로 보인다.

 개발자들도 아직 초기단계라고하니 앞으로 품질은 더욱 향상될 것으로 보인다.

 

 

댓글

Designed by JB FACTORY