OpenAI는 이와 관련해서 ChatGPT의 음성을 선정한 방법 글을 별도로 올린바 있습니다.

ChatGPT 음성을 선택하는 과정

  • ChatGPT의 음성 모드는 사용자들에게 사랑받는 기능 중 하나임
  • 5개의 개성 있는 음성(Breeze, Cove, Ember, Juniper, Sky)은 5개월에 걸친 광범위한 과정을 통해 신중하게 선택됨
  • 전문 성우, 에이전시, 캐스팅 감독, 업계 고문 등이 참여함

창작 커뮤니티 지원과 성우업계와의 협력

  • OpenAI는 창작 커뮤니티를 지원하고 성우 캐스팅을 위해 성우업계와 긴밀히 협력함
  • 각 성우는 시장 최고 수준 이상의 보상을 받으며, 음성이 제품에 사용되는 한 계속될 예정임
  • AI 음성은 유명인의 독특한 목소리를 의도적으로 모방하지 않아야 한다는 신념을 가짐
  • Sky의 음성은 스칼렛 요한슨의 모방이 아니라 다른 전문 여배우의 자연스러운 목소리임
  • 성우들의 프라이버시 보호를 위해 이름은 공개하지 않음

음성 기준 설정을 위해 수상 경력의 캐스팅 감독 및 프로듀서와 협력

  • 2023년 초, 성우 선정을 위해 독립적이고 저명하며 수상 경력이 있는 캐스팅 감독 및 프로듀서와 협력함
  • 각 음성의 독특한 개성과 글로벌 청중에 대한 매력을 신중하게 고려하여 ChatGPT 음성에 대한 기준을 만듦
  • 기준에는 다양한 배경 또는 다국어 구사 가능, 시대를 초월하는 음성, 신뢰감을 주는 음성, 따뜻하고 매력적이며 자신감을 주는 음성 등이 포함됨

400개 이상의 지원을 받은 성우 및 스크린 배우

  • 2023년 5월, 캐스팅 에이전시와 캐스팅 감독은 인재 모집 공고를 냄
  • 1주일 만에 400개 이상의 지원을 받음
  • 배우들은 ChatGPT 응답 대본을 받아 녹음하는 방식으로 오디션을 봄

최종 5개 음성 선정 및 배우들과 AI 음성 상호작용에 대한 비전 논의

  • 2023년 5월 내내 캐스팅팀은 14명의 배우를 독립적으로 검토하고 선정함
  • 최종 후보 음성을 OpenAI에 제출하기 전 추가로 정제 작업을 거침
  • 각 배우와 AI 음성 상호작용에 대한 비전과 기술의 능력, 한계, 위험, 안전장치 등에 대해 논의함
  • 배우들이 프로젝트에 전념하기 전에 음성 모드의 범위와 의도를 이해하는 것이 중요했음
  • OpenAI 내부 팀이 제품 및 연구 관점에서 음성을 검토한 후 신중한 고려 끝에 최종 음성이 선정됨

녹음을 위해 샌프란시스코로 배우 초청 및 ChatGPT 음성 출시

  • 6월과 7월에 녹음 세션과 OpenAI 제품 및 연구 팀과의 대면 미팅을 위해 배우들을 샌프란시스코로 초청함
  • 2023년 9월 25일, ChatGPT에 음성을 출시함
  • 전체 과정은 5개월에 걸쳐 배우 및 캐스팅팀과 광범위한 협력이 이루어짐
  • GPT-4o의 오디오 연구 및 새로운 음성 기능을 위해 배우들과 계속 협력 중임

유료 사용자를 위한 GPT-4o의 새로운 음성 모드 및 추가 음성 도입 계획

  • 향후 몇 주 내에 ChatGPT Plus 사용자에게 GPT-4o의 새로운 음성 모드 알파 버전 제공 예정
  • GPT-4o를 사용하면 음성으로 ChatGPT와 훨씬 더 자연스럽게 상호 작용할 수 있음
  • GPT-4o는 중단을 원활하게 처리하고, 그룹 대화를 효과적으로 관리하며, 배경 소음을 필터링하고, 톤에 적응함
  • 앞으로 사용자의 다양한 관심사와 선호도에 더 잘 부합하기 위해 ChatGPT에 추가 음성 도입 계획을 가지고 있음