Hacker News 의견
  • 음성 합성기와 TTS 시스템, 그리고 일반적인 NLP에 대한 관심이 커서 컴퓨터 과학과 계산 언어학을 공부하게 된 주된 이유 중 하나였음. 이 기술들은 대학 시절 꿈꿔왔던 불가능해 보이던 과학 기술이었는데, 현재 이 분야의 발전 속도에 놀라움을 금치 못함. suno.ai는 로봇처럼 뚝뚝 끊기는 음성도 모방할 수 있음.
  • suno.ai가 발음하는 몇몇 단어들이 재미있게 변형되는 현상을 발견함. 예를 들어 "sublicence"는 "sublissence", "fitness"는 "fisted", "infringement"는 "infring-ment", "liable"은 "liar-ful"로 발음됨. 또한, 음성의 피치 전환은 자동 조정되거나 전자화된 것처럼 들림. AI가 생성한 보컬을 감지하는 전문가들이 생길 것으로 예상함.
  • "software"라는 단어의 발음이 재미있었음.
  • GPT4 이후로 AI에 의해 이렇게 놀란 적이 없음. 비전문 음악가로서 Suno.ai를 확인해볼 것을 권함. 이 기술은 음악 구독 서비스의 대체재가 될 수 있으며, 전문가들에게는 충격적일 수도 있음.
  • 이 논의에서는 음성 합성에 초점을 맞추고 있음. 다른 댓글러들이 이미 중요한 점을 언급했기 때문에 추가로 언급하지 않음. 음악적으로는 아직도 흥미로운 것을 생성하는 데는 멀었음. 조화, 템포, 구조, 다이내믹스 등 모든 것이 혼란스럽고 구조가 없음. 순수 생성 모델만으로는 더 높은 수준에 도달하기 어려울 것으로 보임. 혼합된 규칙 기반과 생성적 접근이 필요할 수도 있음.
  • Claude Sonnet이 작곡한 곡을 Suno에서 편집했는데, 스타일은 맞지 않았지만 꽤 잘 나옴.
  • Dune의 공포의 연가를 Bing Chat을 사용해 코드 복잡성에 맞서는 내용으로 재작성한 후, suno.ai를 통해 간단화가 필요한 코드에 대한 감정을 표현하는 2분짜리 노래로 만듦.
  • 읽는 것에 대해 내면적으로 속삭이는 습관이 있고, 머릿속에 노래가 맴돌 때 그 노래의 멜로디에 맞춰 읽는 단어들을 누군가가 부르는 것처럼 상상하는 희귀한 취향을 가짐.
  • 음악과 목소리가 모델링된 사람이나 예술가의 이름을 모르기 때문에 소녀가 슬퍼함.
  • 라이선스에서 운율을 추출해낸 것에 인상적임.