음성 합성기와 TTS 시스템, 그리고 일반적인 NLP에 대한 관심이 커서 컴퓨터 과학과 계산 언어학을 공부하게 된 주된 이유 중 하나였음. 이 기술들은 대학 시절 꿈꿔왔던 불가능해 보이던 과학 기술이었는데, 현재 이 분야의 발전 속도에 놀라움을 금치 못함. suno.ai는 로봇처럼 뚝뚝 끊기는 음성도 모방할 수 있음.
suno.ai가 발음하는 몇몇 단어들이 재미있게 변형되는 현상을 발견함. 예를 들어 "sublicence"는 "sublissence", "fitness"는 "fisted", "infringement"는 "infring-ment", "liable"은 "liar-ful"로 발음됨. 또한, 음성의 피치 전환은 자동 조정되거나 전자화된 것처럼 들림. AI가 생성한 보컬을 감지하는 전문가들이 생길 것으로 예상함.
"software"라는 단어의 발음이 재미있었음.
GPT4 이후로 AI에 의해 이렇게 놀란 적이 없음. 비전문 음악가로서 Suno.ai를 확인해볼 것을 권함. 이 기술은 음악 구독 서비스의 대체재가 될 수 있으며, 전문가들에게는 충격적일 수도 있음.
이 논의에서는 음성 합성에 초점을 맞추고 있음. 다른 댓글러들이 이미 중요한 점을 언급했기 때문에 추가로 언급하지 않음. 음악적으로는 아직도 흥미로운 것을 생성하는 데는 멀었음. 조화, 템포, 구조, 다이내믹스 등 모든 것이 혼란스럽고 구조가 없음. 순수 생성 모델만으로는 더 높은 수준에 도달하기 어려울 것으로 보임. 혼합된 규칙 기반과 생성적 접근이 필요할 수도 있음.
Claude Sonnet이 작곡한 곡을 Suno에서 편집했는데, 스타일은 맞지 않았지만 꽤 잘 나옴.
Dune의 공포의 연가를 Bing Chat을 사용해 코드 복잡성에 맞서는 내용으로 재작성한 후, suno.ai를 통해 간단화가 필요한 코드에 대한 감정을 표현하는 2분짜리 노래로 만듦.
읽는 것에 대해 내면적으로 속삭이는 습관이 있고, 머릿속에 노래가 맴돌 때 그 노래의 멜로디에 맞춰 읽는 단어들을 누군가가 부르는 것처럼 상상하는 희귀한 취향을 가짐.
Hacker News 의견