▲neo 9달전 | parent | favorite | on: GN⁺: 안정적인 오디오 데모(stability-ai.github.io)Hacker News 의견 Ed Newton-Rex는 저작권과 훈련 데이터에 대한 우려로 Stable Audio 출시 후 곧바로 퇴사함. 그는 이후 Fairly Trained라는 조직을 설립함. 참조: Ed Newton-Rex 프로필 Safari에서는 웹사이트가 제대로 작동하지 않을 수 있음. 최상의 경험을 위해 Google Chrome 사용 권장. 90년대와 Internet Explorer의 상황이 반복되고 있으나, 이번에는 지배적인 브라우저가 오픈소스라는 점에서 긍정적임. Chrome 전용으로 보는 것이 최선이라는 애니메이션 GIF 버튼 제작을 누군가에게 요청함. Stable Diffusion과 마찬가지로, 텍스트 프롬프트는 유용한 출력을 얻는 가장 통제하기 어려운 방법일 것임. MIDI를 입력으로 사용하여 신경망 신디사이저를 얻을 수 있을 것으로 예상함. Stable Audio는 현재의 SOTA 음악 모델들(MusicGen, MusicLM)에 비해 매우 우수함. Stable Audio 제품 페이지에서 구독하여 사용할 수 있으나, 개발자가 통합하거나 활용할 수 있는 API는 제공되지 않음. AI가 고품질 사운드 라이브러리를 학습하고, MIDI를 통해 해당 라이브러리의 사운드를 트리거하는 단계가 여전히 필요함. 이를 통해 음질은 완벽하면서도 음악 AI의 창의성을 유지할 수 있을 것임. 드러머로서 '드럼 솔로'는 지루하고 이상한 소리가 섞여 있으며, 실제와 같은 소리 효과는 아직 아님. 그러나 이룬 진전은 매우 크며 인상적임. 코드와 훈련 지침은 공개되었지만 모델은 공개되지 않음. 이는 사실상 익명의 사용자들이 Apple Music 계정에 데이터 로더를 연결하여 실험하도록 유도하는 것과 같음. '고품질, 스테레오'라는 프롬프트를 추가하는 것이 일반적으로 도움이 됨을 발견한 것은 재미있음. LLM에서 더 나은 결과를 단순히 요청함으로써 얻을 수 있다는 것이 흥미로움. 사운드 이펙트 생성에 대한 아이디어는 잠시 흥미로웠지만, '발걸음 소리'는 매우 형편없음. '에너지 넘치는 음악, 바이올린, 보컬, 오케스트라, 피아노, 미니멀리즘, 존 애덤스, 닉슨 인 차이나'라는 프롬프트를 사용하여 매우 독특하고 흥미로운 음악을 생성할 수 있음. Stable Audio 공유 링크
Hacker News 의견
Ed Newton-Rex는 저작권과 훈련 데이터에 대한 우려로 Stable Audio 출시 후 곧바로 퇴사함.
90년대와 Internet Explorer의 상황이 반복되고 있으나, 이번에는 지배적인 브라우저가 오픈소스라는 점에서 긍정적임.
Stable Diffusion과 마찬가지로, 텍스트 프롬프트는 유용한 출력을 얻는 가장 통제하기 어려운 방법일 것임.
Stable Audio는 현재의 SOTA 음악 모델들(MusicGen, MusicLM)에 비해 매우 우수함.
AI가 고품질 사운드 라이브러리를 학습하고, MIDI를 통해 해당 라이브러리의 사운드를 트리거하는 단계가 여전히 필요함.
드러머로서 '드럼 솔로'는 지루하고 이상한 소리가 섞여 있으며, 실제와 같은 소리 효과는 아직 아님.
코드와 훈련 지침은 공개되었지만 모델은 공개되지 않음.
'고품질, 스테레오'라는 프롬프트를 추가하는 것이 일반적으로 도움이 됨을 발견한 것은 재미있음.
사운드 이펙트 생성에 대한 아이디어는 잠시 흥미로웠지만, '발걸음 소리'는 매우 형편없음.
'에너지 넘치는 음악, 바이올린, 보컬, 오케스트라, 피아노, 미니멀리즘, 존 애덤스, 닉슨 인 차이나'라는 프롬프트를 사용하여 매우 독특하고 흥미로운 음악을 생성할 수 있음.