neo 9달전 | parent | favorite | on: GN⁺: 안정적인 오디오 데모(stability-ai.github.io)
Hacker News 의견
  • Ed Newton-Rex는 저작권과 훈련 데이터에 대한 우려로 Stable Audio 출시 후 곧바로 퇴사함.

    Safari에서는 웹사이트가 제대로 작동하지 않을 수 있음. 최상의 경험을 위해 Google Chrome 사용 권장.

  • 90년대와 Internet Explorer의 상황이 반복되고 있으나, 이번에는 지배적인 브라우저가 오픈소스라는 점에서 긍정적임.

    • Chrome 전용으로 보는 것이 최선이라는 애니메이션 GIF 버튼 제작을 누군가에게 요청함.
  • Stable Diffusion과 마찬가지로, 텍스트 프롬프트는 유용한 출력을 얻는 가장 통제하기 어려운 방법일 것임.

    • MIDI를 입력으로 사용하여 신경망 신디사이저를 얻을 수 있을 것으로 예상함.
  • Stable Audio는 현재의 SOTA 음악 모델들(MusicGen, MusicLM)에 비해 매우 우수함.

    • Stable Audio 제품 페이지에서 구독하여 사용할 수 있으나, 개발자가 통합하거나 활용할 수 있는 API는 제공되지 않음.
  • AI가 고품질 사운드 라이브러리를 학습하고, MIDI를 통해 해당 라이브러리의 사운드를 트리거하는 단계가 여전히 필요함.

    • 이를 통해 음질은 완벽하면서도 음악 AI의 창의성을 유지할 수 있을 것임.
  • 드러머로서 '드럼 솔로'는 지루하고 이상한 소리가 섞여 있으며, 실제와 같은 소리 효과는 아직 아님.

    • 그러나 이룬 진전은 매우 크며 인상적임.
  • 코드와 훈련 지침은 공개되었지만 모델은 공개되지 않음.

    • 이는 사실상 익명의 사용자들이 Apple Music 계정에 데이터 로더를 연결하여 실험하도록 유도하는 것과 같음.
  • '고품질, 스테레오'라는 프롬프트를 추가하는 것이 일반적으로 도움이 됨을 발견한 것은 재미있음.

    • LLM에서 더 나은 결과를 단순히 요청함으로써 얻을 수 있다는 것이 흥미로움.
  • 사운드 이펙트 생성에 대한 아이디어는 잠시 흥미로웠지만, '발걸음 소리'는 매우 형편없음.

  • '에너지 넘치는 음악, 바이올린, 보컬, 오케스트라, 피아노, 미니멀리즘, 존 애덤스, 닉슨 인 차이나'라는 프롬프트를 사용하여 매우 독특하고 흥미로운 음악을 생성할 수 있음.