Hacker News 의견
  • LLM이 내 데이터를 학습하지 못하게 하는 것은 가능해야 하며, Perplexity는 이를 쉽게 차단할 수 있도록 해야 함.
  • Perplexity가 실시간 웹 쿼리를 통해 내 웹사이트 데이터를 사용자에게 제공하는 것을 금지하는 것은 위험한 영역으로 들어가는 것임.
  • 광고 차단기, 리더 모드, 화면 읽기 프로그램 등도 Perplexity와 같은 방식으로 작동하며, 이를 금지하는 것은 많은 도구에 영향을 미칠 수 있음.
  • 웹사이트 소유자가 DRM을 사용해 웹사이트를 특정 방식으로만 표시하도록 강제하는 것은 원하지 않음.
  • Perplexity 사용자 에이전트가 적용되는 시점을 오해한 것 같음.
  • 웹사이트 소유자가 사용자가 어떤 브라우저를 사용할지 결정할 수 없으며, Perplexity도 예외가 아님.
  • Perplexity가 사용자 에이전트 없이 대량으로 데이터를 수집하는 것은 문제가 있으며, 이를 중단해야 함.
  • AI 회사가 웹사이트를 스크래핑해 모델을 학습하는 것과 사용자가 요청한 웹 페이지를 가져오는 것은 구분되어야 함.
  • Perplexity가 다른 사람의 콘텐츠를 가져가서 사용하는 것에 대한 문제를 다룬 기사 링크 제공.
  • Perplexity의 크롤러는 robots.txt를 존중해야 하며, 사용자 에이전트는 크롤러가 아니므로 이를 따를 필요는 없음.
  • AI 회사가 내 웹사이트를 스크래핑해도 상관없으며, 그들이 잘못된 데이터를 가져가도록 놔두겠음.
  • 웹 스크래핑을 해본 사람이라면 사용자 에이전트에 대해 거짓말하는 이유를 알 것임.
  • Perplexity CEO가 Google과 OpenAI를 비판했지만, 자신들도 robots.txt를 따르지 않고 사용자 에이전트를 숨긴 것이 드러남.
  • AI 회사가 내 콘텐츠를 무료로 가져가는 것을 막기 위해 보이지 않는 프롬프트 인젝션을 사용할 수 있음.
  • Perplexity가 자발적인 웹 표준을 따르지 않는 것이 거짓말이라고 할 수는 없음.