GN⁺: Perplexity AI는 User Agent

▲

neo 5달전 | parent | favorite | on: GN⁺: Perplexity AI는 User Agent에 대해 거짓말하고 있음(rknight.me)

Hacker News 의견

LLM이 내 데이터를 학습하지 못하게 하는 것은 가능해야 하며, Perplexity는 이를 쉽게 차단할 수 있도록 해야 함.
Perplexity가 실시간 웹 쿼리를 통해 내 웹사이트 데이터를 사용자에게 제공하는 것을 금지하는 것은 위험한 영역으로 들어가는 것임.
광고 차단기, 리더 모드, 화면 읽기 프로그램 등도 Perplexity와 같은 방식으로 작동하며, 이를 금지하는 것은 많은 도구에 영향을 미칠 수 있음.
웹사이트 소유자가 DRM을 사용해 웹사이트를 특정 방식으로만 표시하도록 강제하는 것은 원하지 않음.
Perplexity 사용자 에이전트가 적용되는 시점을 오해한 것 같음.
웹사이트 소유자가 사용자가 어떤 브라우저를 사용할지 결정할 수 없으며, Perplexity도 예외가 아님.
Perplexity가 사용자 에이전트 없이 대량으로 데이터를 수집하는 것은 문제가 있으며, 이를 중단해야 함.
AI 회사가 웹사이트를 스크래핑해 모델을 학습하는 것과 사용자가 요청한 웹 페이지를 가져오는 것은 구분되어야 함.
Perplexity가 다른 사람의 콘텐츠를 가져가서 사용하는 것에 대한 문제를 다룬 기사 링크 제공.
Perplexity의 크롤러는 robots.txt를 존중해야 하며, 사용자 에이전트는 크롤러가 아니므로 이를 따를 필요는 없음.
AI 회사가 내 웹사이트를 스크래핑해도 상관없으며, 그들이 잘못된 데이터를 가져가도록 놔두겠음.
웹 스크래핑을 해본 사람이라면 사용자 에이전트에 대해 거짓말하는 이유를 알 것임.
Perplexity CEO가 Google과 OpenAI를 비판했지만, 자신들도 robots.txt를 따르지 않고 사용자 에이전트를 숨긴 것이 드러남.
AI 회사가 내 콘텐츠를 무료로 가져가는 것을 막기 위해 보이지 않는 프롬프트 인젝션을 사용할 수 있음.
Perplexity가 자발적인 웹 표준을 따르지 않는 것이 거짓말이라고 할 수는 없음.