Hacker News 의견

요약:

  • 최적화 문제를 잘 해결하려면 비용에 대한 데이터가 중요함. PostgreSQL은 개선의 여지가 많음. 특히 syscall latency 데이터, foreign key 통계 등이 부족함.
  • 대규모 쿼리의 경우 실행 중 계획을 수정할 수 있는 deferred planning 등의 기법 도입이 필요함.
  • 기계학습은 비용 예측 모델 개선에 활용하는 게 적절함. 기계학습으로 직접 쿼리 계획을 세우는 건 적절치 않음.
  • shared buffer를 크게 잡아 데이터를 모두 메모리에 올려 벤치마킹하는 건 옵티마이저의 실제 성능을 제대로 평가하기 어려움.
  • JIT 컴파일러는 아직 성능 저하만 초래하는 경우가 많음.
  • PostgreSQL 버전 넘버링이 10버전부터 바뀌었으므로 8.x, 9.x 버전을 major 버전으로 보고 성능 추이를 분석하는 것도 흥미로울 듯함.
  • 제시된 그래프만으로는 성능 개선 추세를 명확히 확인하기 어려움. Tail latency는 개선된 듯 보이나 나머지는 각각 다를 수 있음.
  • 훌륭한 옵티마이저를 만드는 건 상당히 도전적인 과제임.
  • 쿼리 최적화가 SQL 수준인지 알고리즘 수준인지 궁금함.