Hacker News 의견
  • 예측과 의사결정의 연결성

    • 예측은 일반적으로 의사결정으로 이어져야 함.
    • 예측이 의사결정과 분리될 때 그 가치가 불분명해짐.
    • 로젠필드는 과거 데이터에 대한 통계적 결론에 무게를 더하기 위해 예측을 사용하려 하고 있으나, 이는 의심스러움.
  • 오차 막대의 의미

    • 오차 막대의 의미는 명확하지 않음.
    • 하나는 신뢰 구간(모델이 출력이 이 범위 내에 있을 확률을 95%로 제공).
    • 다른 하나는 표준 편차(자신의 예측과 결과 사이의 제곱 차이를 예측하는 것).
  • 오차 막대의 중요성

    • 오차 막대는 새로운 처리의 이점을 비교할 때 더 나은 이해를 제공.
    • 일부는 이것이 문제를 혼란스럽게 만든다고 생각.
    • 의미 있는 오차 막대를 얻는 것은 어떤 경우에는 매우 어려움.
  • 통계 분포의 검토

    • 중요한 지표에 대한 히스토그램(통계 분포)을 정기적으로 살펴봄.
    • 웹 서비스 호출 속도 문제에서 두 개의 명확한 피크가 나타남.
    • 로그아웃된 사용자와 로그인된 사용자를 나타내는 두 피크를 통해 문제의 원인을 더 깊이 파악.
  • 날짜 추정치에 대한 오차 막대

    • 날짜 추정치(즉, 마감일)에도 오차 막대가 있어야 함.
    • 날짜는 예측이며, 불확실성 추정치 없이는 의미가 없음.
  • 불확실성 정량화의 중요성

    • 데이터 과학과 특히 머신러닝에서 불확실성 정량화는 종종 간과됨.
    • 실무자들은 항상 통계적 배경을 가지고 있지 않음.
  • 예측과 측정의 비교

    • 예측은 미래에 대한 측정으로 볼 수 있음.
    • 불확실성에 대한 지식 없이 하는 모든 측정은 의미가 없음.
  • 날씨에 대한 오해

    • 처음에는 이 글이 날씨에 관한 것으로 생각함.
  • 현재 또는 과거의 예측, 즉 나우캐스팅

    • 데이터를 기다리는 동안 현재 또는 과거를 예측하는 예술.
    • 오차 범위 없이는 부정확한 과학/통계임.
  • 오차 막대 없이도 유용한 예측

    • 때로는 단순한 점 예측만으로도 행동을 안내하는 데 필요함.
    • 예측 분포의 전체 지식이 좋은 결정을 내리는 데 도움이 될 수 있음.
  • 가우시안 프로세스 회귀의 장점

    • 가우시안 프로세스 회귀(또는 크리깅)는 큰 장점을 가짐.
  • 모든 추정/예측/예보/내삽/외삽에 대한 신뢰/예측/허용 구간의 필요성

    • 팀이 문제에 투입하는 가정을 포함하는 신뢰/예측/허용 구간이 있어야 함.