Hacker News 의견
  • 혼란스러운 전제에 대한 의견

    한 사용자는 Python 표준 라이브러리의 함수들이 순수 Python으로 작성되었다고 생각하는 것에 대해 혼란스러워함. Python의 파일 읽기 메소드와 OpenDAL 모두 네이티브 코드를 래핑한 Python 래퍼라는 점에서 성능 차이가 흥미롭지만, "Python보다 느리다"고 표현하는 것은 이상하다고 느낌. Python 표준 라이브러리의 함수 구현이 네이티브 코드로 되어 있고, 각각 최적화되어 있다고 기대함. 기사의 결론이 네이티브 코드의 작동 방식과 관련이 있다는 것에 놀라지 않았으며, 특정 답변에는 놀랐지만 혼란스러운 시작에도 불구하고 매우 흥미로운 기사였음을 인정함.

  • CPU 기능 플래그에 대한 토론

    두 개의 전용 CPU 기능 플래그가 있어서 REP STOS/MOV 명령어가 memset/memcpy를 위한 짧은 명령어 시퀀스로서 빠르고 사용 가능함을 나타냄. 새로운 CPU 세대마다 최적화된 루틴을 수작업으로 만드는 것은 수십 년간 지속된 고통임. 이제는 CPU 제조업체의 타이밍 테스트 스위트의 일부가 되어야 하지 않을까 하는 의문을 제기함.

  • 관련 glibc 버그 링크

    Zen 4와 관련된 glibc 버그에 대한 링크를 제공함.

  • 기사에 대한 긍정적인 반응

    한 사용자는 기사를 읽고 std::fs의 잘못된 사용에 대해 비웃을 준비를 했지만, 기사가 토끼굴과 미스터리의 연속이라며 잘 쓰여졌고 매우 흥미롭다고 평가함.

  • 기사에 대한 높은 평가

    다른 사용자는 이 기사가 이번 주에 읽은 것 중 가장 흥미로운 기사라고 평가하며, 글이 훌륭하게 작성되었다고 칭찬함.

  • 문제 해결을 위한 제안

    명백한 해결책으로, "copy_user_generic" 커널 메소드를 변경하여 CPU가 문제가 있는 것으로 감지되고 메모리 정렬이 느림 버그를 유발하는 경우 다른 메모리 복사 구현을 사용하도록 패치를 보내는 것을 제안함.

  • Rust의 기본 할당자에 대한 정보

    Rust의 기본 할당자가 2018년까지 jemalloc이었다는 정보와 관련 링크를 제공함.

  • 성능 향상을 위한 Rust 개발자의 고려 사항

    Rust 개발자들이 jemallocator로 전환하여 성능을 향상시키는 것을 고려해야 하는지, 이것이 모든 사람이 성능을 무료로 얻을 수 있는 방법인지, C 코드베이스도 이로부터 이득을 볼 수 있는지, 현재 테이블 위에 남겨진 성능인지에 대한 궁금증을 표현함.

  • AMD와 Intel의 CPU 차이에 대한 설명

    AMD의 문자열 저장 방식이 Intel과 다르며, CPU의 L2 크기를 넘어서기 전까지는 사용하지 않는 것이 좋다고 설명함. 그 지점을 넘어서면 문자열 저장을 사용하는 것이 이득이며 "DRAM 속도"로 실행되어야 하지만, 높은 시작 비용이 있기 때문에 해당 임계값에 도달할 때까지는 256비트 벡터 로드/스토어를 사용해야 함을 언급함.

  • 기사를 적절한 사람들에게 전달한 사실

    한 사용자가 이 기사를 적절한 사람들에게 전달했다고 밝힘.