▲neo 6달전 | parent | favorite | on: GN⁺: 빠른 역제곱근 알고리즘에 대한 모든 지식(github.com/francisrstokes)Hacker News 의견 SSE 명령어 지원: 1999년 이후에 제작된 컴퓨터는 SSE 명령어 세트를 지원하며, _mm_rsqrt_ps 명령어를 통해 빠르게 역제곱근을 계산할 수 있음. 현대 하드웨어의 발전: 현대 하드웨어에서는 역제곱근 계산이 CPU에서 빠르게 이루어질 수 있으며, GPU로 모든 부동 소수점 연산을 오프로드하는 것은 오해임. MMIX 구현: MMIX 언어로 역제곱근 계산을 구현한 예시 코드가 있음. 이 코드는 원래 숫자가 2^-1021보다 크다는 가정을 함. 공식의 오타: 부동 소수점 공식에 오타가 있음. (-1)^S로 수정해야 함. 로그의 해석: 원시 비트 패턴을 해석하는 것은 로그의 조각별 선형 근사치가 아님. 데이터 포인트 사이의 선은 실제로 존재하지 않음. 위키백과 참고: 이 함수와 그 역사에 대한 좋은 논의가 위키백과에 있음. 위키백과 링크 GitHub 코드 모음: 관련된 몇 가지 코드를 GitHub에 모아둠. GitHub 링크 StackOverflow 참고: 최적화된 저정밀도 근사치에 대한 StackOverflow 질문도 참고할 만함. StackOverflow 링크 3D 엔진 최적화 경험: Quake 이전에 3D 엔진을 구축하며 최적화 경험을 쌓았고, 알고리즘 최적화가 항상 승리함. 유튜브 비디오 추천: 이 주제에 대한 흥미로운 비디오가 있음. 유튜브 링크 생산성 시간 도둑: 이 주제에 빠져들어 생산적인 시간을 많이 빼앗김. 최적의 마법 숫자: 유명한 코드 스니펫의 마법 숫자가 최적의 상수가 아님. 더 나은 상수를 찾는 것이 가능하며, Jupyter 노트북을 통해 최적의 마법 숫자를 찾을 수 있음.
Hacker News 의견
SSE 명령어 지원: 1999년 이후에 제작된 컴퓨터는 SSE 명령어 세트를 지원하며, _mm_rsqrt_ps 명령어를 통해 빠르게 역제곱근을 계산할 수 있음.
현대 하드웨어의 발전: 현대 하드웨어에서는 역제곱근 계산이 CPU에서 빠르게 이루어질 수 있으며, GPU로 모든 부동 소수점 연산을 오프로드하는 것은 오해임.
MMIX 구현: MMIX 언어로 역제곱근 계산을 구현한 예시 코드가 있음. 이 코드는 원래 숫자가 2^-1021보다 크다는 가정을 함.
공식의 오타: 부동 소수점 공식에 오타가 있음. (-1)^S로 수정해야 함.
로그의 해석: 원시 비트 패턴을 해석하는 것은 로그의 조각별 선형 근사치가 아님. 데이터 포인트 사이의 선은 실제로 존재하지 않음.
위키백과 참고: 이 함수와 그 역사에 대한 좋은 논의가 위키백과에 있음. 위키백과 링크
GitHub 코드 모음: 관련된 몇 가지 코드를 GitHub에 모아둠. GitHub 링크
StackOverflow 참고: 최적화된 저정밀도 근사치에 대한 StackOverflow 질문도 참고할 만함. StackOverflow 링크
3D 엔진 최적화 경험: Quake 이전에 3D 엔진을 구축하며 최적화 경험을 쌓았고, 알고리즘 최적화가 항상 승리함.
유튜브 비디오 추천: 이 주제에 대한 흥미로운 비디오가 있음. 유튜브 링크
생산성 시간 도둑: 이 주제에 빠져들어 생산적인 시간을 많이 빼앗김.
최적의 마법 숫자: 유명한 코드 스니펫의 마법 숫자가 최적의 상수가 아님. 더 나은 상수를 찾는 것이 가능하며, Jupyter 노트북을 통해 최적의 마법 숫자를 찾을 수 있음.