▲xguru 2023-04-03 | parent | favorite | on: Llama.cpp 의 모델 가중치 로딩 속도를 10~100배 개선(github.com/ggerganov)LLaMA - Meta가 공개한 65b 파라미터 LLM llama.cpp - 페이스북의 LLaMA 모델을 순수 C/C++로 추론하기
LLaMA - Meta가 공개한 65b 파라미터 LLM
llama.cpp - 페이스북의 LLaMA 모델을 순수 C/C++로 추론하기