Hacker News 의견
  • 문서에 대한 훈련은 실제로 이루어지지 않으며, 많은 스타트업들이 이 용어를 사용하고 있지만 실제로는 RAG(Retrieval-Augmented Generation)를 사용함.

    • Llamaindex가 가장 좋은 옵션으로 여겨짐.
    • 문서에 대한 훈련을 주장하는 스타트업들 대부분이 실제로는 RAG를 사용함.
    • qLoRA를 사용하여 질문과 답변 쌍을 자동으로 생성하는 스크립트를 찾아보라고 권장함.
    • 개인 문서 지식베이스에 성공적으로 사용된 사례는 드물며, 주로 수학, 추론, 파이썬 등의 기술에 사용됨.
    • 문서 세트를 단순히 미세조정에 투입하는 것은 효과가 없음을 경험적으로 증명함.
  • 문서의 양에 따라 다른 접근 방식을 고려해야 함.

    • RAG는 작은 데이터셋에 잘 작동하며, Llamaindex가 이 분야에서 많은 엔지니어링을 수행함.
    • 미세조정과 RAG의 결합은 인터넷에서 쉽게 찾을 수 있는 지식을 가진 대규모 데이터셋에 효과적임.
    • 지속적인 사전 훈련은 매우 큰 데이터셋과 독점적인 지식을 가진 경우에 필요함.
  • AWS Bedrock는 사용하기 쉬우며, 문서를 S3에 업로드하고 벡터 데이터베이스에 동기화하여 API를 통해 사용할 수 있음.

    • Bedrock는 다양한 모델과 공통 API를 제공하는 제품임.
  • h2ogpt는 다양한 형식의 문서를 처리하고 다양한 모델 호스팅 구현을 지원하는 기능이 완비된 RAG 구현체임.

  • ChatGPT 계정을 구매하여 자신의 문서를 업로드할 수 있으며, 이를 통해 맞춤형 대화형 AI를 생성할 수 있음.

  • GPT4 Assistants는 현재 RAG를 기본적으로 처리할 수 있으며, PrivateGPT는 이를 위한 잘 알려진 옵션 중 하나임.

  • Microsoft Office의 Copilot Builder는 사용자가 기본 URL, 업로드된 파일 등을 지정하여 몇 초 만에 AI Copilot을 생성할 수 있게 해줌.

  • Cheshire Cat은 문서를 "기억"으로 저장하여 나중에 검색할 수 있는 AI 보조 프레임워크임.

  • Mistral 7B를 QLoRA로 미세조정하는 방법에 대한 비디오 가이드가 있으며, RAG 기술이 더 바람직할 수 있음을 언급함.