문제는.. 이 실험은 LLM이 요약한게 아니고 요약된 것을 판단한 것이라..
써보면 GPT-4 가 요약 성능은 확실히 훌륭하더라고요. 한국어 번역도 문제고요.
GN⁺ 비용때문에 혹했는데.. 아직은 그냥 gpt-4 를 써야할듯 하네요.