- Grok-2와 Grok-2 mini 모델을 X 플랫폼의 Grok 사용자들에게 릴리스함
- Grok-2는 이전 모델인 Grok-1.5에서 크게 발전된 채팅, 코딩, 추론 능력을 갖추고 있음
-
sus-column-r
이라는 이름으로 LMSYS 리더보드에서 테스트된 Grok-2 초기 버전은 Claude 3.5 Sonnet과 GPT-4-Turbo보다 우수한 성능을 보임
Grok-2 언어 모델 과 채팅 기능
- Grok-2의 초기 버전을 sus-column-r이라는 이름으로 LMSYS 챗봇 아레나(유명한 LLM 경쟁 벤치마크 도구)에 제출함
- 모델의 전반적인 Elo 점수 면에서 Claude와 GPT-4를 능가함
벤치마크
- Grok-2 모델을 추론, 독해, 수학, 과학, 코딩 등 일련의 학술 벤치마크에서 평가했음
- Grok-2와 Grok-2 mini는 이전 Grok-1.5 모델에 비해 상당한 개선을 보임
- 대학원 수준의 과학 지식(GPQA), 일반 지식(MMLU, MMLU-Pro), 수학 경시 문제(MATH) 등의 영역에서 다른 최첨단 모델과 경쟁력 있는 성능을 달성함
- Grok-2는 시각적 수학 추론(MathVista)과 문서 기반 질의응답(DocVQA)에서 최첨단 성능을 보임
X에서 실시간 정보로 Grok 경험해보기
- X 플랫폼에서 Grok을 지속적으로 개선해 왔음
- X Premium 및 Premium+ 사용자는 Grok-2와 Grok-2 mini라는 두 가지 새로운 모델에 액세스할 수 있음
- Grok-2는 X 앱의 Grok 탭을 통해 접근 가능하며, 텍스트와 비전 이해 모두에서 고급 기능을 갖춘 최첨단 AI 어시스턴트임
- Grok-2 mini는 속도와 답변 품질 사이의 균형을 제공하는 작지만 유능한 모델
- Black Forest Labs와 협력하여 FLUX.1 모델을 실험하고 X에서 Grok의 기능을 확장하고 있음
Enterprise API를 사용하여 Grok으로 구축하기
- 이번 달 말 새로운 엔터프라이즈 API 플랫폼을 통해 개발자에게 Grok-2와 Grok-2 mini를 출시할 예정
- 새로운 API는 전 세계에 걸쳐 짧은 지연 시간으로 액세스할 수 있는 다중 지역 추론 배포를 허용하는 새로운 맞춤형 기술 스택을 기반으로 구축됨
- 필수 다중 요소 인증, 풍부한 트래픽 통계, 고급 청구 분석 등 향상된 보안 기능을 제공함
- 기존 내부 도구 및 서비스에 팀, 사용자, 청구 관리를 통합할 수 있는 관리 API를 제공함
What is Next?
- Grok-2와 Grok-2 mini가 X에서 출시되고 있음
- Grok이 제공하는 향상된 검색 기능, X 게시물에 대한 심층적 통찰력, 개선된 회신 기능 등 다양한 AI 기반 기능에 대해 매우 기대하고 있음
- 곧 X와 API에서 Grok 경험의 핵심 부분으로 멀티모달 이해에 대한 프리뷰를 공개할 예정
- 2023년 11월 Grok-1 발표 이후 X.AI는 작지만 인재 밀도가 가장 높은 팀의 주도로 엄청난 속도로 움직이고 있음
- Grok-2를 도입하여 AI 개발의 최전선에 서게 됨
- 새로운 컴퓨팅 클러스터로 핵심 추론 능력을 발전시키는 데 중점을 두고 있음
- 앞으로 몇 달 동안 훨씬 더 많은 개발 사항을 공유할 예정
- "인류의 미래를 위한 가장 영향력 있는 혁신을 구축하는 데 전념하는 작고 집중된 팀에 합류할 개인을 찾고 있음"