언어 전문가 그룹으로서 한국어 언어 처리와 이해에 대한 독보적인 역량을 바탕으로 한국어 언어 모델의 성능을 정확하게 평가하는 데이터셋을 구축합니다. 다양한 스펙의 모델을 아우르는 신뢰성과 대표성을 지닌 벤치마크 데이터셋으로 인공지능 산업 및 학계에 기여합니다.
readiness_score
평가 지표 기획
도메인, End-user, 서비스 목적 및 형태 등 다양한 관점에서 모델을 평가하는 지표를 마련합니다. 고객의 니즈와 기호를 구조화하여 단어, 문장, 전체 맥락 단위에서 평가할 수 있도록 세밀하게 설계하며, 평가 후 적절한 개선 활동으로 이어지는 직관적인 지표를 지향합니다.