대기업, 금융기관, 공공기관 등 국내 AI 선도 고객사와 함께한 레퍼런스를 소개합니다.

맥락을 이해하는 페르소나 대화 데이터 구축

조회수 65






페르소나 설계, 멀티턴 대화 데이터 구축
맥락을 이해하는 페르소나 대화 데이터 구축


고객사


산업분류가공난이도
IT/공학




담당자



이유, 김지원, 김보배, 김다혜





고객사의 고민

설정된 페르소나 안에서 대화의 맥락을 이해하면서 적절한 답변이 나올 수 있는 대화 데이터와 더불어 페르소나를 부정하는 발화 데이터를 구축했습니다. 최대한 자연스러우면서도 풍부한 표현력을 데이터에 담아야 하는 프로젝트였습니다. 


TEXTNET의 솔루션

  • 다양한 페르소나 구성을 위해 우선 대분류를 설계하고 분류별 키워드를 수집하여 중복을 피했습니다.

  • 단조로운 대화 패턴을 방지하기 위해 대화 시작 메시지를 다양하게 수집해 데이터를 구축하는 크루에게 사전에 공유함으로써 데이터의 다양성을 확보했습니다.

  • 자연스러운 대화 진행을 위해 대화 내 갑작스러운 화제 전환 메시지를 최소화했습니다.

  • 페르소나를 부정하는 발화 데이터의 경우 부정 발화의 패턴을 규명하고 크루에게 공유하여 특정 유형에만 너무 치우치지 않도록 관리 감독했습니다.

  • 대화 데이터의 경우 사용자의 질문에 따라 대화의 양상이 달라지기 때문에 질문 발화에 대한 연구를 진행하고 이를 데이터에 반영하였습니다.




TEXTNET은...

국문학, 언어학, 심리학 석·박사를 포함한 전문 인력으로 구성된 언어전문가 그룹으로서, 
고객사의 니즈에 부합하는 텍스트 데이터를 설계·가공·구축하고
내부 R&D를 통해 설계 방식을 지속적으로 개선하여 최적의 설계 방법을 제안합니다.
프로젝트 목적에 따라 적합한 숙련 작업자를 선별하여 투입하고,
체계적이고 효율적으로 고품질의 학습데이터를 생산합니다.


>> 서비스 문의하러 가기


사업자명. 주식회사 스피링크 | 대표자명. 고경민

E-mail. cs@textnet.kr

Addr. 서울시 용산구 한강대로 366 트윈시티 남산 오피스동 패스트파이브 서울역점 807호, 812호

Biz License. 827-86-00073