챗봇 발화 스타일 및 구조 고도화 목적 내부 작업기

TEXTNET
2022-05-31
조회수 158








멀티턴 대화 데이터 구축
챗봇 발화 스타일 및 구조 고도화 목적 내부 작업기



고객사




산업분류데이터량가공난이도
내부 프로젝트2,560set





담당자






강민선, 현은진





고객사의 고민

챗봇 발화의 스타일과 구조를 고도화 하기 위한 일상 및 목적 대화 데이터를 수집하는 프로젝트를 TEXTNET 내부적으로 진행했습니다. 인위적인 느낌이 들지 않도록 말투, 이모지, 초성 표현, 오탈자 등 캐릭터의 스타일을 최대한 살린 데이터가 구축될 수 있도록 진행했으며, 다양한 대화 목적과 주제, 상황, 상대에 따른 대화문을 구축했습니다. 또한 1인 2역의 대화문도 구축해 보았습니다. 


TEXTNET의 솔루션

TEXTNET은 발화문의 길이, 문장 수, 존대 유무, 비속어, 오타 등의 제한을 두지 않고 일상 대화와 전문 대화를 분리해 300여 개의 대화 주제를 바탕으로 친밀한 사이, 낯선 사이, 거리가 있는 사이 중 선택해 자유롭게 작업을 진행했습니다. 




TEXTNET은...

국문학, 언어학, 심리학 석·박사를 포함한 전문 인력으로 구성된 언어전문가 그룹으로서, 
고객사의 니즈에 부합하는 텍스트 데이터를 설계·가공·구축하고
내부 R&D를 통해 설계 방식을 지속적으로 개선하여 최적의 설계 방법을 제안합니다.
프로젝트 목적에 따라 적합한 숙련된 크루를 선별하여 투입하고,
체계적이고 효율적으로 고품질의 학습데이터를 생산합니다.


>> 서비스 문의하러 가기


사업자명. 주식회사 스피링크 | 대표자명. 고경민

Tel. 02-477-3666 | E-mail. cs@textnet.kr

Addr. 서울시 용산구 한강대로 366 트윈시티 남산 오피스동 패스트파이브 서울역점 807호, 812호

Biz License. 827-86-00073