혐오 표현을 우선적으로 찾아내고, 나머지 유해 데이터 항목들을 순서도에 맞게 분류하는 모델에 필요한 학습 데이터를 구축하는 작업이었습니다. 때문에 혐오 표현을 1순위로 태깅 할 필요가 있었고, 기타 비속어와 성적 표현은 기타로 태깅 하는 등 기준이 명확히 필요한 작업이었습니다.
TEXTNET의 솔루션
TEXTNET은 고객사와 협의를 통해 기준을 명확히 한 후 작업을 진행했고, 이를 통해 고객의 요구에 맞는 데이터를 구축할 수 있었습니다.
TEXTNET은...
국문학, 언어학, 심리학 석·박사를 포함한 전문 인력으로 구성된 언어전문가 그룹으로서, 고객사의 니즈에 부합하는 텍스트 데이터를 설계·가공·구축하고 내부 R&D를 통해 설계 방식을 지속적으로 개선하여 최적의 설계 방법을 제안합니다. 프로젝트 목적에 따라 적합한 숙련 작업자를 선별하여 투입하고, 체계적이고 효율적으로 고품질의 학습데이터를 생산합니다.
유해 데이터 태깅
혐오 표현 및 기타 비속어, 성적 표현 태깅
혐오 표현을 우선적으로 찾아내고, 나머지 유해 데이터 항목들을 순서도에 맞게 분류하는 모델에 필요한 학습 데이터를 구축하는 작업이었습니다. 때문에 혐오 표현을 1순위로 태깅 할 필요가 있었고, 기타 비속어와 성적 표현은 기타로 태깅 하는 등 기준이 명확히 필요한 작업이었습니다.
TEXTNET은 고객사와 협의를 통해 기준을 명확히 한 후 작업을 진행했고, 이를 통해 고객의 요구에 맞는 데이터를 구축할 수 있었습니다.
국문학, 언어학, 심리학 석·박사를 포함한 전문 인력으로 구성된 언어전문가 그룹으로서,
고객사의 니즈에 부합하는 텍스트 데이터를 설계·가공·구축하고
내부 R&D를 통해 설계 방식을 지속적으로 개선하여 최적의 설계 방법을 제안합니다.
프로젝트 목적에 따라 적합한 숙련 작업자를 선별하여 투입하고,
체계적이고 효율적으로 고품질의 학습데이터를 생산합니다.
>> 서비스 문의하러 가기