데이터 레이블링(Labeled corpus) 개인정보 탐지 및 마스킹 모델 개발을 위한 학습데이터 구축
고객사
산업분류
데이터량
가공난이도
통신사
원문 기준 500건
중
담당자
남보름
고객사의 고민
다양한 종류의 개인정보를 탐지하고 이를 마스킹하기 위한 모델 개발이 목표인 프로젝트였습니다. 개인정보에도 종류가 많은데 무엇을, 어떤 조건일 때 개인정보로 탐지할 것인지 확인하는 과정이 필수적이었습니다.
TEXTNET의 솔루션
TEXTNET은 예시와 가이드를 작성해 고객사와 소통함으로써 이해도를 맞춰나갔습니다. 이 과정에서 정부의 개인정보 가이드를 참고하여 작업했습니다.
TEXTNET은...
국문학, 언어학, 심리학 석·박사를 포함한 전문 인력으로 구성된 언어전문가 그룹으로서, 고객사의 니즈에 부합하는 텍스트 데이터를 설계·가공·구축하고 내부 R&D를 통해 설계 방식을 지속적으로 개선하여 최적의 설계 방법을 제안합니다. 프로젝트 목적에 따라 적합한 숙련 작업자를 선별하여 투입하고, 체계적이고 효율적으로 고품질의 학습데이터를 생산합니다.
개인정보 탐지 및 마스킹 모델 개발을 위한 학습데이터 구축
다양한 종류의 개인정보를 탐지하고 이를 마스킹하기 위한 모델 개발이 목표인 프로젝트였습니다. 개인정보에도 종류가 많은데 무엇을, 어떤 조건일 때 개인정보로 탐지할 것인지 확인하는 과정이 필수적이었습니다.
TEXTNET은 예시와 가이드를 작성해 고객사와 소통함으로써 이해도를 맞춰나갔습니다. 이 과정에서 정부의 개인정보 가이드를 참고하여 작업했습니다.
국문학, 언어학, 심리학 석·박사를 포함한 전문 인력으로 구성된 언어전문가 그룹으로서,
고객사의 니즈에 부합하는 텍스트 데이터를 설계·가공·구축하고
내부 R&D를 통해 설계 방식을 지속적으로 개선하여 최적의 설계 방법을 제안합니다.
프로젝트 목적에 따라 적합한 숙련 작업자를 선별하여 투입하고,
체계적이고 효율적으로 고품질의 학습데이터를 생산합니다.
>> 서비스 문의하러 가기