대기업, 금융기관, 공공기관 등 국내 AI 선도 고객사와 함께한 레퍼런스를 소개합니다.

비윤리적 표현 유도 및 대응 발화 패턴 데이터 구축

조회수 451




연구, 데이터 분류
비윤리적 표현 유도 및 대응 발화 패턴 데이터 구축



고객사


산업분류가공난이도
IT/공학




담당자



남보름, 강지윤, 김성연, 박항아, 김새롬




  • TEXTNET은 A사와 함께 비윤리적 표현의 구체적인 기준을 수립하고 이를 판별하는 모델을 테스트 할 수 있는 데이터를 구축했습니다. 

    • 흔히 혐오 표현이라고 하면 비속어나 소수자에 대한 차별적 표현, 편향적인 표현만 해당된다고 생각하기 쉬운데, 그 외에도 타인에게 위해를 주는 표현까지 범위를 넓히면 아직 AI가 제대로 판별하지 못하는 비윤리적 표현들이 많습니다.

    • 단순히 문자 그대로 혐오 표현임을 알 수 있는 키워드 이상의 것들도 감지해낼 수 있어야 하는 것이죠. 특히 한국어의 경우 발화의 맥락을 파악해야만 구분이 가능한 경우가 대부분입니다.

  • TEXTNET은 인터넷상의 커뮤니티 게시판, 뉴스 댓글 등을 참고하여 비윤리적 표현을 리서치해 600여개의 예문을 수집했습니다. 

  • 그리고 선행연구를 바탕으로 비윤리적 표현에 대한 더 고도화된 기준을 수립하여 제안했습니다. 

    • 영미권의 연구 사례라 한국어에 그대로 반영하기에는 다소 어려움이 있었습니다. 비윤리적 표현 범주 중 그대로 적용하기 어려운 범주를 보완하고, 한국어의 특성을 반영하여 범주를 신설하기도 했습니다. 

  • 이어 사용자가 윤리적으로 문제가 되는 발언을 유도하는 발화를 했을 때의 패턴과 더불어 비윤리적인 발화에 대한 AI의 반응에 대해서도 유형화 하였습니다.


고객사의 평가

" 프로젝트에 대한 깊은 고민이 느껴지는 결과물이었어요. 저희가 생각하지 못한 관점을 제안해 주신 것이 도움이 많이 됐고요. 특히 비윤리적인 표현을 다양하게 수집해야 했는데 저희가 생각한 것보다 더욱 다양한, 예상하지 못한 표현들을 모아오셔서 많이 놀라기도 했습니다. " - A사 담당자 OOO님





TEXTNET은...

국문학, 언어학, 심리학 석·박사를 포함한 전문 인력으로 구성된 언어전문가 그룹으로서, 
고객사의 니즈에 부합하는 텍스트 데이터를 설계·가공·구축하고
내부 R&D를 통해 설계 방식을 지속적으로 개선하여 최적의 설계 방법을 제안합니다.
프로젝트 목적에 따라 적합한 숙련 작업자를 선별하여 투입하고,
체계적이고 효율적으로 고품질의 학습데이터를 생산합니다.


>> 서비스 문의하러 가기


사업자명. 주식회사 스피링크 | 대표자명. 고경민

E-mail. cs@textnet.kr

Addr. 서울시 용산구 한강대로 366 트윈시티 남산 오피스동 패스트파이브 서울역점 807호, 812호

Biz License. 827-86-00073