의미적 유사성을 가진 동의어(구) 데이터
● 도메인 : 일상대화
● 구축 인원 : 밈 활용에 능숙한 2030대 남녀 (국문 관학 학위 소지자)
● 데이터 구조 : 기본 어휘 1개, 유사어(구) 3~5개, 선호 표현 2개가 한 세트로 구성된 어휘 리스트
● 메타 데이터 : 대화 목적, 대화 주제, 대화 상황, 대화 상대와의 관계, 품사 정보, 의미 유사도 스코어
● 데이터 상태 : 즉시 판매 가능
[데이터 소개]
대화의 목적, 주제, 상황 등 다양한 맥락적 요소에 따라 달라지는 어휘 선택 패턴을 체계화하여 AI 시스템이 보다 자연스럽고 상황에 적합한 언어 표현을 구사할 수 있도록 설계한 데이터셋으로, 문체 설계와 언어적 요소 고도화를 목표로 구축되었습니다. 실제 화자들이 특정 상황에서 선호하는 표현과 자주 사용하는 어휘 패턴을 포함하여 자연스럽고 현실적인 언어 사용 양상을 반영합니다.
이 데이터는 맥락 적응형 문체 생성, 텍스트 스타일 변환, 언어 교육 도구 개발 등 다양한 언어 모델 개선에 활용될 수 있습니다.
[데이터 특징]
각 어휘 세트는 구체적인 대화 상황에서 해당 맥락에 적합한 기본 어휘와 동의어, 유의어를 제시하며, 1~3점 척도의 의미 유사도 점수를 통해 미세한 뉘앙스 차이를 반영합니다. 또한 실제 화자들이 해당 상황에서 자주 사용하는 표현을 별도로 태깅하였고, 세종 태그셋에 기반한 품사 정보를 통해 문장 구조 내에서 자연스러운 어휘 대체 및 변형이 가능하도록 설계하였습니다.
[샘플 데이터]
▶ 샘플 데이터 보기
의미적 유사성을 가진 동의어(구) 데이터
● 도메인 : 일상대화
● 구축 인원 : 밈 활용에 능숙한 2030대 남녀 (국문 관학 학위 소지자)
● 데이터 구조 : 기본 어휘 1개, 유사어(구) 3~5개, 선호 표현 2개가 한 세트로 구성된 어휘 리스트
● 메타 데이터 : 대화 목적, 대화 주제, 대화 상황, 대화 상대와의 관계, 품사 정보, 의미 유사도 스코어
● 데이터 상태 : 즉시 판매 가능
[데이터 소개]
대화의 목적, 주제, 상황 등 다양한 맥락적 요소에 따라 달라지는 어휘 선택 패턴을 체계화하여 AI 시스템이 보다 자연스럽고 상황에 적합한 언어 표현을 구사할 수 있도록 설계한 데이터셋으로, 문체 설계와 언어적 요소 고도화를 목표로 구축되었습니다. 실제 화자들이 특정 상황에서 선호하는 표현과 자주 사용하는 어휘 패턴을 포함하여 자연스럽고 현실적인 언어 사용 양상을 반영합니다.
이 데이터는 맥락 적응형 문체 생성, 텍스트 스타일 변환, 언어 교육 도구 개발 등 다양한 언어 모델 개선에 활용될 수 있습니다.
[데이터 특징]
각 어휘 세트는 구체적인 대화 상황에서 해당 맥락에 적합한 기본 어휘와 동의어, 유의어를 제시하며, 1~3점 척도의 의미 유사도 점수를 통해 미세한 뉘앙스 차이를 반영합니다. 또한 실제 화자들이 해당 상황에서 자주 사용하는 표현을 별도로 태깅하였고, 세종 태그셋에 기반한 품사 정보를 통해 문장 구조 내에서 자연스러운 어휘 대체 및 변형이 가능하도록 설계하였습니다.
[샘플 데이터]
▶ 샘플 데이터 보기