주간 AI 트렌드는 TEXTNET 구성원들이 한 주간 인사이트를 얻은 AI 관련 정보나 분야 트렌드를 스크랩해 나누는 글입니다. 제목을 누르시면 자세한 내용을 보실 수 있습니다. 관련하여 의견이 있으시거나 전하시고 싶은 소식이 있으시면 nanhee@textnet.kr로 알려주세요! 여러분의 메일을 기다립니다.
○ 최근 공개된 GPT-4의 한국어 성능, 어떠셨나요? GPT-4 테크니컬 리포트에 따르면 GPT-4의 한국어 성능은 이전 버전인 GPT-3.5의 영어 성능을 넘어선 수준이라고 합니다. 일각에서는 ‘LLM이 언어의 한계를 극복했다’, ‘언어 특화 모델은 더 이상 의미가 없다’는 이야기도 나옵니다. 기본적으로 영어권 AI 모델인 GPT-4는 토큰화 과정부터 영어 이용자에게 경제적인 방향으로 설계되어 있죠. 실제로 같은 단어를 한국어로 썼을 경우에는 6배까지도 비용이 늘어난다고 합니다. 처리 속도와 성능 차이도 발생합니다. 하지만 글로벌 빅테크 기업 입장에서는 개발 비용을 감수하며 메이저 언어인 영어 외 다른 언어를 다룰 이유가 없습니다.
○ 그러나 많은 석학들이 오랜 시간에 걸쳐 이야기했듯 언어는 사고방식과 밀접한 관련이 있습니다. GPT-4의 출력은 기본적으로 영어권 사용자의 사고방식을 반영한 결과입니다. 한국어 사용자의 사고방식을 바탕으로 한국 정서와 문화에 맞는 내용을 더 정확히 구사하게 하려면 이를 이해할 수 있는 AI 모델이 필요합니다.
○ 며칠 전 지인의 페이스북 글에서 이런 내용을 읽었습니다. 공공서비스의 안내 문구가 어색하고 성의없게 느껴진다며 ‘ChatGPT를 돌린 것 같다’고 표현했더라고요. 한국어 특화 모델이 필요한 영역은 바로 이런 영역이 아닐까 합니다. 단순하게 바른 문장 생성과 자연스러운 대화가 목표가 아닙니다. 서비스 목적에 따라, 이용자가 누구냐에 따라 AI 서비스 활용 양상은 천차만별이기 때문입니다. 심리 상담 목적의 AI라면, 시니어가 주 이용자인 AI 서비스라면, 친밀감과 몰입감이 중요한 AI 서비스라면 미묘한 차이를 감지하고 뉘앙스를 구현할 수 있는, 더 뛰어난 언어 능력이 요구될 것입니다.
◎ 이 주의 소식
- 구글, 최첨단 언어모델 ‘팜’ 으로 AI 챗봇 ‘바드’ 업그레이드
- 슈퍼컴 필요없는 소형 언어모델 'sLLM' 급부상
- 구글, 검색에 AI 챗봇 기능 추가 공식 선언
- 김유원 네이버클라우드 대표 "네이버 서비스 곳곳에 'AI 대화창' 붙인다"
- AI로 악플잡는 네이버·카카오, 남은 과제는?
- AI 주도권 내줬다고? '구글제국' 역습나선다
- 메타 CTO "생성형 AI 연내 상용화…광고영상 등에 도입"
- 'AI주권' 지킬 국가는 소수 … 네이버, 비영어권서 승부
- [Google 한국 블로그] 바드에 대하여: 시작 단계의 생성형 AI 실험
- 세계 AI논문 40%는 중국···민간투자 10년만에 감소
○ 최근 공개된 GPT-4의 한국어 성능, 어떠셨나요? GPT-4 테크니컬 리포트에 따르면 GPT-4의 한국어 성능은 이전 버전인 GPT-3.5의 영어 성능을 넘어선 수준이라고 합니다. 일각에서는 ‘LLM이 언어의 한계를 극복했다’, ‘언어 특화 모델은 더 이상 의미가 없다’는 이야기도 나옵니다. 기본적으로 영어권 AI 모델인 GPT-4는 토큰화 과정부터 영어 이용자에게 경제적인 방향으로 설계되어 있죠. 실제로 같은 단어를 한국어로 썼을 경우에는 6배까지도 비용이 늘어난다고 합니다. 처리 속도와 성능 차이도 발생합니다. 하지만 글로벌 빅테크 기업 입장에서는 개발 비용을 감수하며 메이저 언어인 영어 외 다른 언어를 다룰 이유가 없습니다.
○ 그러나 많은 석학들이 오랜 시간에 걸쳐 이야기했듯 언어는 사고방식과 밀접한 관련이 있습니다. GPT-4의 출력은 기본적으로 영어권 사용자의 사고방식을 반영한 결과입니다. 한국어 사용자의 사고방식을 바탕으로 한국 정서와 문화에 맞는 내용을 더 정확히 구사하게 하려면 이를 이해할 수 있는 AI 모델이 필요합니다.
○ 며칠 전 지인의 페이스북 글에서 이런 내용을 읽었습니다. 공공서비스의 안내 문구가 어색하고 성의없게 느껴진다며 ‘ChatGPT를 돌린 것 같다’고 표현했더라고요. 한국어 특화 모델이 필요한 영역은 바로 이런 영역이 아닐까 합니다. 단순하게 바른 문장 생성과 자연스러운 대화가 목표가 아닙니다. 서비스 목적에 따라, 이용자가 누구냐에 따라 AI 서비스 활용 양상은 천차만별이기 때문입니다. 심리 상담 목적의 AI라면, 시니어가 주 이용자인 AI 서비스라면, 친밀감과 몰입감이 중요한 AI 서비스라면 미묘한 차이를 감지하고 뉘앙스를 구현할 수 있는, 더 뛰어난 언어 능력이 요구될 것입니다.
◎ 이 주의 소식
- 구글, 최첨단 언어모델 ‘팜’ 으로 AI 챗봇 ‘바드’ 업그레이드
- 슈퍼컴 필요없는 소형 언어모델 'sLLM' 급부상
- 구글, 검색에 AI 챗봇 기능 추가 공식 선언
- 김유원 네이버클라우드 대표 "네이버 서비스 곳곳에 'AI 대화창' 붙인다"
- AI로 악플잡는 네이버·카카오, 남은 과제는?
- AI 주도권 내줬다고? '구글제국' 역습나선다
- 메타 CTO "생성형 AI 연내 상용화…광고영상 등에 도입"
- 'AI주권' 지킬 국가는 소수 … 네이버, 비영어권서 승부
- [Google 한국 블로그] 바드에 대하여: 시작 단계의 생성형 AI 실험
- 세계 AI논문 40%는 중국···민간투자 10년만에 감소