AI에 인간의 사고 방식을 이식하려면 - 주간 AI 트렌드 #37 (2023.2.6.~ 2.10.)

2023-02-14
조회수 189

주간 AI 트렌드는 TEXTNET 구성원들이 한 주간 인사이트를 얻은 AI 관련 정보나 분야 트렌드를 스크랩해 나누는 글입니다. 제목을 누르시면 자세한 내용을 보실 수 있습니다. 관련하여 의견이 있으시거나 전하시고 싶은 소식이 있으시면 nanhee@textnet.kr로 알려주세요! 여러분의 메일을 기다립니다.


○ ChatGPT 열풍 속에서 ChatGPT의 작동 원리, 학습 방법도 주목받고 있습니다. RLHF(Reinforcement Learning with Human Feedback)이 주로 언급되는 키워드인데요. 먼저 대규모 파라미터로 대량의 코퍼스를 학습시킨 GPT 3와 같은 기초모델에서 질문과 모범 답안을 추출하여 학습시킵니다. 여기에 사람의 피드백을 반영한 보상 모델을 학습시킨 뒤 이를 강화학습 알고리즘을 통해 최적화하는 방식을 말합니다.


○ 언어 모델은 수많은 데이터를 고려했을 때 ‘확률적으로 올바른 대답’을 예측하는 데 집중합니다. 그 대답이 진실인지, 사용자에게 정말 유용한 내용인지는 또 다른 문제입니다. RLHF는 여기에 직접적인 지표인 ‘사람의 피드백’을 반영하여 모델이 더 나은 결과를 내놓을 수 있도록 보정하는 방법입니다. 실제로 ChatGPT는 RLHF를 통해 유해하거나 거짓이거나, 편향된 출력을 최소화할 수 있었습니다.


○ RLHF는 AI 기술 진보의 영역에 아직도 인간의 역할이 크다는 사실을 증명하지만, 동시에 인간이 개입하기 때문에 편향이 발생할 수 있다는 한계 또한 갖습니다. 경제성을 고려하면 무작정 모델의 규모를 늘리는 것은 더 이상 왕도가 아닙니다. 데이터는 물론 모델 구축과 성능 평가에 있어 ‘인간의 사고방식’을 어떻게 담아낼지 고민하고 적용할 필요가 있다는 것은 분명해 보입니다. 




◎ 이 주의 소식

- 텍스트 생성 AI 글로벌 시장, 6년 뒤 3배 이상 성장 전망

- MS, 신형 AI '프로메테우스' 검색 통합...'챗GPT' 업그레이드 버전

- 구글, 챗봇 '바드'와 검색 AI 기술 상세 공개...시장 반응은 'MS가 더 유리'

- MS, 챗GPT 도입 '오피스' 3월 출시

- MS, 메타버스 포기에 이어 VR 헤드셋 팀도 일부 정리

- AI 얻은 '빙 검색' 인기…이틀만에 100만명 대기

- 대화형 AI 검색엔진 경쟁 가열...美 이어 한·중·러 참전

- 카카오 "챗GPT, 기회이자 위기…연내 버티컬 서비스 출시"

- 쇼핑 돕는 'AI 챗봇'…e커머스 특화 모델로 진화

- [챗GPT 출시 2개월] ③ 챗GPT에 '바드'로 바로 맞불 놓는 구글..."최신 사건도 척척 답변"

- 카카오 AI 리더가 바라보는 챗GPT와 생성AI


사업자명. 주식회사 스피링크 | 대표자명. 고경민

E-mail. cs@textnet.kr

Addr. 서울시 중구 서소문로 89, 17층(순화동, 순화빌딩) 이든비즈 아트앤스튜디오 시청점 D-1707, D-1708  (우)04516

Biz License. 827-86-00073


Copyright 2015-2024. Spirink. All rights reserved.