신운섭 고려대 박사과정생, 언어학 이론과 데이터로 인공지능 블랙박스 문제 분석
신운섭 고려대 박사과정생, 언어학 이론과 데이터로 인공지능 블랙박스 문제 분석
  • 복현명
  • 승인 2023.02.06 10:32
  • 댓글 0
이 기사를 공유합니다

송상헌(오른쪽) 고려대학교 언어학과 교수와 신운섭 박사과정생. 사진=고려대.
송상헌(오른쪽) 고려대학교 언어학과 교수와 신운섭 박사과정생. 사진=고려대.

[스마트경제=복현명 기자] 신운섭 고려대학교 언어학과 박사과정생이 언어학 이론과 데이터를 활용해 인공지능의 신뢰성을 떨어뜨리는 ‘블랙박스(Blackbox) 문제’를 분석한 연구 결과를 발표했다.

해당 연구 결과는 심리학 분야 최대 인용 국제전문학술지 ‘프론티어즈 인 사이콜로지(Frontiers in Psychology)’에 1월 27일 오후 4시(한국시간 기준) 온라인 판에 게재됐다.

최근 심층학습(Deep learning) 기반의 인공지능이 사람과 쉽게 구별하기 어려운 성능을 보여줌에 따라 인공지능이 정말로 사람처럼 언어 구조를 이해하는지 인문학적 질문이 제기돼왔다.

예를 들어 오픈 에이아이(OpenAI)가 공개한 인공지능 ‘ChatGPT’는 인간을 대신하여 연설문·신문기사를 매우 그럴듯하게 작성할 수 있지만 종종 질문의 의도를 벗어난 틀린 답변을 반복하는 오류가 있다. 그러나 인공지능의 내부 작동 방식을 알 수 없다는 구조적 한계로 인해 인공지능에게 다양한 입력값을 제시하고 출력값을 체계적으로 평가하는 것이 중요하다.

자연어(natural language)의 분포는 선형적인 특성과 언어 고유의 구조적인 특성을 모두 갖는다. 

선형적인 특성은 어떤 단어의 사용이 이전 시점의 단어 사용과 관련이 있다는 매우 일반적인 특성이다. 반면 언어 고유의 구조적인 특성은 체계적인 규칙에 근거하는 단어 사용을 말하며 선형적 특성과 구별되는 장거리 의존 관계(long-distance dependency)가 중요하다.

인공지능의 뛰어난 성능이 우연에 의한 것인지, 또는 자연어를 이해하기 때문인지 탐구하려면 인공지능이 언어 고유의 규칙에 따라 사고하는지 판별할 수 있는 입력값을 제시하는 것이 필요하다.

연구진은 영어의 규칙적 현상인 ‘부정극어 인허’를 장거리 의존 관계로 가공하여 인공지능의 입력값으로 제시했다. 분석에 사용된 인공지능인 양방향 트랜스포머 인코더 모형(Bidirectional Encoder Representations from Transformers, BERT)은 언어 규칙을 위반하는 부정극어 인허를 인간과 유사한 수준으로 매우 정확하게 포착하는 것으로 나타났다.

특히 인간의 인지 기제(cognitive mechanism)와 깊은 연관이 있는 문법적 착시(grammatical illusion) 현상을 확장해 BERT가 인간처럼 문장 처리 오류를 보이는지 분석했다. 

분석 결과 BERT는 인간처럼 문법적 착시를 보인다는 점에서 인간의 인지 기제를 모방할 수 있는 잠재력이 있음을 알 수 있었다. 다만 단어 사용에서 명시적으로 나타나지 않는 함축(implicature)적인 부정어 표현은 어려워했다.

지도교수인 송상헌 고려대 언어학과 교수는 “인문학을 전공한 순수 국내파 대학원생이 해외 유명 저널에 제1저자로 게재하는 것은 흔치 않은 일”이라며 “국내에서 연구한 성과가 해외에서 인정받아 더욱 의미가 있다”고 말했다.

한편 이번 연구는 한국연구재단이 추진하는 4단계 BK21 언어학교육연구팀의 지원으로 수행됐다.

 

복현명 기자 hmbok@dailysmart.co.kr


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.