Home / 주간한국
대화형 AI, 감정과 뉘앙스도 파악
잠재 의미 해석 실험서 인간과 비슷한 정확도 보여
- 박해련 인턴기자 (press3@koreatimes.net)
- Jul 02 2025 03:14 PM
사람들은 이메일이나 소셜미디어를 통해 글을 쓸 때 직접적으로 표현하지 않더라도 말 속에 숨은 의미나 정서를 담으며, 이러한 암묵적 의미가 독자에게 전해지기를 기대한다. 하지만 글을 읽는 상대가 사람이 아닌 인공지능, 특히 대화형 AI라면 상황은 달라진다. AI는 과연 이런 숨은 의미를 이해할 수 있는지, 그리고 그것이 인간에게 어떤 의미를 갖는지에 대한 의문이 제기되고 있다.
잠재 내용 분석(latent content analysis)은 텍스트에 내포된 정치적 성향, 감정의 강도, 풍자 등의 뉘앙스를 파악하는 연구 분야다. 이 분석은 정신건강 지원, 고객 서비스 향상, 공공 안전 확보 등 다양한 분야에서 중요한 역할을 한다. 사회과학, 정책, 비즈니스 영역에서도 활용 가능성이 크다. 대화형 AI의 기술 발전 속도가 빨라지면서 이들이 이러한 작업을 얼마나 해낼 수 있는지에 대한 검증이 이뤄지고 있다.
최근 학술지 사이언티픽 리포트(Scientific Reports)에 발표된 한 연구는 GPT‑4를 포함한 대화형 AI가 인간이 쓴 글에서 문맥을 얼마나 잘 읽어내는지를 실험했다. 이 연구는 GPT‑4, 제미니(Gemini), 라마‑3.1‑70B(Llama‑3.1‑70B), 믹스트랄 8×7B(Mixtral 8×7B) 등 7개의 대형 언어모델(Large Language Model)을 대상으로 정서, 정치 성향, 감정의 강도, 풍자 인식 능력을 종합적으로 평가했다. 실험에는 33명의 인간 평가자가 참여해 총 100개의 텍스트를 분석했다.
그 결과, 대부분의 모델이 인간과 비슷한 수준으로 문장 속 잠재 의미를 분석하는 것으로 나타났다. 특히 GPT‑4는 정치 성향 판단에서 인간보다 더 일관된 평가를 보여줬다. 이는 저널리즘, 정치학, 공중보건 분야 등에서 중요한 의미를 갖는다. GPT‑4는 감정의 강도나 긍정·부정의 정서적 방향성도 잘 파악했지만, 대체로 감정 표현을 낮게 평가하는 경향이 있었다. 풍자 인식은 인간과 AI 모두에게 여전히 어려운 과제로 남았다.
GPT-4를 포함한 대화형 AI들이 인간 수준으로 문장의 정서, 정치 성향, 감정 강도, 풍자 등을 해석할 수 있음이 실험을 통해 확인됐다. 언스플래쉬
이 같은 AI의 능력은 대규모 온라인 텍스트를 분석하는 데 있어 시간과 비용을 크게 줄일 수 있는 잠재력을 보여준다. 사회과학자들이 수개월에 걸쳐 수행하던 사용자 생성 콘텐츠 분석을 GPT‑4는 훨씬 빠르게 처리할 수 있다. 이는 위기 상황, 선거, 공중보건 비상 시기에 빠른 대응이 가능하다는 점에서 중요하다. 언론사나 팩트체크 기관에서도 GPT‑4 기반 도구를 통해 정치적 편향이나 감정적으로 유도된 글을 실시간으로 식별하는 데 도움을 받을 수 있다.
물론 AI의 투명성, 공정성, 정치적 편향 문제는 여전히 논의 대상이다. 그러나 이번 연구는 AI가 언어의 미묘한 뉘앙스를 감지하는 데 있어 사람을 따라잡고 있다는 점을 시사한다. AI가 단순한 도구를 넘어 유용한 협력자로 자리 잡을 수 있다는 가능성도 제기됐다.
연구진은 이 기술이 인간 평가자를 완전히 대체할 수 있다고 주장하지는 않지만, AI가 뉘앙스를 감지하는 데 무능하다는 통념에는 도전장을 내밀었다. 다만 동일한 질문을 문장 구조나 문맥의 양을 조금씩 바꿔가며 AI에 물었을 때, 일관된 판단이 가능한지 여부는 여전히 과제로 남았다. 이에 따라 향후 연구는 모델의 판단 안정성과 출력 결과의 일관성을 체계적으로 분석해야 한다고 강조했다. 이는 특히 고위험 분야에서 대형 언어모델을 활용하기 위한 핵심 요소다.
www.koreatimes.net/주간한국
박해련 인턴기자 (press3@koreatimes.net)