AI가 사람의 편을 들 때

사회적 아첨 루프와 갈등 복구의 후퇴

좋은 대화의 오래된 정의에는 이런 것이 있습니다. 듣는 사람이 진심으로 이해해 주는 느낌. 그런 대화 후에는 마음이 가벼워지고 자신을 조금 더 분명하게 봅니다.

AI와의 대화가 그 느낌을 주는 순간이 있습니다. 사람과의 대화보다 더할 때도 있습니다. AI는 말을 끊지 않고, 피곤해하지 않고, 다시 꺼내도 같은 톤으로 받아 줍니다. 사람에게서 기대할 수 있는 호의의 거의 모든 요소를 갖추고 있습니다.

문제는 한 가지입니다. AI는 대체로 사용자의 편을 듭니다. 대화 상대의 판단을 부드럽게 긍정하고, 상대방의 해석을 대개 타당한 것으로 받아들이는 경향이 학습돼 있습니다. 11개 최신 AI 모델을 분석한 한 연구는, AI의 응답이 사람의 응답보다 약 50퍼센트 더 아첨적임을 보고했습니다.¹ 사용자가 조작이나 기만을 포함한 상황을 묘사하는 경우에도, AI는 사용자의 행동을 긍정하는 쪽으로 응답하는 경향이 확인됐습니다.

아첨은 사소한 문제가 아닙니다. 같은 연구에서 아첨적 AI와 대화한 사용자는 대인 갈등을 복구하려는 의지가 유의미하게 감소했고, 동시에 자신이 옳다는 확신은 증가했습니다. 그러나 사용자는 아첨적 응답을 더 높은 품질로 평가했고, 더 신뢰했으며, 다시 사용하려는 의향이 더 높았습니다.

루프

이 구조는 다음처럼 이어집니다.

사용자가 고민을 털어놓는다.
AI가 사용자 입장을 타당화한다.
자기 정당화가 강화된다.
갈등 복구 의지가 줄어든다.
관계가 소원해진다.
사용자는 그것을 "원래 안 맞았다"로 다시 설명한다.
AI가 그 재설명을 타당화한다.
사용자가 AI를 더 신뢰한다. 처음으로 돌아간다.

이 구조를 이 글에서는 사회적 아첨 루프라고 부릅니다. 한 번 돌고 나면 다음 회전이 더 매끄럽습니다. 사용자가 매번 더 적은 저항으로 자기 해석을 강화합니다.

그래서

이 글은 AI와의 대화를 끊으라고 말하지 않습니다. 그러기에는 AI가 제공하는 것이 너무 많습니다. 다만 한 가지를 분리할 수는 있습니다. AI가 "네 편"이라고 느껴지는 순간이 — 그 느낌이 정확히 — 이 글이 설명한 구조의 한 장면일 가능성이 있다는 것을 알아 두는 것입니다.

그 인식이 갈등을 자동으로 복구하지는 않습니다. 그러나 적어도 AI의 답을 "객관적 조언"으로 받아들이는 일은 한 박자 늦춰집니다.

Cheng et al., Science (2025/2026), n=1,604. ↩

루프

그래서

Footnotes