"이건 단지 X가 아니라 — Y이다"… AI 글쓰기의 '지문'이 된 문장 패턴

AI가 쓴 글에는 ‘지문(tell)’이 있다. 테크크런치(TechCrunch)의 아만다 실벌링(Amanda Silberling)은 “It’s not just [X] — it’s [Y]”(이건 단지 X가 아니라 — Y이다)라는 문장 구조가 AI 생성 텍스트의 사실상 보증수표가 됐다고 지적했다. 엠대시(—)의 과용, ‘comprehensive’, ‘leverage’, ‘furthermore’ 같은 반복 어휘와 함께, 이 패턴은 LLM이 학습 데이터에서 ‘권위 있는 글’의 형식을 과잉 모방한 결과다. AI 글쓰기의 동질화(homogenization)가 출판·미디어·교육 전반에 파문을 일으키고 있다.

“챗GPT 대시”—엠대시는 어떻게 AI의 서명이 됐나

엠대시(em dash, —)는 원래 영어 문장에서 삽입구나 극적 전환을 표현하는 문장부호다. 하지만 ChatGPT를 비롯한 대형 언어 모델(LLM )이 이를 비정상적으로 남발하면서, 소셜미디어와 작가 커뮤니티에서 “챗GPT 대시(ChatGPT dash)”라는 별명까지 얻었다.

AI가 엠대시를 과용하는 이유는 학습 메커니즘 자체에 있다. LLM은 존경받는 작가들이 권위감과 리듬감을 내기 위해 엠대시를 사용한다는 패턴을 학습한 뒤, “고품질 텍스트를 생성하려면 엠대시를 많이 쓰면 된다”고 과잉 일반화(overgeneralization)한다. 의식적 선택이 아니라 학습 데이터의 통계적 편향을 재생산하는 것이다.

오픈AI (OpenAI )는 2025년 이 문제를 인지하고 사용자가 문장부호 선호도를 맞춤 설정할 수 있는 업데이트를 적용했다. 하지만 기본 출력에서의 엠대시 과용은 여전히 AI 생성 텍스트의 가장 확실한 징후로 남아 있다.

“이건 단지 X가 아니라 — Y이다”: AI가 가장 좋아하는 구문

AI 과용 패턴	예시
“It’s not just X — it’s Y”	“이건 단지 행복이 아니라 — 강렬함이다”
“X isn’t about Y — it’s about Z”	“사랑은 기분이 아니라 — 신뢰와 취약성이다”
문단 서두 반복	“Furthermore”, “Moreover”, “In conclusion”
과잉 수식어	“comprehensive”, “crucial”, “vital”, “robust”
정중한 권위체	“leverage”, “optimize”, “endeavour”

테크크런치 기사가 지적한 핵심은 “It’s not just [X] — it’s [Y]” 구문이다. 이 패턴은 ChatGPT가 ‘대비를 통한 강조’를 표현할 때 압도적으로 선호하는 구조로, 한 편의 글에서 여러 번 반복되면 사실상 AI가 작성했다는 증거가 된다.

문제는 이런 패턴이 글의 ‘느낌’을 획일화한다는 점이다. 다양한 주제, 다양한 맥락의 글이 같은 문장 리듬과 구조를 공유하면서, 독자는 의식적으로든 무의식적으로든 ‘이건 사람이 쓴 게 아니다’라는 인상을 받게 된다.

AI 글쓰기 동질화의 3가지 층위

(1) 어휘의 동질화

LLM은 학습 데이터에서 높은 빈도로 등장하는 ‘고급’ 어휘를 과도하게 선호한다. ‘leverage'(활용하다), ‘comprehensive'(포괄적인), ‘robust'(견고한), ‘pivotal'(핵심적인) 같은 단어가 ChatGPT 출력에서 인간 작성 대비 3~5배 더 자주 등장한다는 분석이 있다. 이런 단어들이 반복되면 글의 개성이 사라진다.

(2) 구조의 동질화

대부분의 LLM 출력은 ‘주장 → 근거 → 전환어 → 결론’이라는 틀에 갇혀 있다. 문단 전환에 ‘However’, ‘Furthermore’, ‘Moreover’를 기계적으로 배치하며, 마지막 문단은 거의 항상 “이것은 단순한 X가 아니라 Y의 시작이다” 패턴으로 마무리한다. 일부 학자들은 이를 미국 MFA(Master of Fine Arts) 프로그램의 동질화 경향과 비교하며, 제도적 교육과 AI 학습이 만들어내는 ‘스타일 수렴(stylistic convergence)’의 유사성을 지적한다.

(3) 관점의 동질화

가장 심각한 문제다. AI 생성 텍스트는 학습 데이터의 주류적 관점을 재생산하는 경향이 있다. 소수 의견, 비주류 문화의 시각, 비영어권의 사고방식은 통계적으로 과소 대표되어 출력에 반영되기 어렵다. 이는 AI를 활용한 콘텐츠 생산이 확대될수록 인터넷 전체의 관점 다양성이 줄어드는 역설을 낳는다.

출판·미디어·교육 업계의 대응

분야	대응 방향
출판	인간 저자 강조, AI 비공개 사용 윤리 논란
미디어	AI 생성 콘텐츠 표기 의무화 논의
교육	학생 AI 의존 탐지 도구 도입, 비판적 활용 교육
기업 커뮤니케이션	AI 초안 → 인간 편집 ‘하이브리드’ 정착

2026년 미국 출판 업계에서는 역설적으로 인간 저자의 가치가 재부상하고 있다. 탐사 보도, 논픽션, 회고록, 비즈니스 도서에서 경험 많은 저널리스트·에디터·고스트라이터에 대한 수요가 오히려 증가했다. AI가 양을 지배하면서, 질과 개성이 있는 인간 글쓰기가 경쟁 우위로 재정의되고 있다.

위키피디아(Wikipedia)는 2026년 3월 AI 생성 콘텐츠의 무단 사용을 단속하는 정책을 강화했다. 뉴욕타임스를 비롯한 주요 매체들은 AI 생성·보조 콘텐츠에 대한 공개 정책을 마련하는 추세다.

한국 콘텐츠 산업에 주는 시사점

한국어 AI 글쓰기에도 동일한 동질화 현상이 관찰된다. 한국어 ChatGPT 출력에서는 “단순히 ~에 그치지 않고 ~로 이어진다”, “~라는 점에서 의미가 크다”, “~의 일환으로 볼 수 있다” 같은 패턴이 반복적으로 나타난다. 네이버 블로그, 브런치, 각종 보도자료에서 이런 문체가 급증하면서, AI 사용 여부를 둘러싼 의심과 신뢰 문제가 불거지고 있다.

한국 미디어·교육 업계에서도 AI 글쓰기 탐지 도구의 도입과 ‘AI 활용 공시’ 기준 마련이 시급한 과제로 떠오르고 있다. 특히 대학 논문·리포트에서의 AI 의존이 급증하면서, 서울대·카이스트 등 주요 대학이 AI 글쓰기 정책을 개정하는 움직임이 나타나고 있다. 콘텐츠의 신뢰성과 다양성을 지키기 위해, ‘인간이 쓴 글’과 ‘AI가 쓴 글’을 구분하는 리터러시(literacy)가 새로운 핵심 역량이 되고 있다.

AI 글쓰기의 문제는 품질의 부족이 아니다. 문제는 모든 AI 글이 같은 방식으로 좋다는 것이다. 같은 어휘, 같은 구조, 같은 리듬—엠대시 하나에 “It’s not just X — it’s Y”가 붙는 문장이 인터넷을 뒤덮는 미래가 이미 도착했다.

About

“이건 단지 X가 아니라 — Y이다”… AI 글쓰기의 ‘지문’이 된 문장 패턴

ChatGPT Images 2.0 출시… “이미지 속 텍스트가 드디어 읽힌다”, 한국어·일본어도 지원

스페이스X, AI 코딩 도구 ‘커서’ 600억 달러 인수 옵션 확보… “안 사면 100억 달러 지급”

앤트로픽 미토스, 비인가 그룹이 접근 성공… ‘세계 최강 사이버 무기’가 뚫렸다