구글이 별다른 발표 없이 iOS용 AI 받아쓰기(Dictation) 앱을 조용히 출시했다. 핵심은 인터넷 연결 없이 동작하는 ‘오프라인 우선’ 설계다. 자체 경량 LLM ‘젬마(Gemma)’ 모델을 단말기에 직접 탑재해, 음성을 클라우드로 보내지 않고 기기 안에서 텍스트로 변환한다. 사실상 위스퍼 플로(Wispr Flow)에 대한 구글의 직접 응답이다.
구글(Google)이 4월 7일(현지 시간) 공식 발표 없이 iOS용 신규 AI 받아쓰기(Dictation) 앱을 조용히 출시했다. 가장 큰 특징은 ‘오프라인 우선(offline-first)’ 설계다. 사용자가 입력한 음성을 클라우드 서버로 전송하지 않고, 단말기 자체에서 직접 텍스트로 변환한다. 인터넷 연결이 끊긴 상태에서도 실시간 받아쓰기가 가능하다는 의미다. 이는 그동안 음성-텍스트 변환의 대표 주자였던 오픈AI(OpenAI)의 위스퍼(Whisper) 기반 클라우드 서비스와 정면으로 차별화되는 지점이다.
핵심 기술은 구글이 자체 개발한 경량 LLM 젬마(Gemma) 시리즈다. 젬마는 구글이 클라우드용 제미나이(Gemini)와 별도로 운영해 온 온디바이스 특화 모델군으로, 모바일 칩셋에서도 비교적 가볍게 동작하도록 최적화돼 있다. 구글은 이 모델을 받아쓰기 용도로 미세조정해 iOS 앱에 직접 탑재했다. 결과적으로 사용자는 모델 자체를 단말기에 다운로드 한 번 받아두면 이후에는 데이터 통신 없이도 음성 입력을 활용할 수 있다.
이번 출시의 시장 맥락은 명확하다. 직접 경쟁자는 위스퍼 플로(Wispr Flow), 슈퍼휴먼(Superhuman) 등 음성 입력을 핵심 UX로 내세운 신생 AI 생산성 앱들이다. 위스퍼 플로는 출시 1년 만에 누적 다운로드 수백만을 기록하며 음성 기반 입력 시장을 빠르게 키워왔다. 구글의 이번 조용한 출시는 사실상 이 카테고리를 뺏기지 않겠다는 신호로 읽힌다. 흥미로운 점은 구글이 자사 안드로이드(Android)가 아닌 iOS를 먼저 공략했다는 사실이다. 수익성과 음성 입력 활용도가 높은 아이폰 사용자층을 우선 타깃으로 잡은 것으로 풀이된다.
| 항목 | 내용 |
|---|---|
| 출시 플랫폼 | iOS |
| 핵심 기술 | 구글 젬마(Gemma) 온디바이스 LLM |
| 동작 방식 | 오프라인 우선, 음성 클라우드 전송 없음 |
| 주요 경쟁자 | 위스퍼 플로(Wispr Flow), 오픈AI 위스퍼 기반 서비스 |
| 출시 방식 | 공식 발표 없는 ‘조용한 출시’ |
| 안드로이드 출시 | 미정 |
오프라인 우선 설계가 의미하는 바는 단순한 ‘인터넷 안 끊긴’ 편의성 그 이상이다. 첫째, 프라이버시 측면에서 음성 데이터가 외부 서버로 나가지 않는다는 점은 의료·법률·금융 등 고민감도 업종에서 차별화 요인이 된다. 둘째, 클라우드 추론 비용이 사실상 0에 가깝다. 구글 입장에서는 받아쓰기 사용량이 폭증해도 GPU·TPU 부담이 늘지 않는 구조다. 셋째, 단말 칩셋의 NPU(Neural Processing Unit) 성능이 곧 사용자 경험과 직결되기 때문에, 향후 애플(Apple) 자체 실리콘과 구글 모델의 결합이 어떻게 발전할지 주목할 가치가 있다.
한국 사용자 입장에서 가장 큰 관심사는 한국어 지원 수준과 안드로이드 출시 시점이다. 젬마 시리즈는 그동안 한국어 처리 성능이 비교적 양호한 모델로 평가돼 왔지만, 받아쓰기 특화 미세조정이 한국어에도 동일한 품질로 적용됐는지는 별도 검증이 필요하다. 국내 음성 AI 생태계, 특히 카카오·네이버의 클로바(CLOVA) 계열 서비스는 클라우드 기반 추론에 의존해 왔던 만큼, 구글이 온디바이스 모델로 시장 표준을 선점할 경우 국내 사업자들도 자체 경량 LLM 전략을 재검토해야 할 가능성이 있다.
© 2026 TechMore. All rights reserved. 무단 전재 및 재배포 금지.
기사 제보
제보하실 내용이 있으시면 techmore.main@gmail.com으로 연락주세요.


