[테크] AI로 방언 장벽 허문다…中 시짱어 파운데이션 모델 '딥짱', 잠재력 입증

지난 8일 ‘제28회 중국국제과학기술산업박람회(CHITEC)’에서 가상현실(VR) 게임을 체험하는 관람객들. (사진=신화통신 제공)

【서울 = 신화/서울뉴스통신】 권나영 기자 = 시짱(西藏)어 기반의 파운데이션 모델이 8~10일 열린 ‘제28회 중국국제과학기술산업박람회(CHITEC)’에서 잠재력을 입증했다.

현장에서는 스마트 마우스가 관람객들의 시선을 모았다. 이 마우스에 대고 시짱어로 질문하면 음성을 인식한 파운데이션 모델이 시짱어로 사고해 대답한다.

“일반 파운데이션 모델은 대부분 중국어, 영어 등 언어를 기반으로 학습하기 때문에 시짱어를 이해하고 생성하는 등의 측면에서는 사용 경험이 부족합니다.”

시짱어 파운데이션 모델을 연구개발(R&D)한 차이랑둥(才讓東) 시짱대학 박사과정생은 “일반 파운데이션 모델이 제시한 답변은 대체로 부자연스러운 인공 변환의 흔적이 뚜렷하다”고 짚었다. 시짱어 음성 및 언어 자료를 학습하고 시짱어 사고방식으로 생각하는 이번 모델은 시짱어 특유의 자연스러운 언어 감각과 본연의 운율을 그대로 살려낼 수 있다는 설명이다.

둬지메이주(多吉美久) ‘딥짱(DeepZang)’ 제품부 책임자는 시짱어 파운데이션 모델인 ‘딥짱’이 시짱어와 한어 간 병렬 정밀 언어 자료 약 7천만 건, 3만500시간 이상 분량의 시짱어 음성 및 언어 자료를 수집했다면서 이는 웨이창(衛藏)·캉바(康巴)·안둬(安多) 3대 시짱어 방언 지역을 아우르고 있다고 설명했다.

둬지 책임자에 따르면 시짱어는 지역별로 문자는 통하지만 구어는 큰 차이를 보인다. 중국 국가지식재산권국에 따르면 ‘딥짱’의 개발사인 시짱 줴뤄(覺羅)디지털산업관리회사는 성문 인식과 방언 분류를 결합한 기술로 특허를 신청했다. 해당 기술은 방언 차이로 인한 의사소통 문제를 효과적으로 해결할 수 있는 것으로 전해진다.

8일 ‘제28회 CHITEC’를 찾은 한 외국인 관람객이 스마트 마우스를 사용해 시짱(西藏)어 파운데이션 모델을 체험하고 있다. (사진=신화통신 제공)

시짱자치구 산난(山南)시에서 시짱어-한어 번역 업무를 하는 뤄쌍둔위(洛桑頓玉)는 “시짱어 쓰기에 익숙하지 않아도 말만 할 줄 알면 AI를 사용할 수 있어 사용 문턱이 크게 낮아졌다”며, “예전에는 두세 명이 나눠서 번역하는 데 40분이 걸렸던 작업을 이제는 AI의 힘을 빌려 혼자서 20여 분 만에 끝낼 수 있다”고 부연했다.

줴뤄디지털이 제공한 정보에 따르면 현재 ‘딥짱’의 사용자 수는 30만 명 이상에 이른다. 그중 18~40세 연령층이 70% 이상을 차지하고 있다. 둬지 책임자는 “자사 플랫폼 사용자들은 주로 시짱·칭하이(青海)·쓰촨(四川)·간쑤(甘肅) 등지에 분포돼 있으며, 사용자 대부분이 외진 곳에 거주하고 있다”고 밝혔다.