(방콕 2022년 12월 15일 PRNewswire=연합뉴스) 쭐랄롱꼰대학교 공학과 교수들이 원어민 수준의 정확도를 보장하며 사용자의 데이터를 안전하게 보관하는 태국어 음성 인식 AI 'Gowajee'를 개발했다. Gowajee는 이미 콜센터에 배포됐으며, 우울증 환자의 검사에도 사용되고 있다.
많은 사람이 구글(Google)이나 시리(Siri) 같은 AI에서 사용하는 음성 명령에 익숙하지만, 태국어 사용자의 경우는 AI가 사용자의 발성이나 발음을 제대로 인식하지 못해 잘못된 표기를 하는 것에 지치기도 한다.
이러한 문제를 인식한 쭐랄롱꼰대학교 컴퓨터공학과 교수 Dr. Ekapol Chuangsuwanich의 팀은 더욱 자연스럽고 정확하게 태국어로 된 명령을 이해 및 이행하는 태국어 음성 인식 AI인 Gowajee를 개발했다. 실제로 사용해본 결과, 언어 부정확도는 9%에 불과했다. 참고로 다른 언어 인식 AI의 경우는 부정확도가 15%에 달한다.
Gowajee라는 명칭은 'Go'와 '단어'를 뜻하는 'Wajee'에서 따왔다. Gowajee는 'OK 구글'이나 '헤이 시리'와 비슷한 명령어로 설계됐다. 'Gowajee'라는 단어는 태국어에서 사용되는 다른 단어를 복제하지 않도록 설계됐다.
태국어의 음성 데이터베이스 편집은 2017년부터 시작됐고, 연구팀은 태국어를 정확하게 표기하는 데 충분하다고 판단한 5천 시간 분량의 데이터를 수집했다. Gowajee의 3가지 주요 특징은 다음과 같다.
- 음성을 텍스트로 변환하는 ASR(Automated Speech Recognition) 기능
- 텍스트 한 구절을 음성으로 변환하는 TTS(Text-to-Speech) 기능
- 음성을 통해 신분을 확인하는 ASV(Automatic Speaker Verification) 기능
Gowajee는 대학, 공공 및 민간 부문, 특히 사용자에게 높은 만족도를 제공하는 콜센터 등 다양한 기관에서 사용되고 있다.
또한 Gowajee는 우울증 환자 검사를 위한 DMIND 시스템에서도 사용되고 있다. 감정적인 맥락은 파악하기 힘들지만, Gowajee는 감정적 신호 해독에 높은 성능을 발휘했다.
치과, 발음이 불분명한 환자의 뇌졸중 위험 감지, 인생 코칭 및 청력이 약한 사람을 위한 지원 등 수많은 다른 상황에서도 Gowajee와 AI 기술을 사용할 수 있다.
'데이터 안전성'은 Gowajee의 또 다른 장점이다. 모든 데이터를 사용자의 데이터베이스에 보관하기 때문에 안전성을 확보할 수 있다. 이는 높은 수준의 데이터 안전성이 필요한 은행 같은 기관에 유용하다.
추가 읽을거리: https://www.chula.ac.th/en/highlight/92645/
Gowajee에 관한 추가 정보 및 Gowajee 시험 체험은 웹사이트 https://www.gowajee.ai/를 참조한다.
미디어 문의:
Chulalongkorn University Communication Center