バンコク、2022年12月15日 /PRNewswire/ -- チュラロンコン大学工学部教授が設計した「Gowajee」は、ネイティブ・スピーカー並の精度をもついタイ語音声認識 AI で、ユーザーのデータをセキュアに保ちます。現在コールセンターで使用され、鬱状態の患者の検査に使用されています。
私たちは、Google や Siri などの AI に対して音声コマンドを使用することに慣れていますが、タイ語の話者は、自分たちの話し方や発音を理解せず、間違った表記に翻訳する AI にうんざりすることがあります。
この問題を認識したチュラロンコン大学コンピューター工学部のEkapol Chuangsuwanich博士が率いるチームは、「Gowajee」という、タイ語で一層自然で正確に理解し、コマンドを実行するタイ語音声認識 AI を開発しました。実際に使用した結果では、言語が不正確になる事例は、他の言語の音声認識 AI の15%と比較してほんの9%に過ぎませんでした。
Gowajee という名称は、「Go」という単語と、言葉を意味する「Wajee」に由来します。この名称は、「OK Google」や「Hey Siri」と同類のコマンドとして設計されています。Gowajee という語は、タイ語で使用される他のいかなる語も複製しないような方法で設計されています。
タイ語の音声データベースの編集は、2017年に開始され、5千時間分ものデータを取得することができ、チームはタイ語を正確に転写するのに十分大きいデータだと確信しています。この AI には主要な 3 機能があります。
- 自動音声認識(Automated Speech Recognition, ASR) は、音声を文字に変換します。
- テキストから音声(Text-to-Speech, TTS) は、一節を話し言葉に転写する機能を果たします。
- 自動話者検証(Automatic Speaker Verification, ASV) は、音声によるアイデンティティ検証です。
Gowajee は、大学、公共および民間の各セクターなどのさまざまな機関に使用されてきましたが、特にコールセンターのユーザーには高い満足を与えています。
Gowajee は、鬱状態の患者を検査する DMIND システムでも使用されてきました。感情面の状況は困難だとわかっていましたが、Gowajee は、感情面の手がかりを分析して理解する上でよく機能しました。
Gowajee と AI テクノロジーは、歯科医院、言葉が不明瞭な患者の脳卒中リスクの検知、生活指導、および難聴者の支援などその他多くの状況で使用できます。
「データ・セキュリティ」は、もう一つの Gowajee の利点であり、すべてのデータがユーザーのデータベースに格納され、安全性が保証されるので、高度なデータ・セキュリティを必要とする銀行などの組織に有用です。」
続きは、https://www.chula.ac.th/en/highlight/92645/をお読みください。
詳細および Gowajee のトライアルについいては、https://www.gowajee.ai/をご覧ください。
メディア問い合わせ先:
チュラロンコン大学コミュニケーションセンター
電子メール:Pataraporn.r@chula.ac.th