hisaitamiのブログ

とあるプログラマーの日常

HoloLensアプリ開発(22日目)WatsonのText to Speechサービスを試す

音声をテキストに変換する方法の続き、

IBMのWatsonをUnityから使う方法を見つけたので試してみました。

noshipu.hateblo.jp

この記事に従って、IBM Bluemixにアカウントを作り、GitHubからUnity SDKをダウンロードします。SDKのバージョンは0.13.0に上がっていたのでそちらを使いました。「Speech to Textのコードを書く」を参考にC#スクリプトをコピペして動かそうとすると「SpeechResultListが見つからない」というエラーになります。

次の記事を参考にコードを修正しました。最新のSDKではSpeechResultList→SpeechRecognitionEventを使うように仕様が変更されたようです。

developer.ibm.com

これで、マイクで英語を話すとコンソールにテキストが出力されることを確認できました。

ただ日本語音声をテキストに変換する方法が分かってません。試しに「こんにちは」と入力すると「on each of our」と変換されました。

また、一回だけでなく連続してマイクから音声を拾ってテキストに変換したいところです。

そこで、Unity公式のSpeech-toTextアセットについて調べてみることに。。。