データ収集
多言語音声コーパスの構築
オーディオハードウェア業界のグローバルリーダーは、高品質なデータを利用してASRエンジンをチューニングしています。
課題
自動音声認識(ASR)システムは、コマンド受領後、受け取った音声をテキストに変換し、自然言語処理を行います。 自動音声認識(ASR)システムの効果を左右する要素として、性別、年齢層、アクセント、方言による音や声の違いへの対応性、さらにはシステムが使用される環境で感知されるノイズ(環境音)への対応性が挙げられます。 今回の事例では、ASRのトレーニングとテスト用として、複数の対象者層から英語、ヒンディー語、ドイツ語、フランス語、イタリア語でのデータ収集を依頼されました。
• • • •ソリューション• • • •
DataForceは、独自のモバイルアプリである「DataForce Contribute」を活用して、さまざまなシナリオに沿った音声データおよびバックグラウンドノイズ(環境音)を収集しました。 お客様のニーズに合わせてS/N比やサンプリングレートなどの設定が可能なこのアプリを使用し、技術的要件もクリアしました。 駐車中、走行中、窓が開いている状態/閉じている状態で録音した音声コマンドと周囲のバックグラウンドノイズ(環境音)を組み合わせ、実際の環境をシミュレートしたデータセットを作成しました。 こういったDataForceのソリューションで生成されたデータセットを活用することで、お客様はASRエンジンの効率性を向上させ、さまざまなシナリオにおいて複数の言語による音声コマンドを理解できるように開発とテストを実施しました。

DataForceは、全世界に100万人以上のメンバーと、250以上の言語を網羅する言語スペシャリストからなるグローバルコミュニティを擁しています。 DataForceは独自のプラットフォームですが、お客様やサードパーティのツールを使用することも可能です。 これにより、お客様のデータを常に管理下に置くことができます。