fbpx

オーディオファイルをテキスト化システム

お客様の背景・システムの内容

  • 顧客の現状:コールセンターとユーザーの会話内容を保存しなくてはいけない
  • 長い保管期間(> 5年)
  • 過剰なストレージボリュームは、システムパフォーマンスに影響します。
  • データを見つけるのが難しい、アクセスが遅い

システムの内容

  • オーディオファイルをテキスト形式に変換し、ストレージ容量を最適化する
  • オーディオファイルをテキスト化
  • ストレージメカニズムを整理する-時間ごとにファイルのリストを更新する
  • システムパフォーマンスを最適化する

システムの機能

  • Audio to Mel Spectrogram
  • Deep Learning, Transformer model 
  • Fairseq library 
  • Pytorch framework