【無料電子書籍】日本ITオフショア開発の 俯瞰・動向「2024年版」
【無料電子書籍】日本ITオフショア開発の 俯瞰・動向「2024年版」
もっと見る

オーディオファイルをテキスト化システム

4月 5, 2022

【お客様の背景】

  • 顧客の状況: コールセンターとユーザーの通話内容を保存する必要がある
  • 長期保存が求められる(5年以上)
  • 過剰なデータ量がシステムパフォーマンスに影響
  • データの検索性が低く、アクセス速度が遅い

システム内容

  • 音声ファイルをテキスト形式に変換し、保存容量を最適化
  • 音声データのテキスト変換
  • ストレージ管理を最適化し、ファイルリストを1時間ごとに更新
  • システム性能の最適化

システムの特徴

  • 音声データをMelスペクトログラムへ変換
  • Deep LearningおよびTransformerモデルを活用
  • Fairseqライブラリを使用
  • Pytorchフレームワークを採用

事例