【お客様の背景】
- 顧客の状況: コールセンターとユーザーの通話内容を保存する必要がある
- 長期保存が求められる(5年以上)
- 過剰なデータ量がシステムパフォーマンスに影響
- データの検索性が低く、アクセス速度が遅い
【システム内容】
- 音声ファイルをテキスト形式に変換し、保存容量を最適化
- 音声データのテキスト変換
- ストレージ管理を最適化し、ファイルリストを1時間ごとに更新
- システム性能の最適化
【システムの特徴】
- 音声データをMelスペクトログラムへ変換
- Deep LearningおよびTransformerモデルを活用
- Fairseqライブラリを使用
- Pytorchフレームワークを採用