
音声合成MLモデルの実行環境最適化
AWSとGKE上でのMLモデルの推論パフォーマンス測定と比較検証
担当領域:インフラストラクチャ構築、パフォーマンス測定、最適化
あるプロジェクトの一環として、音声生成を行う機械学習モデルの実行環境を設計・構築しました。AWSのGPUインスタンスやGKE(Google Kubernetes Engine)上でのパフォーマンスを詳細に比較検証し、コストや応答速度を踏まえた最適なインフラ構成を導出・実装しています。
- 機械学習モデルをクラウドで動作させるためのDevOpsとバックエンド・APIを開発
- 音声生成のAPIレスポンススピードを各マシーンスペック、リージョンごとに測定
- 料金表から試算した予測コストと実際テスト結果を照合し、将来的なランニングコストを再計算
- パフォーマンス、コストを総合的に評価し、最適な環境を選択
- 選択した環境に本番環境を構築し、運用段階までモニタリングを実施して継続的に最適化
本取り組みにより、音声生成モデルの実運用に耐えうるインフラを短期間で提供するとともに、将来的に高まる需要が見込まれる大規模モデル(LLMなど)のローカル実行環境に関係する知見も蓄積することができました。 Goldrush Computingでは、今後も機械学習モデルの実行環境構築におけるノウハウを強化し、企業の新規事業開発やプロダクトの差別化につながる最適解をご提案していきます。