TensorFlow Project Screenshot

音声合成MLモデルの実行環境最適化

AWSとGKE上でのMLモデルの推論パフォーマンス測定と比較検証

担当領域:インフラストラクチャ構築、パフォーマンス測定、最適化

あるプロジェクトの一環として、音声生成を行う機械学習モデルの実行環境を設計・構築しました。AWSのGPUインスタンスやGKE(Google Kubernetes Engine)上でのパフォーマンスを詳細に比較検証し、コストや応答速度を踏まえた最適なインフラ構成を導出・実装しています。

  • 機械学習モデルをクラウドで動作させるためのDevOpsとバックエンド・APIを開発
  • 音声生成のAPIレスポンススピードを各マシーンスペック、リージョンごとに測定
  • 料金表から試算した予測コストと実際テスト結果を照合し、将来的なランニングコストを再計算
  • パフォーマンス、コストを総合的に評価し、最適な環境を選択
  • 選択した環境に本番環境を構築し、運用段階までモニタリングを実施して継続的に最適化

本取り組みにより、音声生成モデルの実運用に耐えうるインフラを短期間で提供するとともに、将来的に高まる需要が見込まれる大規模モデル(LLMなど)のローカル実行環境に関係する知見も蓄積することができました。 Goldrush Computingでは、今後も機械学習モデルの実行環境構築におけるノウハウを強化し、企業の新規事業開発やプロダクトの差別化につながる最適解をご提案していきます。

Project Information

Genre:

機械学習, AWS, GKE, パフォーマンス測定, 音声合成

Year:

2024

Links

Related Works

GRTT

AIとコンピュータービジョンで、多言語UI翻訳を革新

担当領域:プロダクトデザイン、ユーザー体験設計、開発

TTS Model

RAGを活用し、トピックをコントロールした対話型AIのPoC構築

担当領域:新規事業計画、ユーザー体験設計、RAG構築、開発

TensorFlow

機械学習モデルをTensorFlow/Androidに最適化・実装する開発事例

担当領域:開発