クラウドGPUをディープラーニング向けに安く使う方法【GCP/AIプラットフォーム】

クラウドGPUをディープラーニング向けに安く使う方法【GCP/AIプラットフォーム】
えびかずき
えびかずき

こんにちは、えびかずきです。

今回はGoogle Cloud Platform(GCP)でGPUを使う手順を順番に解説していきます!

こんな人におすすめ:
・ディープラーニング用にがっつりマシンパワーが欲しい。
・クラウドでGPUが使えることは知っているけど、複雑でよくわからない。

結論として、1時間あたり50円くらいでGCPのAIプラットフォームからGPUを使えます。

初期クレジットとして約3万円分の無料枠が貰えるので、お得です。

では順を追って手順を説明していきましょう!

1.GCPにユーザー登録する

まず、Google Cloud Platformからユーザー登録をして、新規プロジェクトを立ち上げます。

登録方法の詳細は過去記事の「制作手順(1~3)」が参考になります。

※新規プロジェクトについては、特にこだわりがなければデフォルトで作成される「My First Project」で進めてOKです。

2.AIプラットフォームの利用手続き

ナビゲーションメニューのAIプラットフォームから、ノートブックを選択します。

初回に限って、「Compute Engine API」のサービスを有効化する必要があります。

「新しいインスタンス」をクリックして、新しいインスタンスを作成します。

インスタンスというのはGCP内の仮想マシンのことです。

要するにクラウド上で仮想PCを作りますということです。

用途に応じて、環境を選択します。

私の場合は「TensorFlow Enterprize2.3 with 1 NVIDIA Tesla T4」を選択しました。

細かく環境を指定したい場合には、「Custom instance」を選択してください。

続く設定画面は以下の通り。

Custom instance以外の場合、基本的にはデフォルトの設定でOKですが、

以下2点については選択が必要です。

・リージョン:私の場合はasia-east1(Taiwan)を選択

GPU使用料が安いリージョンを選択しました。

・NVIDIA GPUドライバを自動的にインストールする:チェックを入れる

料金について

私の構成の場合、インスタンス使用料は1時間当たり$0.399(50円弱ほど)です。

画面には月間の料金も表示されていますが、

後述する方法で使っていない時はインスタンスを停止すれば、節約できます。

詳細についてはGPUの料金全ての料金から確認できます。

内訳をみると、そのほとんどがGPU使用料ですね。

ちなみにNVIDIA Tesla T4は普通に買おうとすると30万くらいします。

軽い気持ちでは買えない価格ですね。笑

それをクラウド利用にすれば、1時間で50円くらい。

毎週日曜日に3時間使ったとしても、月600円とかなりリーズナブルです。

エラーへの対処法

私の場合、はじめ以下のエラーが出て、インスタンスの作成がうまく行きませんでした。

どうやら、「GPUS_ALL_REGIONS」の制限に引っかかったようです。

調べてみるとデフォルトでは、GPUに使用制限がかけられているので、変更が必要とのこと。

GPU制限の変更方法:

1.ナビゲーションバーの「IAMと管理」から割り当てを選択。

2.フィルタリングの欄に「GPUs」と入力して、「GPUs(All regions)」選択。

3.下のようにGPU使用数の上限が0になっていると思うので、これを1へ変更申請する。(メールアドレス、電話番号の入力が必要)

4.変更申請が通るとメール通知が届く。(私の場合5分くらいで届いた)

5.メール通知から15分ほどでGCPに反映される。

6.改めてインスタンスの作成を実施して完了。

3.AIプラットフォームの使い方

ノートブックの「JUPYTERLABを開く」をクリックします。

すると、以下の画面が開きます。

Notebookの「Python3」を使って、Jupyter Notebookと同じ要領でディープラーニングを実行するのがおすすめです。

TensorFlowやPandas,scikit-learnなど機械学習に必要なライブラリはデフォルトで一通り揃えてくれています。

ライブラリを追加したい場合は、Notebook内にて「!pip」でインストールするもよし、Terminalで普通にインストールするもよしです。

終わり方:

使用が終われば必ず、「停止」をクリックして、インスタンスを止めましょう。

※停止しないと課金が続いて月末にえらいことになります。

うっかり高額請求が来ないように、GCPの料金上限を設定しておくことをお勧めします。

おまけ:ストレージの準備

学習素材などを保存するためにストレージを準備しておくと便利です。

1.ナビゲーションメニューのストレージからブラウザを選択します。

2.「バケットを作成」をクリック。

3.必要事項を入力して、バケットを作成する。

ストレージのファイルはAIプラットフォームからアクセスして使用することができます。

詳細は、Cloud Strageを使用するや、下記の参考書籍が参考になります。

まとめ

今回はGCP AIプラットフォームを使って、クラウドGPUを使う方法について説明しました。

GCPって結構ややこしいし、公式ドキュメントもなんだか読みにくいので、案外つまずきポイントが多いです。

この記事を含むネット情報や書籍をうまく活用しながらトライするのがオススメです。

GCPの試用結果についてはまた別の記事で紹介しようと思いますが、

やっぱりGPUがあるとサクサク学習工程が進んで快適です!

みなさんもぜひトライしてみてください。

参考書籍

5章にGCP AIプラットフォームの使い方が記載されていて、参考になりました。

GCPストレージとAIプラットフォームの連携についても説明があります。

メインのKaggle入門についても、初心者向けにかなり易しめに書かれていて読みやすいです。

機械学習カテゴリの最新記事