Google Cloud Engineでデータ分析用のインスタンスを作成する
概要
Google Cloud Engine上にデータ分析のためのインスタンスを作成した際の方法のメモです。
Google Cloud Engineは、クラウド上の仮想環境のことで詳しくは関しては紹介しません。詳細は公式ドキュメントの以下を参照のこと。
Google Compute Engine Documentation | Compute Engine | Google Cloud Platform
また本記事では以下を参考にしました。
Google Cloud Platform で Jupyter のサービスを動かす » DSP空挺団
インスタンスの設定画面へ行く
まずはインスタンスを作成するために、Compute Engine > VMインスタンスへ移動します。
ここから作成を行います。
インスタンスの作成画面へ移行
インスタンス作成ボタンを押して、作成画面を開きます。
名前とゾーンを決める
まずは名前とゾーンを決めましょう。
ゾーンに関する詳細はこちらhttps://cloud.google.com/compute/docs/regions-zones/regions-zones?hl=ja です。
障害時やアクセス時のネットワークのレイテンシの面で違いが出るようです。 またデフォルトのプロセッサも変わります。
スペックを決める
次はスペックです。
今回は、「n1-standard-4」をベースに「カスタマイズ」ボタンを選択しメモリを16GBにしてみます。
ここでGPUが必要な場合は設定します。ただし、個人で利用の場合は費用面で現実的では無いかもしれません。
ブートディスクは「Ubuntu 16.04 LTS」を指定し、ディスクを50GBに指定します。
ID と API へのアクセス設定
ここはデフォルトから特に変更しません。今後必要に応じてインスタンス作成後に変更します。
ファイヤーウォールの設定
ファイヤーウォールは「HTTP トラフィックを許可する」「HTTPS トラフィックを許可する」の両方にチェックを入れます。
プリエンプティブの設定
また今回はプリエンプティブの設定も行います。
プリエンプティブとは、仮想環境を低価格で利用できる代わりに、GCPの利用状況によっては、インスタンスを強制終了されてしまったりするような、限定された状況で使えるものです。 24時間稼働している必要のないデータ分析の用途には向いていると思います。
詳細は以下です。
「管理、ディスク、ネットワーク、SSH 認証鍵」をクリックし、 「管理」のタブを選択し、下の方にスクロールすると「可用性ポリシー」という表示があるので、その少し下の「プリエンプティブ」のドロップダウンを「オン」にします。
作成
最後に「作成」ボタンを押して完成です。
まとめ
データ分析用のインスタンスを作成できました。
この仮想環境にデータ分析用のソフトウェアをインストールして運用します。
分析用ソフトウェアのインストール等は別途説明します。