Deep Karmaning

技術系の話から日常のことまで色々と書きます

Google Cloud Engineでデータ分析用のインスタンスを作成する

概要

Google Cloud Engine上にデータ分析のためのインスタンスを作成した際の方法のメモです。

Google Cloud Engineは、クラウド上の仮想環境のことで詳しくは関しては紹介しません。詳細は公式ドキュメントの以下を参照のこと。

Google Compute Engine Documentation  |  Compute Engine  |  Google Cloud Platform

また本記事では以下を参考にしました。

Google Cloud Platform で Jupyter のサービスを動かす » DSP空挺団

インスタンスの設定画面へ行く

まずはインスタンスを作成するために、Compute Engine > VMインスタンスへ移動します。

ここから作成を行います。

f:id:rf00:20180101130832p:plain

インスタンスの作成画面へ移行

インスタンス作成ボタンを押して、作成画面を開きます。

f:id:rf00:20180101130937p:plain

名前とゾーンを決める

まずは名前とゾーンを決めましょう。

ゾーンに関する詳細はこちらhttps://cloud.google.com/compute/docs/regions-zones/regions-zones?hl=ja です。

障害時やアクセス時のネットワークのレイテンシの面で違いが出るようです。 またデフォルトのプロセッサも変わります。

f:id:rf00:20180101131430p:plain

スペックを決める

次はスペックです。

今回は、「n1-standard-4」をベースに「カスタマイズ」ボタンを選択しメモリを16GBにしてみます。

ここでGPUが必要な場合は設定します。ただし、個人で利用の場合は費用面で現実的では無いかもしれません。

ブートディスクは「Ubuntu 16.04 LTS」を指定し、ディスクを50GBに指定します。

f:id:rf00:20180101132338p:plain

ID と API へのアクセス設定

ここはデフォルトから特に変更しません。今後必要に応じてインスタンス作成後に変更します。

f:id:rf00:20180101132525p:plain

ファイヤーウォールの設定

ファイヤーウォールは「HTTP トラフィックを許可する」「HTTPS トラフィックを許可する」の両方にチェックを入れます。

f:id:rf00:20180101132634p:plain

プリエンプティブの設定

また今回はプリエンプティブの設定も行います。

プリエンプティブとは、仮想環境を低価格で利用できる代わりに、GCPの利用状況によっては、インスタンスを強制終了されてしまったりするような、限定された状況で使えるものです。 24時間稼働している必要のないデータ分析の用途には向いていると思います。

詳細は以下です。

https://cloud.google.com/compute/docs/instances/preemptible?hl=ja&_ga=2.253185933.-566431907.1514599603

f:id:rf00:20180101132946p:plain

「管理、ディスク、ネットワーク、SSH 認証鍵」をクリックし、 「管理」のタブを選択し、下の方にスクロールすると「可用性ポリシー」という表示があるので、その少し下の「プリエンプティブ」f:id:rf00:20180101133024p:plainのドロップダウンを「オン」にします。

作成

最後に「作成」ボタンを押して完成です。

f:id:rf00:20180101133139p:plain

まとめ

データ分析用のインスタンスを作成できました。

この仮想環境にデータ分析用のソフトウェアをインストールして運用します。

分析用ソフトウェアのインストール等は別途説明します。