AutoML Tablesをやってみた(サンプルデータ利用)

だいぶ時間が空きました(汗

SEの稼働予測を行う上でまず、コアとなる予測を出力するための機能を検討する必要があります。取り得る実現策として、自作するか他社のフレームワークを使うかが挙げられます。

 

自作もいいですが、精度、スピード感、コストともに他社様のフレームワークを使うのがいいと思うので(当たり前(笑))、フレームワークとしてGoogleが提供しているAutoML Tablesを使って評価したいと思います。なぜ、Google AutoML Tablesにしたのか、特に大きな理由はないです。強いて挙げるならプログラムの知識不要というところが一番大きいです。まぁやってみて精度が良くなければ他のフレームワークを使ってみます。

 

AutoML Tablesとは何か、どのような手順でやったのか、ここがわかりやすいです。私もここをそのまま参考にしながらやってみました。

機械学習初心者はGoogleAutoML Tablesを使ってみては?メリットや使い方、使用感を知っておこう | データのじかん

 

Googleのクイックスタートもわかりやすいです。

Quickstart  |  AutoML Tables  |  Google Cloud

 

AutoMLを利用する前提として、事前にGCPのアカウントが必要です。

まだ本格的に検証できていないのでわかりませんが、簡単な試行レベルであれば無償でできます。

 

AutoML Tables利用の大きな流れは、インポート→予測したいパラメータ決定→トレーニング→モデルを使って予測

となります。

 

今回やったのは↑のリンク先の通りにやっただけなので、個人的に気になった、ポイントのみ抜粋します。

 

下記は、データのインポート画面です。BigQuery、CSV形式で可能です。

今回はGoogleのサンプルを指定します。

f:id:tomuo-i:20200628225123j:plain

 

次にトレーニングタブに移動します。↑のリンク先の手順のとおり、Depositをターゲットにします。

f:id:tomuo-i:20200628225120j:plain

 

モデルを作成します。

f:id:tomuo-i:20200628225115j:plain

 

完了するとメールが飛んできます。大体1.5時間くらいかかりましたね。

f:id:tomuo-i:20200628230843j:plain

 

出来上がったモデルを選択してみます。評価項目があるのですがこのあたりはもう少しAIの知識が必要そうですね。。

f:id:tomuo-i:20200628231421j:plain

 

ここまでやるのは簡単です。個人的にはトレーニングが完了するとメールが飛んでくるのがありがたいですね。

 

次回はGoogleのサンプルデータではなく、より実践的な生のデータを使いながら評価してみます。