線形回帰を行う
このチュートリアルでは、線形回帰を定義するためのPythonコードを含むJupyterノートブックを作成し、TensorFlowを使用して実装する方法を学びます。このノートブックは、IBM Cloud Pak® for Data as a Service on IBM Cloud® 上で動作します。IBM Cloud Pak for Dataプラットフォームは、複数のデータソースとの統合、ビルトインのアナリティクス、Jupyter Notebooks、機械学習などの追加サポートを提供します。また、複数のコンピューティングリソースにプロセスを分散させることで、スケーラビリティを実現しています。
はじめに¶
線形回帰とは、簡単に言えば、2つ以上の変数の関係を記述するために使用される線形モデルの近似です。単純な線形回帰では、2つの変数があります。
- 従属変数は、我々が研究し、予測しようとする「状態」や「最終的な目標」と見なすことができます。
- 独立変数(説明変数としても知られている):"状態 "の "原因 "と見なすことができます。
複数の独立変数が存在する場合、このプロセスは重回帰と呼ばれます。複数の従属変数を予測する場合、このプロセスは多変量線形回帰と呼ばれます。
単純な線形モデルの式は次のとおりです。
𝑌=𝑎𝑋+𝑏
この式では、Yが従属変数、Xが独立変数、aとbが調整するパラメータです。aは「傾き」または「勾配」、bは「切片」と呼ばれています。この式は、YがXの関数である、またはYがXに依存していると解釈できます。
前提条件¶
- IBM Cloudのアカウントを持っていること。
- IBM Cloud Pak for Data
- Pythonの実用的な知識。
- TensorFlowについての実務知識
予想される実行時間¶
このチュートリアルを完了するには、約30分かかります。
手順¶
- IBM Cloud アカウントを作成し、IBM Cloud Pak for Data as a Service にアクセスする
- 新しいプロジェクトの作成
- Watson Machine Learning Service をプロジェクトに関連付ける
- データセットをプロジェクトに追加する (IBM Cloud Pak for Data as a Service を使用している場合)
- ノートブックをプロジェクトに追加する
- ノートブックを実行する
IBM Cloud アカウントを作成し、Data as a Service の IBM Cloud Pak にアクセスします。¶
- IBM Cloudにサインインします。
-
IBM Watson®Studioを検索します。
-
地域と料金プランを選択してサービスを作成し、「Create」をクリックします。
新しいプロジェクトの作成¶
-
Watson Studio サービスを起動します。
-
Create a project と Create an empty project をクリックします。プロジェクトに名前を付け、ストレージサービスを追加したことを確認してから、Create をクリックします。
プロジェクトが作成されると、プロジェクトのダッシュボードが表示されます。
Watson Machine Learning Service をプロジェクトに関連付ける¶
- プロジェクトの 設定 に移動します。
-
「Associated services」の「Add service」をクリックし、ドロップダウンメニューから「Watson」を選択します。
-
Watson Machine Learning サービスを追加します。
-
サービスをマークして、プロジェクトと関連付けます。
プロジェクトにデータセットを追加する¶
右側の browse をクリックし、csv file を選択して、データセットをプロジェクトに追加します。データセットは以下の URL からダウンロードできます。
データセットがアップロードされると、「データ資産」の下に表示されます。
プロジェクトにノートブックを追加する¶
-
Add to Projectをクリックして、メニューからNotebookを選択して、Jupyter Notebookをプロジェクトに追加します。
-
From URLを選択し、GitHub repoからノートブックのURLを貼り付けます。
-
ノートブックの名前を決めて、「Create」をクリックします。
ノートブックの実行¶
ノートブックが読み込まれたら、ノートブックの内容を確認します。セルをクリックし、Run Allを選択してノートブックを実行します。
ノートブックでは、TensorFlowの基本的な仕組みを理解するために、線形関数の簡単な例を示しています。
まとめ¶
このチュートリアルと関連するノートブックでは、線形回帰の基本と、TensorFlow が機械学習アルゴリズムの実装にどのように使用されているかを学びました。また、IBM Cloud Pak for Data as a Service 上の Watson Studio を使用して Jupyter Notebook を実行する方法や、IBM Cloud Pak for Data as a Service でオープンソース・フレームワークを使用する方法を学びました。