Skip to content

データにエンタープライズガバナンスを組み込む

ガバナンスとは、データをキュレーションし、充実させ、コントロールするプロセスです。ガバナンス成果物を使ってデータを管理し、カテゴリーを使ってガバナンス成果物へのアクセスを整理・制御します。実際のシナリオでは、ガバナンス成果物は組織のガバナンスチームによって設定されます。

学習目標

このチュートリアルでは、Syntheaを使用して作成した合成患者ヘルスケア・データ・セットに必要なカテゴリーとガバナンス・アーティファクトをIBM Cloud Pak for Dataで作成する方法を学びます。以下のガバナンスアーティファクトについて学び、作成します。

  • カテゴリー
  • ビジネス用語
  • 参照データ
  • データクラス
  • クラシフィケーション
  • ポリシー
  • ガバナンスルール

前提条件

見積もり時間

このチュートリアルを完了するには、約 60 分かかります。

カテゴリー

カテゴリーは、フォルダやディレクトリのように、ガバナンスの成果物を整理するために使用されます。ガバナンス成果物をカテゴリに分類することで、成果物の検索、表示の制御、管理が容易になります。また、カテゴリーを使用して、カテゴリー内の成果物を表示および管理できるユーザーを指定することもできます。カテゴリはサブカテゴリを持つことができますが、サブカテゴリは1つの直接の親カテゴリしか持つことができません。

トップレベルのカテゴリーを作成するには、IBM Cloud Pak for Data の Manage governance categories ユーザー権限が必要です。

トップレベルのカテゴリー内にサブカテゴリーを作成するには、IBM Cloud Pak for Data上でAccess governance artifactsおよびManage governance categoriesのユーザー権限が必要です。さらに、親カテゴリーのAdminまたはOwnerカテゴリー・コラボレーター・ロールを持っている必要があります。

。定義済みの[未分類]カテゴリー内にサブカテゴリーを作成することはできません。

カテゴリーを作成するには、Adminロールが必要です。

カテゴリーのダウンロードとインポート

  1. Healthcare_Data-category-csv-export.csvファイルをダウンロードします。

  2. ブラウザーを開き、IBM Cloud Pak for Data インスタンスに移動します。管理者権限のあるユーザーとしてログインします。

    CPDへのログイン

  3. 左上のハンバーガーメニューからGovernanceを展開し、Categoriesをクリックします。

    ハンバーガーメニュー - カテゴリ

  4. 「カテゴリの追加」→「ファイルからの読み込み」をクリックします。

    カテゴリー - インポートを追加

  5. [ファイルの追加]をクリックし、先ほどダウンロードしたHealthcare_Data-category-csv-export.csvファイルを選択して、[次へ]をクリックします。

    カテゴリー - ファイルの追加

  6. 「すべての値を置換する」を選択し、「インポート」をクリックします。

    Categories - click import

  7. カテゴリーがファイルからインポートされます。インポートが成功すると、"The import completed successfully. "という Import summary モダルが表示されます。また、新しいカテゴリーが1つ作成され、エラーが発生しなかったことも表示されます。戻るには閉じるをクリックします。

    カテゴリー - インポート成功

ビジネス用語

ビジネス用語は、ビジネスコンセプトの定義を標準化して、組織全体で統一された方法でデータを記述するために使用されます。ビジネス用語は、異なるカラム名のカラムに注釈を付けるために使用されますが、すべてのカラムはビジネス用語で定義された同じタイプのデータを持っています。

ビジネス用語を作成するには、AdminData EngineerData StewardData Quality Analystのいずれかのロールが必要です。

ビジネス用語のダウンロードとインポート

  1. Healthcare_Data-glossary_terms-csv-export.csvファイルをダウンロードします。

  2. 左上のハンバーガーメニューで、Governanceを展開し、Business termsをクリックします。

    ハンバーガーメニュー-ビジネス用語

  3. Add business termをクリックし、次にImport from fileをクリックします。

    ビジネス用語-インポートを追加

  4. ファイルの追加をクリックし、先にダウンロードしたHealthcare_Data-glossary_terms-csv-export.csvファイルを選択して、次へをクリックします。

    ビジネス用語-ファイルの追加

  5. 「すべての値を置換する」を選択し、「インポート」をクリックします。

    Business terms - click importをクリックします。

  6. ファイルからビジネス用語がインポートされます。インポートが成功すると、"The import completed successfully "というImport summaryのモーダルが表示されます。また、ビジネス用語の新しいドラフトが124個作成され、エラーが発生しなかったことも表示されます。「タスクに進む」をクリックします。

    ビジネス用語 - 作成されたドラフト

ビジネス用語の公開

  1. Task inboxに移動します。Assigned to youタブに移動すると、Publish Business termsタスクが自分に割り当てられていることがわかります。公開をクリックして、ビジネス用語のドラフトを公開します。

    ビジネス用語 - ドラフトの発行

  2. ビジネス用語が公開されると、タスクが完了したことと、管理者に通知されたことを示す通知が表示されます。

    Business terms - publish successful

参考資料

参照データセットは、製品コードや国コード、あるいは医療分野では症状コードや投薬コードなどのコード値を論理的にグループ化するために使用されます。一般的には、データフィールドに許容される値のセットであり、データクラスのマッチングパターンやビジネス用語の割り当てに使用されます。

参照データ・セットを作成、編集、または削除するには、IBM Cloud Pak for DataでAccess governance artifactsのユーザー権限が必要です。さらに、参照データ・セットのプライマリ・カテゴリーにおいて、AdminOwnerEditorのいずれかのカテゴリー・コラボレーター・ロールを持っている必要があります。

リファレンスデータファイルのダウンロードとインポート

  1. Healthcare_Data-reference_data-csv-export.csvファイルをダウンロードします。このCSVファイルには、IBM Cloud Pak for Dataにインポートする必要のあるリファレンスデータセットが含まれています。

  2. Healthcare_Data-reference_data_sets.zipファイルをダウンロードして解凍します。このアーカイブ・ファイルには複数のファイルが含まれており、それぞれがHealthcare_Data-reference_data-csv-export.csvファイルに記載されているリファレンス・データ・セットを投入します。

  3. 左上のハンバーガーメニューを開き、ガバナンスを展開し、参照データをクリックします。

    ハンバーガーメニュー-参考データ

  4. Add reference data set > Import from file」をクリックします。

    リファレンスデータ-追加インポート

  5. ファイルの追加をクリックし、先にダウンロードしたHealthcare_Data-reference_data-csv-export.csvファイルを選択して、次へをクリックします。

    リファレンスデータ-ファイルの追加

  6. 「すべての値を置換する」を選択し、「インポート」をクリックします。

    参照データ-クリックインポート

  7. ファイルからリファレンスデータセットがインポートされます。インポートが成功すると、"The import completed successfully "というImport summaryのモーダルが表示されます。また、参照データの新しいドラフトが10個作成され、エラーが発生しなかったことも表示されます。「タスクに進む」をクリックします。

    リファレンスデータ-ドラフト作成

リファレンスデータセットにリファレンスデータを投入する

  1. Task inbox に移動します。Assigned to youタブに移動すると、Publish Reference data setsタスクが自分に割り当てられていることがわかります。表の中のEncounter classesの行を探し、See detailsをクリックします。

    Reference data - see details

  2. エンカウンター・クラスのリファレンス・データ・セットが画面上に読み込まれます。オーバーフローメニューをクリックして、「ファイルのアップロード」を選択します。

    リファレンスデータ-エンカウンタークラス-アップロードファイル

  3. Healthcare_Data-reference_data_sets.zipファイルを解凍した内容から、Encounter classes-reference_data_set-csv-export.csvファイルをドラッグ&ドロップするか、ダウンロードした場所を参照してアップロードし、Nextをクリックします。

    リファレンスデータ-エンカウンタークラス-追加ファイル

  4. 次の画面では、CSVファイルの列をターゲット列にマッピングする必要があります。Code, Value, Description, Parent, Related terms の各カラムを、code, value, description, parent, and related terms の各ドロップダウンフィールドから選択します。「保存」ボタンをクリックします。

    リファレンスデータ-エンカウンタークラス-保存

    ファイルがインポート用に正常に送信されたことを示す通知が表示されます。

    リファレンスデータ-エンカウンタークラス-保存成功

  5. 左上のハンバーガー(☰)メニューからタスクの受信箱をクリックして、タスクの受信箱のAssigned to youタブに戻ります。Encounter codes-reference_data_set-csv-export.csvおよびCondition codes-reference_data_set-csv-export.csvファイルを使用して、Encounter codeおよびCondition codeの参照データセットを生成するプロセスを繰り返す。

    リファレンスデータ-エンカウンタークラス-バックトゥタスク

:このチュートリアルの拡張バージョンでは、タスクに記載されている各参照データセットを入力します。以下の表を参考に、各参照データセットのcsvファイルを選択してください。

参照データセット CSVファイル
アレルギーコード アレルギーコード-reference_data_set-csv-export.csv
ケアプランコード ケアプランコード-reference_data_set-csv-export.csv
条件コード 条件コード-reference_data_set-csv-export.csv
エンカウンタクラス エンカウンタクラス-reference_data_set-csv-export.csv
カウンタコード カウンタコード-reference_data_set-csv-export.csv
免疫コード 免疫コード-reference_data_set-csv-export.csv
投薬コード 投薬コード-reference_data_set-csv-export.csv
Observation codes Observation codes-reference_data_set-csv-export.csv
プロシージャコード プロシージャコード-reference_data_set-csv-export.csv
提供者の専門分野 提供者の専門分野-reference_data_set-csv-export.csv

リファレンスデータの公開

  1. 参照データセットの入力が完了したら、それを公開することができます。タスクインボックスのAssigned to youタブに戻り、Publishをクリックして、参照データセットのドラフトを公開します。

    リファレンスデータ - パブリッシュドラフト

  2. リファレンスデータセットが公開されると、タスクが完了したことと、管理者に通知されたことを示す通知が表示されます。

    リファレンスデータ - パブリッシュ成功

データクラス

データクラスは、データ資産に含まれるデータの種類を説明するために使用されます - 例えば、都市、口座番号、社会保障番号などのデータフィールドやテーブルの列などです。Watson Knowledge Catalog では、定義済みのデータクラス のセットを提供しています。また、カスタムデータクラスを作成し、有効な値のリスト、参照データ、または正規表現などのマッチングロジックを使用して、データを自動的に分類する方法を指定することもできます。データクラスには、分類やビジネス用語など、関連するガバナンスの成果物を関連付けることができます。データクラスがデータ資産に割り当てられると、ビジネス用語がデータ資産に対して提案されます。

データ・クラスを作成、編集、または削除するには、IBM Cloud Pak for DataのAccess governance artifactsユーザー権限が必要です。さらに、データ・クラスのプライマリ・カテゴリーにおいて、AdminOwnerEditorのいずれかのカテゴリー・コラボレーター・ロールを持っている必要があります。

データクラスファイルのダウンロードとインポート

  1. Healthcare_Data-data_class-csv-export.csvファイルをダウンロードします。

  2. 左上のハンバーガーメニューを開き、ガバナンスを展開し、データクラスをクリックします。

    ハンバーガーメニュー - データクラス

  3. Add data class > Import from fileをクリックします。

    データクラス-インポート追加

  4. [ファイルの追加]をクリックし、先にダウンロードしたHealthcare_Data-data_class-csv-export.csvファイルを選択して、[次へ]をクリックします。

    データクラス-ファイルの追加

  5. 「すべての値を置き換える」を選択して、「インポート」をクリックします。

    Data classes - click import

  6. ファイルからデータクラスがインポートされます。インポートが成功すると、"The import completed successfully "という Import summary モダルが表示されます。また、データクラスの新しいドラフトが16個作成され、エラーが発生しなかったことも表示されます。Go to taskをクリックします。

    データクラス-ドラフト作成

データクラスに参照データ(マッチング方法)を追加する

  1. Task inboxに移動します。Assigned to youタブに移動すると、Publish Data classesタスクが自分に割り当てられていることが確認できます。テーブルの中のEncounter classの行を探して、詳細を見るをクリックします。

    データクラス - 詳細を見る

  2. エンカウンタークラスのデータクラスが画面に読み込まれます。Matching method+(Add)をクリックします。

    データクラス-エンカウンタークラス-マッチメソッドの追加

  3. モーダルウィンドウで、Match to reference dataを選択して、Nextをクリックします。

    データクラス-エンカウンタークラス-マッチリファレンスデータ

  4. 参照データセットのリストから エンカウンタークラス を検索します。検索バーを使って検索することもできます。Encounter classesの参照データセットをクリックして選択し、Nextをクリックします。

    データクラス-エンカウンタークラス-参照データ名

  5. 次の画面で「Save」をクリックします。

    データクラス-エンカウンタークラス-保存

    変更が保存されたという通知が表示されます。

    データクラス - エンカウンタークラス - 保存成功

  6. 左上のハンバーガー(☰)メニューからタスク受信箱をクリックして、タスク受信箱のAssigned to youタブに戻ります。この手順を繰り返してエンカウンターコードとコンディションコードのデータクラスを更新し、参照データを使って照合するという照合方法を追加します。エンカウンターコードとコンディションコードの参照データセットを選択します。

データクラス-遭遇クラス-タスクに戻る

:このチュートリアルの拡張版では、タスクに記載されている以下のデータクラスを、与えられた参照データセットを使用して一致するように更新してください。

データクラス 参照データセット
アレルギー・コード|アレルギー・コード
ケアプラン・コード|ケアプラン・コード
条件コード 条件コード
エンカウンタークラス エンカウンタークラス
エンカウンターコード エンカウンターコード
予防接種コード 予防接種コード
薬剤コード メディケーションコード
観察コード Observation code
手技コード プロシージャコード
医療従事者の専門分野 医療従事者の専門分野

データクラスへの値のリスト(マッチング方法)の追加

  1. Task inboxAssigned to youタブに戻り、Ethnicity (hispanic/non-hispanic)データクラスのSee detailsをクリックします。

    データクラス - エスニシティ

  2. Ethnicity (hispanic/non-hispanic)データクラスが画面に読み込まれます。「マッチング方法」の「+(追加)」をクリックします。

    データクラス - エスニシティ - マッチング方法の追加

  3. モーダルウィンドウで、有効な値のリストに一致させるを選択し、次へをクリックします。

    データクラス - エスニシティ - マッチリストの値

  4. List of valid valuesを選択し、List of valid valueshispanicと入力します。Add valid value(有効な値の追加)をクリックすると、有効な値を入力するスペースが1つ追加されるので、「non hispanic」と入力し、Next(次へ)をクリックします。

    Data classes - ethnicity - populate list of values

  5. 次の画面で、Column name criteria[Ee]thnic|ETHNICを追加して、Saveをクリックします。

    データクラス - エスニシティ - 保存

    変更が保存されたという通知が表示されます。

    Data classes - ethnicity - save successfulが表示されます。

  6. 左上のハンバーガー(☰)メニューからタスクの受信箱をクリックして、タスクの受信箱のAssigned to youタブに戻ります。人種データクラスの有効な値のリストを使用するために、マッチングメソッドを更新するプロセスを繰り返します。

    データクラス - エスニシティ - タスクに戻る

  7. 有効な値として、asianblacknativeotherwhiteを提供する。列名の基準[rR]ac(e|ial)|RAC(E|IAL)を追加。

データクラスに正規表現(マッチング方法)を追加する

  1. タスク受信箱Assigned to youタブに戻り、PassportデータクラスのSee detailsをクリックします。

    データクラス - パスポート

  2. Passportデータクラスが画面に読み込まれます。「マッチング方法」の+(追加)をクリックします。

    データクラス-パスポート-マッチメソッドの追加

  3. モーダルウィンドウで、正規表現の基準に一致させるを選択し、次へをクリックします。

    データクラス - パスポート - 一致する正規表現

  4. [A-Z0-9]{6,9}$を列値の一致基準として指定し、Nextをクリックします。

    データクラス-パスポート-正規表現

  5. 次の画面で、Column name criteria[pP]assport|PASSPORT|[iI]d|IDを指定して、Saveをクリックします。

    データクラス-パスポート-保存

    変更が保存されたという通知が表示されます。

    Data classes - passport - save successful

  6. 左上の ハンバーガー(☰) メニューから タスクの受信箱 をクリックして、タスクの受信箱のAssigned to you タブに戻ります。

    データクラス - パスポート - タスクに戻る

  7. 次の表に記載されているデータクラスについて、マッチング方法を正規表現を使用するように更新するプロセスを繰り返します。この表を使用して、各データクラスの正規表現と列名のマッチング基準を選択します。

(テーブル) (日本語) ^[A-Z0-9]{6,9}$
^\\+$^(19|20)[0-9]{2}-(0[1-9]|1[0-2])-(0[1-9]|[1-2][0-9]|3[0-1])T([0-1][0-9]|2[0-3]):[0-5][0-9]:[0-5][0-9]Z$
データクラス 正規表現 列名のマッチング条件
パスポート [pP]assport|PASSPORT|[iI]d|ID
数字
タイムスタンプ
UUID ^[a-f0-9]{8}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{12}$

(英語)

データクラスの公開

  1. すべてのデータクラスのマッチングメソッドが指定されたら、データクラスを発行することができます。Task inboxAssigned to youタブに戻り、Publishをクリックしてデータクラスのドラフトを公開します。

    データクラス-公開ドラフト

  2. データクラスが公開されると、タスクが完了したことと管理者に通知されたことを示す通知が表示されます。

    データクラス-公開成功

クラス分け

分類は、組織にとっての感度や機密性のレベルに基づいて、資産を分類するために使用されます。データの値を照合するロジックを含むデータクラスとは異なり、分類はラベルのようなものです。

Watson Knowledge Catalog には、一般的に使用される 3 つの定義済みの分類が含まれています。

  • 「個人識別情報」は、人と人とを区別するために使用され、特定の個人を識別する可能性のあるデータに使用されます。

  • 機密性の高い個人情報とは、人種や民族、政治的意見、宗教的信条、その他類似した性質の信条、労働組合への加盟、身体的・精神的な健康や状態、性的生活、または個人の犯罪歴や犯罪歴の疑いに関する個人に関連する情報のことです。

  • データに不適切にアクセスした場合、そのデータを持つ機関または個人に重大または長期的な損害を与える可能性があるデータには、「機密」が使用されます。

分類を作成、編集、または削除するには、IBM Cloud Pak for DataでAccess governance artifactsのユーザー権限が必要です。さらに、分類のプライマリ・カテゴリーにおいて、AdminOwnerEditorのいずれかのカテゴリー・コラボレーター・ロールを持っている必要があります。

。Watson Knowledge Catalog には、ユーザー定義の分類を作成またはインポートする機能があります。ただし、ヘルスケアのユースケースでは、定義済みの分類のみが必要です。

ポリシー

ポリシーは、組織のデータや情報資産を適切に管理または使用するために、組織が従う必要のあるガイドライン、規制、標準、または手順を記述するために使用される自然言語文書です。ポリシーは、ガバナンスの対象領域を自然言語で記述したものです。

ポリシーには、さらに複数のサブポリシーを含めることができます。サブポリシーは、親ポリシーの広範な定義の中で、特定の領域に関連するものです。また、データや資産のリソースを企業の目標に適合させるための特定の詳細を定義するルールを参照することもできます。ポリシーは、その意味や相互の関係に基づいて、階層的に整理することができます。ポリシーは、リレーショナルデータセットのデータにのみ適用することができます。

ポリシーを作成、編集、または削除するには、IBM Cloud Pak for DataでAccess governance artifactsのユーザー権限が必要です。さらに、ポリシーのプライマリ・カテゴリーにおいて、AdminOwnerEditorのいずれかのカテゴリーのコラボレーター・ロールを持っている必要があります。

ポリシーファイルのダウンロードとインポート

  1. Healthcare_Data-policy-csv-export.csvファイルをダウンロードします。

  2. 左上のハンバーガーメニューを開き、ガバナンスを展開し、ポリシーをクリックします。

    ハンバーガーメニュー - Policies - add import

  3. Add policy > Import from fileをクリックします。

    ポリシー - インポートの追加をクリックします。

  4. [ファイルの追加]をクリックし、先ほどダウンロードしたHealthcare_Data-policy-csv-export.csvファイルを選択して、[次へ]をクリックします。

    ポリシー - ファイルの追加

  5. 「すべての値を置換する」を選択し、「インポート」をクリックします。

    Policies - click importをクリックします。

  6. ファイルからポリシーがインポートされます。インポートが成功すると、"The import completed successfully "という Import summary モダルが表示されます。また、ポリシーの新しいドラフトが3つ作成され、エラーが発生しなかったことも表示されます。「タスクに進む」をクリックします。

Policies - draft created

ポリシーの公開

  1. Task inboxに移動します。Assigned to you タブに移動すると、Publish Policies タスクが自分に割り当てられていることがわかります。「公開」をクリックして、ドラフトポリシーを公開します。

    Policies - publish draft

  2. ポリシーが公開されると、タスクが完了したことと、管理者に通知されたことを示す通知が表示されます。

    Policies - publish successful

ガバナンスルール

ガバナンスルールは、ガバナンスポリシーを実装するために必要な動作やアクションをビジネス上で記述したものです。ガバナンスルールは、自然言語で書かれた記述的なルールであり、強制することはできません。

ガバナンス・ルールは基本的に、名前とテキストによる説明で構成されています。他のすべてのガバナンス成果物と同様に、主要なカテゴリ内に格納される。ガバナンスルールは、他のルールと同様にガバナンスポリシーを参照することができる。関連するルールの関係は双方向であり、つまり、ガバナンス_ルール_1がガバナンス_ルール_2に関連する場合、ガバナンス_ルール_2は自動的にガバナンス_ルール_1に関連する。

ガバナンスルールを作成するには、IBM Cloud Pak for DataでAccess governance artifactsのユーザー権限が必要です。さらに、ガバナンス・ルールのプライマリ・カテゴリーでAdminOwnerEditorのいずれかのロールを持っている必要があります。

ガバナンスルールファイルのダウンロードとインポート

  1. Healthcare_Data-rule-csv-export.csvファイルをダウンロードします。

  2. 左上のハンバーガーメニューを開き、ガバナンスを展開し、規則をクリックします。

    ハンバーガーメニュー-ルール

  3. Add rule > Import from fileをクリックします。

    ルール - インポートを追加

  4. Add fileをクリックして、先ほどダウンロードしたHealthcare_Data-rule-csv-export.csvファイルを選択して、Nextをクリックします。

    Rules - add file

  5. 「すべての値を置き換える」を選択し、「インポート」をクリックします。

    Rules - click import

  6. ファイルからルールがインポートされます。インポートが成功すると、"The import completed successfully "という Import summary モダルが表示されます。また、ガバナンスルールの新しいドラフトが4つ作成され、エラーが発生しなかったことも表示されます。「タスクに進む」をクリックします。

    Rules - draft created

ガバナンスルールに親ポリシーを追加

  1. Task inboxに移動します。Assigned to you タブに移動し、Publish Governance rules タスクが自分に割り当てられていることを確認します。テーブルの中の機密性の高い個人情報のマスクの行を探し、詳細を見るをクリックします。

    ルール - 詳細を見る

  2. Mask Sensitive Personal Informationルールが画面に表示されます。Parent policiesの下のAdd policy +をクリックします。

    ルール - SPI - ポリシーの追加

  3. モーダルウィンドウで、Protect Sensitive Personal Informationを選択し、Addをクリックします。

    ルール - SPI - ポリシーの選択

  4. 変更が保存されたことを示す通知が表示されます。親のポリシーが更新されたら、左上のハンバーガー(☰)メニューからタスクの受信箱をクリックして、タスクの受信箱のAssigned to youタブに戻ります。

    ルール - タスクに戻る

  5. タスクに含まれる残りの3つのルールについて、親ポリシーを追加するプロセスを繰り返します。各ルールに対して、個人識別情報の保護ポリシーを選択します。

    ルール - 他の人のために繰り返す ルール - PIIを選択

ルールの公開

  1. すべてのルールのポリシーが指定されたら、ルールを公開することができます。Task inboxAssigned to youタブに戻り、Publishをクリックしてルールドラフトを公開します。

    Rules - publish draft

  2. ルールが公開されると、タスクが完了したことと管理者に通知されたことを示す通知が表示されます。

    Rules - publish successful

まとめ

このチュートリアルでは、ガバナンスアーティファクト (カテゴリー、ビジネス用語、参照データセット、データクラス、分類、ポリシー、およびガバナンスルール) について学び、ヘルスケアのユースケースに必要なガバナンスアーティファクトを作成しました。ガバナンス・アーティファクトの詳細については、IBM Cloud Pak for Data documentationをお読みください。

このチュートリアルは、An introduction to the DataOps disciplineシリーズの一部です。