Skip to content

次のステップ

地理空間データ

地理空間データとは、他の特徴に加えてレコードの地理的な位置に関する情報を含むデータセットのことです。例えば、いくつかの都市とその人口規模に関する情報を含み、さらに緯度と経度の座標を示す2つの列を含むデータセットは、地理空間データとみなされます。地理空間情報は、都市間の距離を調べたり、近隣の平均世帯収入を計算したり、地図を作成するなど、多くの余分な情報を推論するのに役立ちます。

一般的に、地理空間データは、ベクターデータとラスターデータの2つの方法で表現されます。

ベクトルデータ

ベクトルデータとは、空間要素を x 座標と y 座標で表現したものです。ベクトルデータの最も基本的な形は point です。ベクトルデータの最も基本的な形は「点」で、2つ以上の点は「線」、3つ以上の線は「多角形」となります。例えば、都市の位置は点(x、y座標)で定義できますが、実際には都市の形にはもっと多くの情報が含まれています。道路は線で表現され、線の始点と終点を表す2つの点で構成されます。また、建物や地域、都市の境界線など、あらゆる形の形状を表すポリゴンもたくさんあります。

ラスターデータ

ラスターデータは、地理空間データの一種で、幾何学的な位置に関する情報をグリッドやマトリックスの形で含んでいます。これらの行列は、属性の種類や数によっては多次元となり、各次元が特徴を表し、その中の各ピクセルには特徴を表す値が含まれています。例えば、ある都市の気象情報を多次元配列で表現したデータセットには、気温、相対湿度、風速などの情報が含まれます。衛星画像など、地理的な位置を表す画像もラスタデータの一種です。

netCDF、PNG、JPEG、TIFF、バイナリファイルなどがラスターデータの一例です。データタイプの広範なリストは、ラスターデータファイルフォーマットリストにあります。

もっと詳しく

Pythonを使った地理空間データの扱い方について詳しく知りたい方は、Data analysis using Pythonのラーニングパスをご覧ください。