概要
新しいジオパックを作成するには、パック生成用にデータをYellowfinに送信する必要があります。このページでは、ジオパックの作成に必要なファイルについて説明します。
ジオパックには、以下のファイルが必要です。
- パック内の地理階層ごとに、ジオメトリと表示名を含むCSVファイル
- 地理階層の最下層のデモグラフィックの名前と値を含むCSVファイル(上位層が使用される場合はYellowfinで自動的にこれらの値が集計されるため、最下層だけが必要)
- 各CSVの関連付けを指定するメタデータファイル
例
このページでは、例として、オーストラリアのジオパックを作成するシナリオを検証します。地理階層には以下の3階層があります。
- 州
- 郵便番号
- 郊外
このパックには以下の5ファイルが必要です。
- State(州)のジオメトリと表示名を含むCSVファイル
- Postcode(郵便番号)のジオメトリと表示名を含むCSVファイル
- Suburb(郊外)のジオメトリと表示名を含むCSVファイル
- Suburb(郊外)のデモグラフィックの名前と値を含むCSVファイル
- 各CSVの関連付けを指定するメタデータファイル
ジオメトリと表示名のCSVファイル
命名規則
ジオメトリと表示名を含む各CSVは、同じ名前に続けて、アンダースコアと、パック階層におけるCSVの順序を示す数値を付加する必要があります。
例
例として作成するオーストラリアのジオパックの場合、ジオメトリと表示名のCSVファイルは以下の名前にします。
- auspack_1.csv - 階層のState情報が含まれます。
- auspack_2.csv - 階層のPostcode情報が含まれます。
- auspack_3.csv - 階層のSuburb情報が含まれます。
ファイルの書式
各CSVは、データが以下の構造になっている必要があります。
- 1行目は階層のラベルです。
- 2行目は各表示名カラムのラベルです。ポイントカラムとポリゴンカラムのラベルは含めません。
- 残りの行は以下のようにします。
- 表示名を含むカラム(特定の階層に任意の数の表示名を指定することができます。表示名の数が階層によって違ってもかまいません)。
- CSVが階層の最上位ではない場合は、関連付けのために、その行が属しているすぐ上位の層の表示名の値を示すカラム(列)が必要です。
注意:各階層に複数の表示名がある場合もあるので、関連付ける表示名は後述のメタデータファイルで定義します。 - 図の中心を含む1カラム。
- ポリゴンを含む1カラム(階層にポリゴンが必要ないか、階層でポリゴンを使用できない場合は、空にすることも可能です。このカラムを使用する場合は、すべての行にポリゴンが含まれる必要があり、空白を残すことはできません)。
階層1の例
この例では、最上位のStateのCSVを作成するとき、State NameとState Codeの2つの表示名を使用することにしました。ファイルは以下のようになります。
"State" "State Name","State Code" "New South Wales","NSW","<WKT Point>","<WKT Polygon>" "Victoria","VIC","<WKT Point>","<WKT Polygon>" ... etc ...
注意:上記の例に示す<WKT Point>テキストと<WKT Polygon>テキストはプレースホルダーであり、実際にはポイントとポリゴンのデータが必要です。WKTでは、座標が緯度、経度の順序になっている必要があります。
階層2の例
第2階層のPostcodeのCSVには1つの表示名を含め、State階層のState Codeフィールドに関連付けることにします。ファイルは以下のようになります。
"Postcode" "Postcode" "2000","NSW","<WKT Point>","<WKT Polygon>" "2009","NSW","<WKT Point>","<WKT Polygon>" ... "3000","VIC","<WKT Point>","<WKT Polygon>" "3008","VIC","<WKT Point>","<WKT Polygon>" ... etc ...
階層3の例
第3階層のSuburbのCSVには1つの表示名を含め、Postcode階層の唯一の表示名であるPostcodeに関連付けます。ファイルは以下のようになります。
"Suburb" "Suburb Name" "Sydney CBD","2000","<WKT Point>","<WKT Polygon>" "Darling Harbour","2000","<WKT Point>","<WKT Polygon>" "Haymarket","2000","<WKT Point>","<WKT Polygon>" "Darling Island","2009","<WKT Point>","<WKT Polygon>" ... "Melbourne CBD","3000","<WKT Point>","<WKT Polygon>" "Docklands","3008","<WKT Point>","<WKT Polygon>" ... etc ...
CSV形式のデモグラフィックファイル
命名規則
このCSVファイルには、最下層のデモグラフィックの値を含めます。ファイル名は、各階層のCSVと同じ名前に続けて、アンダースコアと「demo」を付加する必要があります。
例
例として作成するオーストラリアのジオパックの場合、CSV形式のデモグラフィックファイルの名前は以下のようになります。
- auspack_demo.csv - Suburbのデモグラフィックの値が含まれます。
ファイルの書式
パックに含まれるデモグラフィックデータは、その地理的範囲で活用できる人口調査統計に関連するさまざまな値を表します。このCSVは、データが以下の構造になっている必要があります。
- 1行目はデモグラフィックラベルの一覧です。
- 残りの行には、各デモグラフィックの値に加えて、最下層のどの値に属しているかを指定するカラムが含まれます。
例
この例では、デモグラフィック情報を最下層のSuburb階層に関連付ける必要があります。最下層の表示名は1つだけなので、これを使用して各行を識別します。複数の表示名がある場合は、1つを選択する必要があります。いずれの場合も、この関連付けを、後述のメタデータファイルで指定する必要があります。
"Population","Median Income" 14308,75000,"Sydney CBD" 28371,60000,"Melbourne CBD" ... etc ...
メタデータファイル
命名規則
各CSVの関連付け情報を含むこのファイルでは、各CSVと同じ名前を接頭文字や拡張子なしで使用します。
例
例として作成しているオーストラリアのジオパックの場合、CSV形式のメタデータファイルの名前は以下のようになります。
- auspack - 各CSVファイル間の関連付けに関する情報が含まれます。
ファイルの書式
このファイル内のメタデータでは、パックを正常に作成できるように、階層とデモグラフィックのCSVの相互の関連付けを定義します。
- 1行目には、階層のCSV間の関連付けが含まれます。子階層ごとに1行あります。2つの数値をカンマで区切ります。
- 最初の数値は、関連付けるフィールドが、親階層のファイルのどのカラムであるかを示します。
- 2つ目の数値は、関連付けるフィールドが、子階層のファイルのどのカラムであるかを示します。
- 最後から2行目は、最下層とデモグラフィックのCSVの間の関連付けを示します。
- 最後の行は、デモグラフィックのメトリック(数値)の集約方法を示します。使用可能な値は、「AVG」、「SUM」、「MAX」、および「MIN」です。この値は、デモグラフィックのCSVでのフィールドの順序と同じ順序になっている必要があります。
注意:ファイル内の階層が1つだけの場合、またファイルにデモグラフィック情報が含まれない場合は、このデータを関連付けるメタデータの行を省きます。
例
この例では、3つの階層と、デモグラフィック情報があります。このため、メタデータファイルに以下の情報が必要です。
- 1行目ではState階層とPostcode階層を関連付けます。
Postcodeファイルの関連付けフィールドはState Codeフィールドです。State CodeはStateファイルの2つめのカラムであり、関連付けるフィールドはPostcodeファイルの2つめのカラムです。したがって、この行は2,2
になります。 - 2行目ではPostcode階層とSuburb階層を関連付けます。
Suburbファイルの関連付けフィールドはPostcodeフィールドです。PostcodeはPostcodeファイルの1つめのカラムであり、関連付けるフィールドはSuburbファイルの2つめのカラムです。したがって、この行は1,2
になります。 - 3行目では、Suburb階層とデモグラフィックデータを関連付けます。
デモグラフィックファイルの関連付けフィールドはSuburb Nameフィールドです。Suburb NameはSuburbファイルの1つめのカラムであり、関連付けるフィールドはデモグラフィックファイルの3つめのカラムです。したがって、この行は1,3
になります。 - 4行目では、デモグラフィックファイル内の各メトリック(数値)の集約方法を指定します。
Populationの値は合計し、Median Incomeは平均値を求めるので、行はSUM,AVG
になります。
2,2 1,2 1,3 SUM,AVG