国土数値情報の洪水浸水想定区域データをSQL Serverにアップロードし郵便番号から検索する

SQL Server

 地球温暖化に伴い,台風の大型化や洪水被害の拡大が懸念されている.今回は国土交通省の公表している洪水浸水想定区域データを SQL Server にアップロードしたのでその経緯を報告する.

 このデータは2022年9月時点で令和3年のものであり,毎年更新されていくものと思われる.関係各位はデータ更新が大変だろうが,頑張っていただきたい.

“国土数値情報の洪水浸水想定区域データをSQL Serverにアップロードし郵便番号から検索する” の続きを読む

階乗の自然対数を求めるユーザー定義のスカラー値関数をSQL Serverで定義する

SQL Server

 Fisherの直接確率を求める際,階乗の計算が必要になる.しかし,引数が最大でも170までと使い勝手が良くない.これはプログラム言語の種類にかかわらず,データ長の制約が原因である.今回は対数を用いて階乗計算の引数の限界を超えるアイデアを共有したい.

“階乗の自然対数を求めるユーザー定義のスカラー値関数をSQL Serverで定義する” の続きを読む

Shape2SQL でシェープファイルを SQL Server 2008 R2 にアップロードする

SQL Server の空間結果

 Shape2SQL は以前の記事でも触れたが,ESRI 社の Shape ファイルを SQL Server のテーブルに直接アップロードしてくれるツールである.残念ながら更新は停止しており,最新の SQL Server とは互換性がない.今回,SQL Server 2008 R2 を新規インストールしたところ,アップロードがうまく行ったので報告する.

“Shape2SQL でシェープファイルを SQL Server 2008 R2 にアップロードする” の続きを読む

第 2 章 SQL Server 2008 で空間データを実装する (Beginning Spatial with SQL Server 2008)

 前章では,空間参照系の背後にある理論を紹介し,異なる種類のシステムが地球上の特徴を記述する方法を説明した.本章では,これらのシステムを適用して SQL Server 2008 における新しい空間データ型を使って空間情報を蓄積する方法を学んでもらう.

“第 2 章 SQL Server 2008 で空間データを実装する (Beginning Spatial with SQL Server 2008)” の続きを読む

今後25年間の日本の都市の将来推計人口を EXCEL VBA で描く

データ系列のマーカースタイルを消去

 これまでは日本の都市人口の過去の推移を見てきた.総務省には日本の都市人口の推移予測がある.今回はこのデータをグラフにする.

 データを可視化するにあたり,重要なのは引き算である.強調すべき系列のみを強調するために,VBA の知識が欠かせない.

 グラフの系列にデータラベルを表示する方法にはいくつかある.

“今後25年間の日本の都市の将来推計人口を EXCEL VBA で描く” の続きを読む

総務省の都道府県・市区町村別統計表をデータクレンジングする

都道府県・市区町村別統計表(国勢調査)

 日本の人口統計は総務省が 5 年おきに行う国勢調査が元になっている.日本の市の人口順位をEXCELにダウンロードして散布図に描くでは日本全国の都市の人口増減率と人口の関係を時系列で流すとどう推移するか予測した.今回はその予測が実態と合っているか乖離しているかの検証を行う.

“総務省の都道府県・市区町村別統計表をデータクレンジングする” の続きを読む

多変量解析の前に相関行列を見よう

 Excelのピボットテーブルでクロス集計から統計解析まででも書いたが,統計解析の醍醐味は多変量解析にある.単変量解析では変数間の交絡の可能性が否定できず,重要なポイントを見落とすことがある.

 統計の専門家ではないので完全に我流の方法であるが,多変量解析における変数選択の参考になるかと思い,記しておく.

 過去に査読者とのやり取りの中で,変数選択の方法をかなり具体的に指示され,その通りにしないと通さないぞという言外の圧力を感じたことがある.

 その時は違和感を感じつつもその通りにしたら通ったのだが,どうにもその違和感がずっと残っていた.いわく,単変量解析で有意になった変数のみを組み合わせて多変量解析に持ち込む,という手法だったのだが,本当にそれで良かったのだろうか?

“多変量解析の前に相関行列を見よう” の続きを読む

Google Formで条件分岐するアンケートを作成する

 Googleスプレッドシートのフォームでアンケートを作ってみたでは,第 1 正規形でアンケートを取る方法を説明した.今回は選択肢によって質問を条件分岐させる方法について説明する.題材は国際標準化身体活動質問票 (IPAQ) である.

 IPAQ とは International Physical Activity Questionnaire の略である.short 版と long 版がある.一週間の身体活動を思い出してもらい,仕事,移動,家庭,余暇の 4 つのドメインごとに身体活動をメッツ・分/週の単位に変換してサブスコアにし,最終的にそれらを合算して総身体活動量を算出する.

 総身体活動量および活動日数により 3 つのカテゴリーに分類される.低身体活動 (low), 中身体活動 (moderate), 高身体活動 (high) である.

関連記事

IPAQガイドラインをクエリで表現するには

国際標準化身体活動質問票のデータ処理および解析に関するガイドライン

Google FormからSQL Serverへデータを移行するには

“Google Formで条件分岐するアンケートを作成する” の続きを読む