タグ: With

2025年9月18日2025年9月17日

医療機関番号，区分点数コードから全国の医療機関コードを生成する

　先の投稿では医科と歯科のファイルの分類が誤っていた．今回，正しく分類し直したので再度投稿する．

“医療機関番号，区分点数コードから全国の医療機関コードを生成する” の続きを読む

2024年10月31日2024年10月16日

SQL Serverでサブクエリとウィンドウ関数とのパフォーマンスを比較する

　SQL Serverでサブクエリとウィンドウ関数のパフォーマンスを比較した．用いたデータベースはHeatStrokeDBで，熱中症の搬送人員と最高気温との相関関係を可視化し閾値をχ二乗検定するで作成したものである．

　比較するツールはSET STATISTCS PROFILE ONコマンドである．クエリストアは筆者の環境では機能しなかった．

“SQL Serverでサブクエリとウィンドウ関数とのパフォーマンスを比較する” の続きを読む

2024年10月17日2024年10月15日

SQL Serverで空間インデックスを設定し空間演算を高速化する

　データベースのテーブルに適切なインデックスを設定するのはクエリを高速化するうえで重要な施策である．今回，空間演算にコストがかかっていたクエリが空間インデックスの設定により高速化したので報告する．

“SQL Serverで空間インデックスを設定し空間演算を高速化する” の続きを読む

2024年10月3日2024年10月2日

SQL Serverの再帰共通テーブル式で連番を作成する

　標準SQLが再帰共通テーブル式に対応したのはSQL:1999からである．今回はSQL Serverの再帰共通テーブル式で連番を作成する．日付の連番も作成してみる．

“SQL Serverの再帰共通テーブル式で連番を作成する” の続きを読む

2023年9月21日2023年7月21日

二乗平均平方根誤差で回帰モデルの当てはまりを検討する

　二乗平均平方根誤差とは英語では Root Mean Squared Error (RMSE) と書く．真値と予測値との乖離（誤差）を二乗し，その平均値をとり，その平方根を求めた値のことである．非負の値を取り，0に近いほど優れたモデルであることを示唆する．

　今回使用するのはe-Statからの社会疫学的指標を加えて熱中症搬送人員数を分析するで使用したデータベースである．先の記事では回帰モデルを評価する指標が必要との認識であった．

“二乗平均平方根誤差で回帰モデルの当てはまりを検討する” の続きを読む

2023年9月14日2023年7月16日

社会疫学的指標を考慮した都道府県別の熱中症搬送人員数の予測と実際

　都道府県別の熱中症搬送人員数の予測と実際をEXCELの組み合わせグラフで描くでは独立変数として日最高気温，日平均水蒸気圧，65歳以上人口，人口密度を投入し都道府県別の熱中症搬送人員数を予測した．以前の記事ではe-Statからの社会疫学的指標を加えて熱中症搬送人員数を分析した．社会疫学的指標としては日最高気温，日平均水蒸気圧，都道府県人口に加えて過去30日間の平均気温，エアコン保有台数，年間収入のジニ係数，光熱・水道費，実収入，第1次産業就業者比率，第2次産業就業者比率，都市公園数，都市緑化割合，自然公園割合，自然公園数，生活保護被保護人員である．

　今回は社会疫学的指標を独立変数として加えた熱中症搬送人員数の予測と実際を示す．

“社会疫学的指標を考慮した都道府県別の熱中症搬送人員数の予測と実際” の続きを読む

2023年8月31日2023年7月10日

e-Statからの社会疫学的指標を加えて熱中症搬送人員数を分析する

　総務省の公開しているe-Statには社会疫学的指標が多く含まれる．今回熱中症搬送人員数に様々な指標を加えて解析してみた．

　説明変数として日最高気温，日平均水蒸気圧，都道府県人口に加えて過去30日間の平均気温，エアコン保有台数，年間収入のジニ係数，光熱・水道費，実収入，第1次産業就業者比率，第2次産業就業者比率，都市公園数，都市緑化割合，自然公園割合，自然公園数，生活保護被保護人員を加えた．

　すべての変数が有意であったが，VIFを見ると多重共線性を疑わせる変数もあり，良いモデルとは言えない結果となった．

“e-Statからの社会疫学的指標を加えて熱中症搬送人員数を分析する” の続きを読む

2023年2月2日2022年10月21日

国土数値情報の二次医療圏テーブルの文字化けを解決する

　前回の記事（国土数値情報の令和2年の医療圏データの文字化けが直っていた）では国土数値情報の医療圏データで四苦八苦した様子を掲載した．今回は二次医療圏テーブルの文字化けの解決を試みる．

“国土数値情報の二次医療圏テーブルの文字化けを解決する” の続きを読む

2023年1月12日2022年11月2日

第14章　インデックス作成 (Beginning Spatial with SQL Server 2008)

　効率的なインデックス作成は，迅速かつ効率的に結果を探索するデータベースアプリケーションを作成するために重要である．空間データを蓄積するためにデザインされる geometry 型および geography 型に加えて，SQL Server 2008 はまた空間データを使用するための新しいインデックスの型を含んでおり，それは（驚くべきことでもないが）空間インデックスと呼ばれる．本章では空間インデックスがどのように動作し，空間インデックスを使って空間クエリの速度をどのように改善するか説明する．

付記　SQL Server の汎用クラスター化インデックスおよび非クラスター化インデックスは多くの異なるデータ型のインデックスを作成するのに使われ，そこには int 型，char 型および datetime 型を使って蓄積される値を含んでいる．しかし，空間インデックスはgeometry 型および geography 型の列の上でしか作成されず，これらのデータ型の列にのみ空間インデックスは追加できる．

“第14章　インデックス作成 (Beginning Spatial with SQL Server 2008)” の続きを読む

2021年5月13日2021年2月24日

QGIS から SQL Server へデータをアップロードする際の勘所

　QGIS から SQL Server 2008 R2 に空間データをアップロードする際には Shape2SQL というツールを使った．便利なツールではあるが，国土数値情報の河川データの属性テーブルの日本語が文字化けするという問題を抱えており，何とかならないかと試行錯誤した結果を備忘録として投稿する．

“QGIS から SQL Server へデータをアップロードする際の勘所” の続きを読む