総務省の都道府県・市区町村別統計表をデータクレンジングする

都道府県・市区町村別統計表(国勢調査)

 日本の人口統計は総務省が 5 年おきに行う国勢調査が元になっている.日本の市の人口順位をEXCELにダウンロードして散布図に描くでは日本全国の都市の人口増減率と人口の関係を時系列で流すとどう推移するか予測した.今回はその予測が実態と合っているか乖離しているかの検証を行う.

“総務省の都道府県・市区町村別統計表をデータクレンジングする” の続きを読む

Windows 上の SQL Server Management Studio から Ubuntu 上の SQL Server にデータベースを作成し,テーブルを挿入する

 Windows 環境にインストールした SQL Server Management Studio から Ubuntu にインストールした SQL Server にデータベースを作成し,テキストファイルからインポートしてテーブルを作成する方法を紹介する.

 インポートするテキストファイルは今回は日本標準食品成分表 2015 年版を使用する.第一正規形であれば何でもよい.

“Windows 上の SQL Server Management Studio から Ubuntu 上の SQL Server にデータベースを作成し,テーブルを挿入する” の続きを読む

SQL Server Management Studio 18.1でデータベースダイアグラムが復活した

SQL Server Management Studioの起動画面

 SQL Server ではデータベースダイアグラムが廃止されて久しい.テーブル間のリレーションシップなど視覚的に把握できて便利だったのになぜ廃止されたのかよく分からなかった.

 2019 年 6 月 12 日,そのデータベースダイアグラムが SQL Server Management Studio 18.1 で復活したというので,早速インストールしてみた.

関連記事

SQL Server 2017をインストールする

SQL Server 2017 デベロッパーエディションをカスタムインストールする

SQL Server Data Tools 2017 をインストールする

SQL Server 2017 Reporting Services をインストールする

SQL Serverのデータベースをバックアップから復元する

“SQL Server Management Studio 18.1でデータベースダイアグラムが復活した” の続きを読む

SPSSからSQL Serverに接続する

 SQL Server に蓄積したデータを SPSS で解析する際には一旦 EXCEL のワークシートに出力していたのだが,この一手間が面倒になってきた.SPSS のメニューを眺めていると「データベースを開く」というメニューがある.これを使えないか?と試行錯誤した結果を備忘録として記す.

“SPSSからSQL Serverに接続する” の続きを読む

気象庁のサクラ開花日のテキストファイル

サクラと少女

 4月初旬はソメイヨシノの開花に心が躍る.古い歌にあるように,

世の中にたえてさくらのなかりせば春の心はのどけからまし

 あっという間に散っていく様は日本人の心を捉えて離さない.この桜の開花日の予測は気象庁でも行われている.

 桜だけではない.生物季節観測の情報では各種の植物,動物を観測しており,過去のデータを公表している.

 時節柄,過去の桜開花日をダウンロードして検索しやすいようにしようと考えた.

 ファイルは最初に置いておく.好きに使ってくれて構わない.

004

関連記事

テキストファイルから SQL Server に気象データをインポートする

Google FormからSQL Serverへデータを移行するには

“気象庁のサクラ開花日のテキストファイル” の続きを読む

多変量解析の前に相関行列を見よう

 Excelのピボットテーブルでクロス集計から統計解析まででも書いたが,統計解析の醍醐味は多変量解析にある.単変量解析では変数間の交絡の可能性が否定できず,重要なポイントを見落とすことがある.

 統計の専門家ではないので完全に我流の方法であるが,多変量解析における変数選択の参考になるかと思い,記しておく.

 過去に査読者とのやり取りの中で,変数選択の方法をかなり具体的に指示され,その通りにしないと通さないぞという言外の圧力を感じたことがある.

 その時は違和感を感じつつもその通りにしたら通ったのだが,どうにもその違和感がずっと残っていた.いわく,単変量解析で有意になった変数のみを組み合わせて多変量解析に持ち込む,という手法だったのだが,本当にそれで良かったのだろうか?

“多変量解析の前に相関行列を見よう” の続きを読む