ネムネコは表計算ソフトを使えない!! Help me!!! [高校の統計]
ネムネコは表計算ソフトを使えない!!
NHKの「投票率、ズバリ当てます!」という記事を読んでいて、単回帰分析じゃなく重回帰分析を使えばいいじゃないかと思い、数式を作ってみた。
というn個のデータがあり、この重回帰直線を
とするにゃ。
この回帰直線(1)とから推測される値と実際のとの差を
とし、
とする。
そして、
最小2乗法では、Rが最小になるように、重回帰直線(1)の係数a、b、cを定める。
だから、
これから、a、b、cに関する次の連立方程式が得られる。
行列を使うべきだと、ddt³さんに怒られるかもしれないので、行列で書くと
この連立方程式を解けば、2重回帰直線(1)の係数a、b、cを求めることできる。
(3)は、各式の両辺をnで割り
ここで、
こちらの方が、連立方程式の意味がわかりやすくて、いいのかもしれない。
それっぽい感じになっているので、計算は間違えていないと思うが、ここまではすぐに出来た。
C言語かFortranなどで、2重回帰直線(1)を求めるプログラムを作ってとこうかと一瞬考えたのだが、「なんか面倒くさい。それに、表計算ソフトに重回帰分析をのツールがあるはずだ」と考え、2重回帰直線(1)の係数を求めてみようとしたのだけれど、ddt³さんと違って表計算ソフトを使い慣れていないネムネコは、どうやったらいいのかわからず沈没。
というわけで、表計算ソフトを用いた統計計算に詳しい奴は、ネムネコの代わりに、NHKのデータを元に2重回帰直線を求め、今回の参議院選挙の得票率を予想するにゃ。
NHKのデータを元に、重回帰直線の方程式を求めると
ここで、xは「非常に関心がある」、yは「必ず行く+期日前投票」、zは「投票率」。
したがって、
NHKの解析結果よりもネムネコがあらたに提示する予想式のほうが過去の投票率をよく再現出来ているにゃ。
そして、この予想式によると、今回の参議院選挙の投票率は46.4%だ。
ただ、この予想式の誤差は±1%くらいあるから、45.4〜47.4%くらいですかね〜。だから、今回の参院選の投票率は50%を割り込むのではないか。
コメント 0