Rドリル第5回 Rによるやさしい統計学 -第5章

Posted 2013/03/13 by kazutan & filed under Rドリル, 分析.

[`livedoor` not found]

Check

[`evernote` not found]

ちゃんとやってますから!

やっと色々な感覚がつかめてきて楽しくなってきました。この勢いを借りていきます。
今回は第5章です。

レポート

統計的仮説検定の必要性: 標本相関を例にして説明。
統計的仮説検証の手順と用語: 帰無仮説と対立仮説、TypeIエラーや検定力など。コード無し。
標準正規分布を用いた検定 (1つの平均値の検定・母分散が既知): 母分散がわかっている場合における平均値に対する検定(Z検定)の計算の流れと演習。
t分布を用いた検定(1つの平均値の検定・母分散が未知): いわゆる1サンプルのt検定。計算の流れと演習。
相関係数の検定(無相関検定): いわゆる無相関検定の計算の流れと演習。
独立性の検定(カイ二乗検定): 連関のお話とカイ二乗検定のお話。
サンプルサイズの検定結果への影響について: サンプルサイズが大きくなると有意な結果が出やすくなることを実際に検討して説明。

私的メモ・コメント

統計についての説明はかなり丁寧で、かゆいところに手が届く感じ。このあたりをわかりやすく説明するのはいつも苦労していたので参考になると思った。

今回気付いた一番大きなポイントは、「結構省略した表現でコマンド入力できるんだ」ということ。オプション名を指定せずに数値などだけで引数にしても許容してくれる。しかし初学者にはこの省略形だけを見せられても厳しいかな。ただ慣れてくると実に面倒になってくるだろうから両方に対応できるのはいいと思う。
自分で思い立って以下のことを試して確認：

論理値の指定にバリエーションがある

真値：”TRUE” “T” 1
偽値：”FALSE” “F” 0

オプションの値などで使う文字列も省略可能なものもある

例) t.test関数での片側オプションalternativeで、”greater”→”g”や”less”→”l”など

あと今回の内容を実施するときの留意点メモ：

直線を引くablineでは数式がy=bx+aであり、y=ax+bではない
chisq.testの連続性の補正オプションはデフォでONだけど毎回OFFで指定した方がいいかも。
期待度数が小さいならば素直にフィッシャーのあれを使えばいいわけで、そのコマンドは別に用意されているから。

あと、今回やっていてついにR(というかRstudioが飛んだ。
爆弾マークが出てきて旧MacOSを使っていた自分としては「おぉ?!」っとなぜか喜んだ。まあおかげで作業履歴がかなり吹っ飛んでしまったんですが致命傷ではないのでいいです。
ただこれからちゃんとワークスペースとかプロジェクトとか設定してから回すようにしないといけないなと思いました。

しかしこのドリル、本の内容を実行するのはさくっと終わるのだけど、そこから関連する内容を自分で調べたり試したりするので結構なボリュームになってくる。そしてそれをこの記事にまとめるのにかなり時間がかかってしまう。
おかげでRに慣れるという目標へは近づいていると思います‥‥が、進行が遅くなりそうです。まあ気楽に楽しく、趣味もかねて次回もやっていきますよ。

日	月	火	水	木	金	土
« 1月
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28

レポート

私的メモ・コメント

One Response to “Rドリル第5回 Rによるやさしい統計学 -第5章”

かずたん

Leave a Reply

最近のつぶやき

最近の投稿(RSS)

カテゴリー

読んだ本棚

カレンダー

アーカイブ

レポート

私的メモ・コメント

One Response to “Rドリル 第5回 Rによるやさしい統計学 -第5章”

かずたん

Leave a Reply

最近のつぶやき

タグリスト

最近の投稿(RSS)

カテゴリー

読んだ本棚

カレンダー

アーカイブ

One Response to “Rドリル第5回 Rによるやさしい統計学 -第5章”