Posted by & filed under Rドリル, 分析.


はりきって第2回です。

三日坊主になることだけは避けたいと思っています、はい。

レポート

第2章 1つの変数の記述統計

記述統計の算出の仕方が中心ですね。

1つの変数の要約
数値要約に関する説明。コードなし。
本書で用いるデータの説明
例で使っているデータの説明。おもいっきりホークス選手です、けど現役でホークスにいるのは‥‥
変数の種類
量的・質的変数の説明。
データの視覚的表現
データをまず「見る」。
  • 変数名:変数内に格納されたデータの表示
  • table(対象):対象の度数分布表を出力
  • hist(対象):対象のヒストグラムを表示
平均とは
平均値の説明と算出。
  • sum(対象):対象の合計を算出
  • length(対象):対象内のデータ個数をカウント
  • mean(対象):対象の平均を算出
平均以外の代表値
中央値、最頻値の説明。
  • median(対象):対象の中央値を求める
散布度
散布度の説明。
分散、標準偏差とは
分散、標準偏差の説明。そして不偏分散と標本分散についても説明。
  • sqrt(対象):対象の平方根を算出
  • var(対象):対象の不偏分散を算出
  • sd(対象):対象の標準偏差を算出
分散、標準偏差以外の散布度
平均偏差、範囲、最大値、最小値など。
  • abs(対象):対象の絶対値を算出
  • max(対象):対象内のデータから最大値を求める
  • min(対象):対象内のデータから最小値を求める
標準化
変数の標準化についての説明と丸め誤差の説明。コードについては特筆なし。
偏差値
偏差値の説明。コードについて特筆なし。

私的メモ・コメント

統計に関するお話は問題なし。不偏分散と標本分散について「実際に計算してみよう」という点とわかりやすさはいいなと思いました。

また丸め誤差について、ここで出てくるのかと驚きました。確かに早めにコンピュータによる計算を意識することって大切だよなぁと感じた。

コードについてはそれほど難しいものではなく、ちゃんとControl&Fを使うようにしたのでRStudioでも快適です。

さあ三日坊主にならんように次回も近日更新しますですよー。

One Response to “Rドリル 第2回 Rによるやさしい統計学 -第2章”

Leave a Reply

  • (will not be published)