はりきって第2回です。
三日坊主になることだけは避けたいと思っています、はい。
レポート
第2章 1つの変数の記述統計
記述統計の算出の仕方が中心ですね。
- 1つの変数の要約
- 数値要約に関する説明。コードなし。
- 本書で用いるデータの説明
- 例で使っているデータの説明。おもいっきりホークス選手です、けど現役でホークスにいるのは‥‥
- 変数の種類
- 量的・質的変数の説明。
- データの視覚的表現
- データをまず「見る」。
- 変数名:変数内に格納されたデータの表示
- table(対象):対象の度数分布表を出力
- hist(対象):対象のヒストグラムを表示
- 平均とは
- 平均値の説明と算出。
- sum(対象):対象の合計を算出
- length(対象):対象内のデータ個数をカウント
- mean(対象):対象の平均を算出
- 平均以外の代表値
- 中央値、最頻値の説明。
- median(対象):対象の中央値を求める
- 散布度
- 散布度の説明。
- 分散、標準偏差とは
- 分散、標準偏差の説明。そして不偏分散と標本分散についても説明。
- sqrt(対象):対象の平方根を算出
- var(対象):対象の不偏分散を算出
- sd(対象):対象の標準偏差を算出
- 分散、標準偏差以外の散布度
- 平均偏差、範囲、最大値、最小値など。
- abs(対象):対象の絶対値を算出
- max(対象):対象内のデータから最大値を求める
- min(対象):対象内のデータから最小値を求める
- 標準化
- 変数の標準化についての説明と丸め誤差の説明。コードについては特筆なし。
- 偏差値
- 偏差値の説明。コードについて特筆なし。
私的メモ・コメント
統計に関するお話は問題なし。不偏分散と標本分散について「実際に計算してみよう」という点とわかりやすさはいいなと思いました。
また丸め誤差について、ここで出てくるのかと驚きました。確かに早めにコンピュータによる計算を意識することって大切だよなぁと感じた。
コードについてはそれほど難しいものではなく、ちゃんとControl&Fを使うようにしたのでRStudioでも快適です。
さあ三日坊主にならんように次回も近日更新しますですよー。
かずたん
ブログ更新。 Rドリル 第2回 Rによるやさしい統計学(2) – http://t.co/QGa1pHJM9i