Posted by & filed under R, コンピュータ関連, 分析.


ぞうさん通信、2週間分の合併号です。

今回は編集方法悩みましたが、普段ならもうちょっと大枠で分類するのですが中枠くらいで羅列することにしました。

R3.2.1がリリーズ

Rの最新バージョンであるR3.2.1が6月18日にリリースされました。コードネームは”World-Famous Astronaut”とのことです。TLで何人かすでに試した方もいるようですが、私はまだ余裕がなくて手を出しておりません…。
もし何か見掛けたらまた報告します。

SappoRo.R #4(終了&資料リンク)

6月13日に開催されました。私も参加&発表してきました。プログラムについてはこちらを、Togetterまとめはこちらをご参照ください。当日のスライドは公開されております:
– 初心者セッション(その1その2その3その4)(@kazutan)
Jupyter(主にnotebook)のご紹介(@tmaeda)
rstanで簡単にGLMMができるglmmstan()を作ってみた(@simizu706)
統計言語Rを用いた電子カルテデータの二次利用(@R_beginner)
awesome-ggplot2(@kazutan)

Jupyterにglmmstan()関数、電子カルテデータでの解析例など、非常にバラエティ豊かな内容でした。ただ、本当に始めたばかりの方も結構いたのに全力で駆け抜けてしまった初心者セッションで申し訳ございませんでした…。

Tokyo.R #48(終了&資料リンク)

6月20日に開催されました。私も参加&発表してきました。緊張しましたが非常に楽しかったです。当日のプログラムについてはこちらをご覧ください。また今回も以下の記事でまとめられております。ありがとうございます。
第48回R勉強会@東京に参加してきた – INPUTしたらOUTPUT!
発表に関連する記事などがかなりありましたので、今回のぞうさん通信でいくつかピックアップしておりますので、そちらもあわせて見ていただければと思います。

Apache Spark 1.4が公開

Sparkはインメモリ処理の分散並列フレームワークで、その最新版が公開されました。ZDNetに記事がでています。このバージョンからSparkRのサポートを公式に開始したとのことで、話題になりました。Tokyo.R #48でも早速紹介されました:
Rユーザのためのspark入門
また、以下の記事でも実際に動かした内容が紹介されています:
Spark 1.4.0 の SparkR を動かす
Spark 1.4.0 の SparkR で Quick Start してみる #rstatsj
これからの動きもまた追いかけてみたいと思います。

{glmnet}によるRidge回帰やLasso回帰など

最近私のTLでちょくちょく話題に出てくるこれらの回帰分析について、タイミングよくTokyo.R #48でも紹介されました:
5分でわかるかもしれないglmnet
正則化(ペナルティ)を”愛の鞭”と表現するところがさすが大仏様です。このスライドの最後にある参考資料から一部を取り出してみました:
Glmnet Vignette
リッジ/Ridge回帰、Lasso回帰、Elastic Net (R – glmnet) – 東京に棲む日々
RでL1 / L2正則化を実践する – 銀座で働くデータサイエンティストのブログ
おそらくこの辺りから手を付けてけばいいのかな、と思いました。

規約にまつわるエトセトラ

Rのコーディング規約については、自分の中ではちゃんとしなきゃと思いつつまともに調べてきませんでした。そんな中、Tokyo.R #48で以下の発表がありました:
規約にまつわるエトセトラ
その必要性についてわかりやすく説明されています。またここで提案されているコーディング規約については、以下の記事にまとめられています:
Rのコーディングルールについて
今後気をつけてコーディングしていこうと思います。ありがとうございます。

Data science for me

Tokyo.R #48にて、所沢義男さんが「Rを極めて個人的な意思決定に活かす」というタイトルで発表されました。この内容は非常に私の心に響き、関連記事を振り返りたいと思いました。
この主旨については、以下の記事にて説明があります:
Data scienceをきわめて個人的な意思決定に活かす – 盆栽日記
これを実践し、多くの記事やデータが公開されました。以下その一部です:
Rで部下に歩数を送りつける – 盆栽日記
下半身のデータをオープンにした – 盆栽日記
RでNHKにログインして語学の進捗を取得する – 盆栽日記
我が家のあたたかみ、そして明るさについてのデータを公開しました – 盆栽日記
靴を新調するためにランナーの靴の種類を調べる – 盆栽日記
Rで心拍数からストレスを可視化する – 盆栽日記
RでiPhoneアプリのデータを抽出する – 盆栽日記
Rで動画から笑顔判定する – 盆栽日記
私の体重データが気軽に入手できるようになりました。 – 盆栽日記
このアツさはもちろん他の人も動かします。その例として以下のような記事も公開されています:
Bayesian Estimation: Number of Steps
TokyoR 48で発表しました – 個人用データ解析備忘録
この流れはきっと(少なくともこの界隈では)きっと今後も加速すると思います。私も”Data science for me”を意識して自分の欲求を見つめなおしたいと思います。

最近出るR関連書籍3連発

ここではあまり書籍紹介はしないのですが、TLで非常に注目を集めていた書籍がホントに立て続けに出るのでメモします。

基礎からのベイズ統計学 ハミルトニアンモンテカルロ法による実践的入門
豊田先生編著のStanに関する書籍です。Rスクリプトとデータも上記リンク先からDLできるようで、非常にアツい内容になっているとのことです。6月25日発売です。
データ分析プロセス
みなさんご存知「Useful R」シリーズからです。こちらの著者はRハイパフォ本の方で、「実務に非常にキク」内容が満載とのことで、すでにTLで非常に話題となっています。6月26日発売です。
みんなのR データ分析と統計解析の新しい教科書
上記リンクの内容紹介にあるとおり、Rの基礎からモダンなデータ分析までを解説しているというすごいボリュームの一冊です。翻訳者の方々もすごいですし”Tokyo.R(協力)”という響きがかっこいいです。6月30日発売です。

その他

lubridateパッケージによる日付型データの加工 – INPUTしたらOUTPUT!
日付型データって慣れてないからいつも戸惑うことが多いのですが、こちらで紹介されている{lubridate}は便利そうですし、記事内にサンプルが豊富で助かります。
統計を始めたい人に僕がPythonよりRを勧める理由 – 蛍光ペンの交差点[別館]
タイトルの通りの内容を、とてもシンプルに記述してあってとてもよく伝わります。とはいえ私はPython使えないのでアレですが…。
RStudio1.0.0の噂…?
TLに飛び込んできたこのお話、さてどうなるのでしょう…。てかふぁぼ欄がカフェになってるw
kmeansとkmedoidsを比較してみる – gepulog
上記の内容を実際にシミュレーションして比較した記事です。後者は恥ずかしながら知らなかったです…。
確率分布いろいろ
以前ここでも紹介した、「いろんな分布のについてパラメータいじるとそれをプロットで表示してくれる、とってもすごいShinyアプリ」の本家日本語サイトが復活しました! すばらしい…。
{showtext}: Using Fonts More Easily in R Graphs
RのグラフにTrueTypeフォントやOpenTypeフォント、そしてWeb fontsなどを簡単に使えるようにするパッケージです。このREADMEにあるグラフをみてると使いたくなりますね…。
WAICを計算させてみた:Taglibro de H:So-netブログ
タイトルのとおりの内容です。最近結構な頻度でWAICの話題を見るようになりましたね…。
ラブライブの新聞全国展開 – 驚異のアニヲタ社会復帰への道
タイトルの内容をプロットしています。ラブライバーではないのでいまいちわからないですが、たまに飛び地になってるのが気になります…。
Rでお遊び:「あの花」実写ドラマ記念!あの花カラーパレットの紹介
めんまのカラーパレット、やっぱりこんな感じになるよね…健康のためにも皆さんアニメを摂取しましょう。

もし不都合およびミスがございましたら、コメントもしくは@kazutan までお知らせください。ありがとうございました。

Tokyo.Rでご紹介いただいたので、これからはなんとしても月曜中には公開できるように努めます…。

Leave a Reply

  • (will not be published)