Posted by & filed under R, コンピュータ関連, 分析.


3ヶ月空いてしまいました、が復活します。

あまりに間隔が空いてしまったので、ここ1,2ヶ月の記事を中心にまとめています。ご了承ください。

R3.3.0リリースとR3.3.1プレリリース

上記バージョンが5月上旬にリリースされました。主な変更点についてはこちらをご覧ください。

また、次期バージョンのR3.3.1について、プレリリースバージョンが2016/6/11から、最終リリースバージョンが2016/6/21に予定されています。早すぎる…。

R関連イベント

第53回R勉強会@東京(#TokyoR)(終了・資料など)
4/30に都内で開催されました。当日の発表で公開されたスライドなどのまとめはこちらでまとまっています:
第53回R勉強会@東京で発表してきた – INPUTしたらOUTPUT!
私も久々に参加してLTしてきましたが、まさかの大物登場やいろいろなネタがあって非常に楽しかったです。やはりTokyo.Rは楽しいです。
第4回 R勉強会@比治山大(広島) #HijiyamaR(終了・資料など)
5/28に広島市内で開催しました。当日の発表スライドは全て公開され、上記受付サイトの右側に「外部リンク」として設置しています。発表の半分が自分だというのはご勘弁ください。次回は11月を予定しています。
Kandai.R #1(6/18, 関西大学千里山キャンパス)
上記日程で開催されます。第一回というのにすでに60人以上の参加者というのはすごいです。私もR Markdownの導入的なお話をしてくる予定です。
第54回R勉強会@東京(#TokyoR)(6/19, 東京都内)
上記日程で開催されます…が、ATNDが立ってから24時間持たずに定員が埋まり、さらにこの補欠申し込み数…なんという…。
Kobe.R #25(6/26, 大阪近郊で調整中)
上記日程で開催されます。今回は気象の観測データを扱う天博さんとの共催とのことで、終了後懇親会も企画されているとのことです。興味深いのですが、この日はこちらにて発表する予定なので無理です…。
SappoRo.R #6(7/9, 北海学園大学豊平キャンパス)
上記日程で開催されます。今回も参加&発表してきます。ただこの時期札幌のホテル事情がかなり厳しく、たぶんもうほとんど残ってないはず…。

ベイズ、MCMC関連

前回の更新以降も、国内・国外あちこちでベイズ関連の記事がたくさん公開されています。その中から見つけたものをピックアップします。

Bayesian Population Analysis using WinBUGSのコードをStanに移植してみる(完了):Taglibro de H:So-netブログ
これまで何度かご紹介してきた、この移植シリーズが完走して、StanのGitHubにも取り込まれとのことです。またこの本の日本語訳が出版されたそうです。要チェックですね。
Stanのマニュアル日本語訳プロジェクト – StatModeling Memorandum
国内の有志によって軽族されている上記プロジェクトですが、順調に進んでいるようです。RStanを始めてみたいという方は、このブログ記事にある参考リンクなどをチェックしてみるのをおすすめします。
統計学勉強会 – connpass
統計学や機械学習の勉強・輪読を行っている勉強会で、「基礎からのベイズ統計学 ハミルトニアンモンテカルロ法による実践的入門」の輪読会が開催されておりました。公開・登録された資料がリンクであります。
Stan超初心者入門 | Sunny side up!
主に心理統計的なものを中心に、関学の清水先生が初心者入門を作成して公開しています。なお、同じく清水先生が作成した心理学者向けのベイズ統計入門スライドはこちらです。あわせて読むのをおすすめします。
一般化正規分布をStanで定義してMCMCしてみる | Sunny side up!
Stanで定義されていない一般化正規分布を自力で実装してMCMC(;´Д`)ハァハァするという記事です。今日も平和です。
ベイズ情報量規準及びその発展 ~概説編~ | ALBERT Official Blog
ベイズ情報量基準とその発展について、その概説をまとめた記事です。連載ということなので、今後が楽しみです。
StanとRでレプリカ交換MCMC(parallel tempering) を実行する – StatModeling Memorandum
上記手法について、その実装コードと参考資料リンクが掲載されています。またこの内容はTokyo.Stanの「Michael Betancourt’s Stan Lecture」にて発表されました。
Dealing with latent discrete parameters in Stan
こちらもTokyo.Stanの「Michael Betancourt’s Stan Lecture」にて発表されたスライドです。サンプルと対応するコードを示してあり、わかりやすいと思います。
StanのマニュアルをKindleで読みたい – Technically, technophobic.
タイトルのとおりで、Stanのマニュアルを電子書籍形式で作るという記事です。Kindleでも読みたいという方は試してみてはいかがでしょうか。

mxnetライブラリ

DeepLearningライブラリのひとつである{mxnet}ライブラリについて、いくつか記事が公開されていましたのでピックアップしました:
Deep Learningライブラリ{mxnet}のR版でConvolutional Neural Networkをサクッと試してみた(追記3件あり) – 東京で働くデータサイエンティストのブログ
Deep Learningライブラリ「MXNet」のR版をKaggle Otto Challengeで実践してみた – Think more, try less
Mxnetで回帰 #TokyoR 53th
いつか自分が使えるようになるためにも、これから記事を積極的に収集していきたいと思います。

最近のRStudioとR Markdown関連

みんな大好きRStudioもどんどん進化しており、Preview版ではいろいろ追加されています。またR Markdown関連で新しいことが追加されています。そのいくつかを紹介します:

RStudioをプロファイリング
コードを実行する際、処理のどこでどれだけメモリが消費され、そして時間がかかっているかを測定できるとはかどりますね。それを実現する機能が追加されました。詳細はこちらをご覧ください。
R notebook機能の実装
Rmdはこれまでレンダリングしないと、そのRチャンクの出力が確認できませんでした。GitHub版の{rmarkdown}パッケージとPreview版のRStudioを利用すると、**notebook機能としてその場で出力内容が見ることができます**。詳しくはこちらをご覧ください。
この機能を有効にすると、Rmd内のRチャンクを評価するとRConcoleに送られて、その出力内容がチャンクのすぐ下に表示される、という感じです。割と面白い機能ですが、まだRStudio公式でオープンになっていないので、今後も経過を観察したいと思います。
ダッシュボードがRmdで作成可能
{rmarkdown}パッケージの最新版と{flexdashboard}パッケージを利用することで、あのダッシュボードを簡単に作成できます。RStudio公式ブログでの紹介記事はこちらで、公式ドキュメントはこちらです。Rmdの基礎がある方なら驚くほど簡単に作成できるでしょう。先日Tokyo.RでLTした時に紹介したサンプルはこちらです。かなりおもしろいです。
RStudioアドインのリスト
ちょっと前にRStudioにアドイン機能が搭載されたのですが、そのアドインを探すのはなかなかに難しいのが現状です。それを探しやすくする{addinslist}パッケージが公開されました。紹介記事はこちらを参照してください。

Visualization関連

今回もggplot2やインタラクティブな可視化に関する記事がたくさん公開されています。その中からいくつかを:

Using geom_step – Win-Vector Blog
ggplot2にはgeom_step()というのが実装されているのですが、実際に使ってあるのはあまりみかけません。この記事はこれに着目して、その使い方を少迂回しています。
ggplot2で円を描く – Technically, technophobic.
私もいろいろ試してみてましたが、意外と難しかったです。まだまだ修行が足りないので精進します…。
ggplot2の軸を上付きのべき乗で書きたい – My Life as a Mock Quant
上記内容について、その試行錯誤の過程まで紹介してありすごく助かります。どうかこれをggplot2逆引きで…。
ggplot2 docs completely remade in D3.js
タイトルのとおりです。Plotlyなどで実装されているようですね。
heatmaply: interactive heat maps (with R) | R-statistics blog
plotlyを使ってヒートマップを描く{heatmaply}パッケージを紹介した記事です。plotly、きてますねぇ。
Visualizing Bootrapped Stepwise Regression in R using Plotly
タイトルのとおりで、ステップワイズ回帰をこんな感じで可視化してくるとは…自分がこれを使ってた時代では考えられなかった(

その他

気象庁震源リスト( 平成28年(2016年)熊本地震 ) | 統計ソフトRの備忘録2 0102
4月に熊本・大分地域で発生した一連の地震について、気象庁のデータを元に可視化した記事です。こうやってみると、ほんとにはっきりとわかりますね。。
データ分析環境の構築にDockerを利用しよう – Qiita
Dockerベースで分析環境(PythonやR)を構築する手順が説明されています。私自身は現在Vagrantで分析環境を構築するようになったのですが、そろそろDockerも試してみたいです。チェックします。
RでGPU を使う – 驚異のアニヲタ社会復帰への道
結構近い環境なので、現行メインマシンでちょっと試してみたいです。
一般化線形モデル周りのRのパッケージと関数まとめ – 今週も特にありません
あらためて見ると、めっさたくさんありますね…こういうまとめがあると助かります。
Ubuntu 16.04でRStudio Serverを動かす – Technically, technophobic.
上記の手順を紹介しています。私もXenial上で使ってますが、これまで慣れている人であれば特に問題なく使えるんじゃないかなと思います。
一つのコードファイル中での複数パッケージの読み込みを容易にする – Qiita
表記の内容を簡単にしてくれる{needs}パッケージの紹介です。これ便利ですね。
Home – RWeekly.org
RコミュニティでのR関連記事をWeeklyで紹介するサイトです。最深のトピックが世界中から集まっているようで、GitHubで運用しています。Draft記事へPullRequestを受け付け、時期が来たら公開するという手続きをとっているようですね。また循環するリストが増えました(
R Tools for Visual Studio 0.3 now available
タイトルのとおりです。私は一貫してRStudio派なのですが、これは正直試したい。どなたか試して日本語で紹介してほしい…。
🍭hoxom task view (ホクソエム一周年記念) – まだ厨二病
もうあれから一年以上が経過したんですね……。
Rを使って福岡市の人口密度ランキング(町丁目単位) – Rプログラミングの小ネタ
私の故郷である福岡市でのデータです。ほぼすべての地名が理解できるあたり故郷なんだなぁと思うと同時に、このように数値化してみてわかることも多いなと思いました。
【sp,deldir,leaflet】あなたの全てを知りたい編~Polygon内に含まれるポイントデータを集計~ – 次元の海で溺れる
記事冒頭の「本日のテーマ」のところに目的がわかりやすく図示してあるのですが、ボリューム満点ですね。こういう記事はほんとに楽しいです。
ヘルスプラネットからデータを取得するパッケージを作った – My Life as a Mock Quant
タニタさんが運営する「ヘルスプラネット」というサービスでAPIが公開されているそうで、これを叩けるパッケージを大仏様が開発されたとのことです。最近ヘルス方面がすごいですね。
歩数データから行動パターンを抽出する話 – 盆栽日記
fitbitによる歩数データをベースに、これまで取得したデータも含めて「じぶんマイニング」を行った報告です。自分も自分のためにマイニングしたい…。

もし不都合およびミスがございましたら、コメントもしくは@kazutan までお知らせください。

しばらく更新できなかったのは、単に自分が余裕がなくなってしまったからでした。今後もあまり余裕はないのですが、せめて月1くらいには戻したいと思います…はい。

Leave a Reply

  • (will not be published)