Posted by & filed under R, コンピュータ関連, 分析.


もはや月曜に発行できる頻度の方が少ない気がしてきました。

R関連イベント

第3回広島ベイズ塾「分布感をつかむ」(終了・資料リンク)
塾生の一人が「分布感をつかみたい」とつぶやいたことから一気に開催の運びとなった企画です。負の二項分布・正規分布(+対数正規分布)・ベータ分布・コーシー分布・ポアソン分布・ガンマ分布について各自発表しました。全てのスライドは上記リンクにあります。
第50回R勉強会@東京(#TokyoR)(9/5開催)
いよいよ今週末となりました。発表題目もだいぶ出揃ってきてます。もしUst配信があるのでしたら、ぜひとも視聴したいです…。
HiRoshima.R #5(9/19)
第5回HiRoshima.Rが広島市内で9/19に開催されます。ちょっと日程的に近いですが、まだまだ余裕があります。私も発表者枠でエントリーしました。みんなで楽しみましょう!
第3回 R勉強会@比治山大(広島) #HijiyamaR(11/28)
11月28日に広島市内の比治山大学で開催します。こちらも参加枠・発表枠ともにまだ余裕があります。ぜひ軽い気持ちで参加してみましょう! コワクナンカナイヨ。

「TwitterにRでわからないことを投稿すれば答えが返ってくる」案件

こういう話がありました:


これを受け、いろんな方が動き出します。まずはキャップが以下の記事をあっという間に公開しました:
Coloring (and Drawing) Outside the Lines in ggplot | rud.is
さすがキャップです。そしてHadley氏は端的にreplyします:


{dilectlabels}を使ってみてよ、とのことです。そしてそこにRamnath氏が{directlabels}を使った例を紹介しました:



このようにあっという間に解決してしまいました。いい話ですね。

さて、こんな話は何も海外に限ったことではありません。私が眺めているTLでは頻繁にこのようなことが起こっていますし、私自身もよくアドバイスを頂いております。また今はr-wakalangというチャットルームがあります。ぜひこういうことを体験して、みんなで盛り上げて楽しんでいければと願ってます。

Rでいろんなデータを生成

Rでいろんなデータを生成できることは、すでに多くの方がご存知かと思います。ただデータといっても様々なデータがありますし、用途によってかなり変わってきます。

数値に関するランダムなサンプルデータを発生させたいときにはsample関数やrnorm関数などがよく利用されます。多くの記事がこれまで出ていますが、以下のスライドを紹介します:
Rで架空データの発生
分布から乱数を発生させたり、多変量データの作成方法も紹介してあります。

またいろんなサンプルデータを作成するパッケージも開発されています。以下の記事には{random},{passwordrandom},{stringi}が紹介されています:
Rでランダムな文字列や数値を生成する – まだ厨二病
具体例や対応表もあってわかりやすいです。

また、以下の記事では{generator}が紹介してあります:
Rで解析:いろいろなデータ例を作成「generator」パッケージ
こちらはいわゆる「ニセの個人情報(Personally Identifiable Infomation)を簡単に作成するのに特化したパッケージです。いつもありがとうございます。

この他にもRには暗号用乱数の発生向けパッケージ等、探せばまだまだたくさんあります。こういうのをぜひ有効活用していきたいです。

その他

俺俺Stan manual翻訳:4章 – Qiita
先週ご紹介した記事の続編です。私の周りでもStanを利用する方が増えているので、本当にありがたいです。
dplyr 0.4.3を触ってみる – Technically, technophobic.
CRANに{dplyr}の0.4.3が届いたそうで、その解説記事です。bind_rows()に.idを指定する機能はいいですね。
RPubs – 日本郵便提供の住所データで遊ぶ: 準備編
日本郵便提供の住所データをRで遊ぶ…ための前処理+αです。最後の出力結果(表)を見ていただければ、その威力が伝わるかと思います。すごいです。
Finite Mixture Models の誤用に注意
標記の分析について、(1)非線形な関係への留意、(2)非説明変数の分布に対する留意、を指摘した記事です。非常にわかりやすい内容です。なおこの記事について清水先生(@simizu706)よりコメントがあります。
Learning Italian with rvest and Duolingo | Mango Solutions
「あるサイトと{rvest}を使ってイタリア語をしゃべれるようになろう!」という記事です。これだけでOKなわけではないのですが、面白い考え方だなぁと思いました。多分色々応用がきくはずです。
Rのこれだけ覚えておけばいいdata.tableの使い方 – Qiita
大規模データを扱うのによく使われるdata.tableの基礎が解説してあります。fread関数はデータの読み込みが高速だったりと色んな所で重宝されているようです。なおfread関数つかいたいけどdata.tableで扱いたくない場合は以下の記事を参照してください:
fread関数を使いたい。だけどdata.tableとしては扱いたくない。 – 盆栽日記
The IQUIT R video series
“IQUIT”とは”an introduction to quantitative inference and thinking.”の略とのことで、学部生向けのRチュートリアルビデオを作成してYouTubeに公開したシリーズとのことです。内容は基礎的ですが、教材として参考になるかと思います。
leafletパッケージで地図上にランダムにマーカーを打ちつつそれを1秒おきに更新するshiny app – My Life as a Mock Quant
タイトルの通りの内容ですが、記事にある通りこれをベースにいろんなことができそうでワクワクします。
【ggmapで遊ぶ②】巡回スープカレー屋問題を解いてみた – 次元の海で溺れる
札幌駅周辺のスープカレー屋マップをRで描いた」という記事の続編で、巡回するにはどのルートで行けばいいか?を解いています。「スープカレー屋」というドメイン知識がないので私には難しいですが、次回札幌入りした際にはぜひとも参考にしたいと思います。

もし不都合およびミスがございましたら、コメントもしくは@kazutan までお知らせください。ありがとうございました。

気付けばこのぞうさん通信も9ヶ月続きました。全てはみなさんのおかげです。どこまで続くかわかりませんが気楽にやっていきます。

Leave a Reply

  • (will not be published)