Posted by & filed under R, コンピュータ関連, 分析.


輝ける夏は帰ってこない。

Rイベント関連

HiRoshima.R #5 [9/19開催、広島市]
とうとう今週末になりました。今回は人数が少なめのようですがこじんまりと気楽に楽しめればと思っております。発表スライド早く仕上げなければ…。
統計解析ソフトウェアRの勉強会@福岡(fukuoka.R #4)[9/26開催、福岡市]
前回から少し間隔があきましたが、来週開催とのことです。福岡出身としてはぜひ行きたかったのですが、予定があわなかったです…。
第3回 R勉強会@比治山大(広島) #HijiyamaR[11/28開催、広島市]
11月28日に広島市内で開催します。いろんな統計のお話もあれば、leafletによる地図プロットなどもあります。さあさあ!!

tidyr 0.3がリリース

データ整形パッケージであるtidyrの最新版0.3が先週リリースされました:
tidyr 0.3.0 | RStudio Blog
その機能の割にはそこまで知られていない(or前身版のreshape2が使われてる)のが不思議なくらいですが、さらに色々な改良が施されています。変更点を解説した記事はこちらです:
tidyr 0.3を使ってみる – Technically, technophobic.
ただ私もまだ十全に把握していないので、そろそろ腰を据えて勉強しないと。きっと損をしてるはずだから…。

Rのランダムフォレストパッケージ比較

先週、立て続けにランダムフォレストのパッケージを比較する記事が公開されましたのでご紹介します:
RでランダムフォレストやるならRboristかrangerか – 盆栽日記
[R言語]library("ranger")とlibrary("randomForest")の速度を比較する – gepulog
新型のランダムフォレスト(Random Forest)パッケージ比較:Rborist・ranger・randomForest – My Life as a Mock Quant
この3つの記事の内容を俯瞰すると、スピードでは{ranger}のようですね。ただメモリ消費量が大きく、それぞれ利用する環境や求めるものによって変わってきそうですね。このように比較検証してくれる記事は大切な情報だと思います。

データを音で聞いてみる

いつもお世話になっている「からだにいいもの」さんから、興味深いパッケージが紹介されていました:
Rでお遊び:あなたのデータはどんな音?「audiolyzR」パッケージの紹介
散布図やヒストグラムから、データの特性を音で表現するというものです。面白いですね。また関連する記事として、4月に紹介したこちらの記事があります:
RからCsoundで音を鳴らす – Technically, technophobic.
これからはデータの可視化だけでなく可聴化もトレンドになってくる…?

Likertを可視化

Likertは調査で頻繁に用いられる手法ですが、これをうまく可視化するのは中々難しいものです。ですが先週以下のような記事が公開されました:
Recipe for Centered Horizontal Stacked Barplots (Useful for Likert scale responses) | BioStatMatt
これは中々面白い可視化だと思います。帯グラフでは誤解を与える可能性がありますが、この方法ならもっと多くの情報を伝えることができますね。ただコード(含むデータ整形)がちょっと複雑ですね…。
ちなみに同じアイデアでggplot2を用いたパターンは、以下の記事に紹介してあります:
Improved net stacked distribution graphs via ggplot2 trickery Statisfactions: The Sounds of Data and Whimsy
確かにこちらはggplot2を利用しているのですが、そうとう複雑になってますね…。
なお、楽な方法としては{HH}パッケージ内にLikert関数というのがあるらしく、以下の記事で紹介されています:
Plotting Likert Scales | Statistical Research
心理学関係者としては無視できない話なのでどうにかしたいのですが、まだ色々と整理できていないところがあるので、色々と検証してどこかでまとめたいですね。

その他

Tutorial: creating webapps with R using Shiny
Shinyを初めて使う方向けのチュートリアルです。この簡潔さは非常にいいと思います。なおこのページはR course materialというサイトの記事の一つです。いずれもその簡潔なまとめ方は参考になります。
60+ Free Books on Big Data, Data Science, Data Mining, Machine Learning, Python, R, and more
記事タイトルのとおり、これらのトピックに関連する、ネット上にあるフリーな書籍へのリンクがまとめられています。英語の勉強用のテキストに使えば一石二鳥ですね。
RPubs – SEM Path Diagrams with DiagrammeR
{DiagrammeR}パッケージで{lavaan}の出力を描いてみたという記事です。非常に興味深く可能性を感じるのですが、もうちょっとシンプルに落とし込めないかなぁと思います…うーん。
RPubs – videoplayR – a basic (for now) computer vision library for R
動画周りを直接いじれるRのパッケージはなかなか厳しいとよく聞くのですが、この記事で紹介されている{videoplayR}はc++のOpenCVをベースに作られているようです。この辺りには疎いのでよくわかりませんが、ちょっと面白そうです。
data.frameの重複した値を持つ行を取り除く – Qiita
一見地味なようですが、パッケージをインストール出来ない環境でやる方法となるとぱっと出てきません。それを処理するコードとなります。実務の場合、ネットに繋げない&環境を変えられないって事案、ありますよね…。
mecamonagi取扱説明書 – Technically, technophobic.
「機械の体はなにもteramonagiさんだけのものではありません。 Tokyo.Rにあるmecamonagiレポジトリを使えば、あなたも機械の仲間入りです。」
devtools 1.9.1 | RStudio Blog
おそらく非常に多くの方がお世話になっている{devtools}の最新版がリリースされました。大きく3点の改良があるようです。詳細については記事をチェックしてください。
Using R with Jupyter Notebooks
Jupyter NotebooksをRで使う方法についての記事です。JupyterはRMarkdonのように、コード+出力をノートのように出せるというもので、イメージとしてはIPythonに近いものではないかと思います。Jupyterの特徴はJuliaやPython、そしてRをサポートしているという点です。一度触れてみたいとは思うのですが、私はRしか使えないのでRmdで十分なんですよね…。
A quick look at BlueSky Statistics
Windows向けに開発された、GUIで分析するソフトウェアです。分析や可視化についてはR(RevolutionR)を利用しているようで、どんな使用感なのか気になります。どなたか試してみてくれませんか…。
dplyrを使いこなす!JOIN編 – Qiita
以前紹介したシリーズ「dplyrを使いこなす!」の続編で、データフレームの結合に関してまとめてあります。ありがとうございます。
Plotly Blog – Analyze Data: Five Ways You Can Make Interactive Maps
インタラクティブな地図にプロットする方法を、5つ紹介しています。知らないパターンもあったので興味深いです。
comic phylogenetic tree with ggtree and comicR | YGC
決定木の出力を{ggtree}と{comicR}を使ってコミック調にしてみたよっという記事です。{comicR}、興味深いですね…。
Roll Your Own Stats and Geoms in ggplot2 (Part 1: Splines!) | rud.is
「ggplot2で、自分自身のstat_*やgeom_*を作ってみないかい?」というお話です。アツいですね。
Rでお遊び:シャーロットに想いを馳せて。彗星軌道の作成?
シャーロットも残りあと2話ですね…。

Leave a Reply

  • (will not be published)