Rでドキュメントを生成しよう

Kandai.R #1

2016/06/19

自己紹介

基本データ

比治山大学短期大学部
@kazutan
(Twitter, GitHub, Qiita)
http://kz-md.net/
http://blog.kz-md.net/

icon

今日のお話

Rでドキュメント生成

Rはデータ解析
実はRでドキュメントを生成することが可能
- R Markdownを利用
- その便利さ、その将来性に注目が
今日はR Markdownによるドキュメント生成をご紹介

Rでやるメリット

分析からレポート生成までが完結
- WordもExcelも(そしてぱわぽも)いらない
- コピペ汚染からの開放
再現性の確保
- 同一の内容をそのまま再現できる
再利用、配布が簡単
- コードを簡単に再利用可能
- テキストデータなので運用が簡単
作るのが簡単
- ドキュメント部分は基本Markdown
and more!!

デモ

使えるようになるとこんなことができるようになります:

基本的な考え方

R Markdownファイルを準備
中身を記述
レンダリングして出力を確認
2と3を繰り返す
完成

まずはMarkdown記法

注意事項

Markdownとは何かについては省略
mdには色々な“方言”が
- RmdはPandoc Markdownです
RStudioにはクイックリファレンスが
- [Help] - [Markdown Quick Reference]
- これみとけばOK
サンプルはこちら(文字化けしたら、ブラウザの文字コードを変更してください)
- htmlへレンダリングした結果はこちら

見出し(h1-h4)

# レベル1(h1)
## レベル2(h2)
### レベル3(h3)
#### レベル4(h4)

文書構造を明確にするためにも、きっちり割り振る
- レベル1は通常文書タイトル(章クラス)
- レベル2は通常節クラス
- 以下準じて下がっていく
極力見出しの前後は空行をいれとくといいです

段落(p)と強制改行(br)

「もうすこしだ！　この山を越えると、梅の林がある。――疾く参って梅林の木陰に憩い、思うさま梅の実みをとれ。――梅の実をたたき落して喰え」

　聞くと、奄々と渇にくるしんでいた兵も、  
「梅でもいい！」  
「梅ばやしまで頑張れ」と、にわかに勇気づいた。

　そして無意識のうちに、梅の酸っぱい味を想像し、口中に唾をわかせて、渇を忘れてしまっていた。

　――梅酸渇を医す。

上下に空行を挟むと、そこを段落ブロック(p)として認識
行末に半角スペース2つ以上いれると強制改行(br)

番号なし箇条書き(ul>li)

- 箇条書き1
    - 箇条書き1-1
- 箇条書き2
    * 箇条書き2-1
    * 箇条書き2-2

記号とスペースの後に内容を記述
- どちらでもOK
- 行頭の空白4つで1レベル下がる

番号あり箇条書き(ol>li)

1. 番号1
    1. 番号1-1
2. 番号2
    1. 番号2-1
    2. 番号2-2

番号とピリオドとスペースの後に内容を記述
- 行頭の空白4つで1レベル下がる

コードブロック(pre>code)

```
(ここにコード記述)
```

入力した内容がそのまま表示されます
- Rのコードは評価されません

強調表示

*斜体*、もひとつ_斜体_
**太字**、もひとつ__太字__

上記のとおりです
強調具合などはCSSなどに依存します

リンク、画像

- http://blog.kz-md.net/
- [リンク文字](http://blog.kz-me.net/)

![R looo](https://www.r-project.org/Rlogo.png)
![zou-san](pics/user.png)

基本、相対パスや絶対パスの両方OK
URLでもOK

その他

以下の内容もいけます
- 脚注
- Latex数式
- 表
- 水平線
Pandoc Markdownなら大抵OKです

R Markdownの書き方

Markdownとの違い

MarkdownにRのコードを評価するブロック(Rチャンク)を組み込めるようにしたようなもの
- 拡張子は.Rmd
- Markdownの基礎があれば、Rチャンクを少し勉強すれば利用可能
- RStudioを使うと抜群に楽になる
- ただし文字コードの闇は深い

R Markdownの仕組み

R Markdownは以下の流れでドキュメントを生成します
- まずはknitrパッケージでRチャンク部分などを処理
- 生成されたmdファイルをpandocというドキュメント変換アプリで変換

対応する出力形式

いろんなものに対応しています(一部抜粋)
- htmlファイル
  - 基本かつ最強。最もRmdを活かせるタイプ。
- pdfファイル
  - tex環境が必要。いくつか地雷があるけど整えれば楽しい。
- docxファイル
  - Officeをインストールしてなくても生成可能。
- odtファイル
  - LibreOfficeなどで利用可能。
- mdファイル
  - Githubやブログ記事向け。
- rtfファイル
  - リッチテキスト形式。

Rチャンク

Rチャンクとは

Rのコードを記述したブロック
- 基本的な書き方は以下の通り
```
```{r}
  head(iris)
```
```
- ちなみに実行結果は以下の通り:

##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa

Rチャンクの基本

冒頭にYAMLヘッダ
- ドキュメント設定などはここに記載
Rチャンクはいくつでも設置可
- チャンクに名前をつけることも可能
- 結構詳細にオプションを設定可能
- Rオブジェクトを引き継ぐことも可能
通常と(ほぼ)同じようにRが使える
- パッケージ読み込み
- データファイルへのアクセス
- ただしパスについてはちょっと気をつける点も
文字コード…
- Why are you using SJIS?問題

Rチャンクオプション

そのRチャンクでの設定を記述
- 設定項目はたくさんある
- そのあたりはリファレンスを参照
- 以下、絶対覚えるべきものだけ紹介

```{r chank-name, eval=TRUE}
head(iris)
```

echo(コード部の表示・非表示)

Rのチャンクコードを表示させるかどうか
- echo=FALSEで非表示
- あくまで表示に関することだけ
- コード評価をするかどうかは影響しない

```{r, echo=FALSE}
head(iris)
```

eval(コード部の評価・非評価)

Rチャンクのコードを評価するかしないか
- eval=FALSEで非評価

```{r, eval=FALSE}
head(iris)
```

include(レポートに組み込むか否か)

Rチャンクをレポートに組み込むかどうか
- include=FALSEでレポートから除外
- でもコードは評価されます
- セットアップとか前処理とかパッケージ読み込みとかで重宝

```{r, include=FALSE}
library(zousan)
```

yamlヘッダ

yamlヘッダの基本

ドキュメントの全体的な設定など記述
yaml記法で記述
- 左のスペース、重要
- 多分感覚をつかむまでは、見様見真似でやっていったほうがいいです

主な項目

Title:はドキュメントのタイトル
author:は名前
date:は日にち
output:は出力形式に関して
- ここで出力を指定・設定
- まずはここでいろいろ試しましょう

レンダリング

Knitボタン

RStudioのKnitボタンでおk
- うまくいったらViewerに表示
- あるいは別ウィンドウにて表示

論文をR Markdownで書きたい

論文をRmdで書くなら…?

図表を論文向けの書式に
- Rコードの出力でがんばろう
- 図ならggplot2でテーマがあります
- 表も準拠したものがあります
文献リストを自動化して
- Citation機能を利用しましょう
某フォーマットを自動であててくれ
- テンプレートを活用しましょう

citationの使い方

詳しくは本家のドキュメントを参照してください
- Pandocのcitation機能を利用しています
- なのでかなり簡単にもってこれます
- (デモで説明)

テンプレートの活用

R Markdownはほぼすべての出力でテンプレートを活用できます
- なので、docxでもいけます
- これもPandocの機能を利用しています
- (デモで説明)

参考資料

R Markdownのドキュメント

ドキュメント・プレゼンテーション生成
- 名著です。ぜひ買いましょう。
R Markdownで楽々レポートづくり：連載｜gihyo.jp … 技術評論社
- 上記書籍の著者による連載です。
- 非常にわかりやすくR Markdownの入門に最適!
http://rmarkdown.rstudio.com/index.html
- 本家のドキュメント(英語)です。
- 入門や基礎、そして応用や開発までたっぷり詰まってますう

Rでドキュメントを生成しよう

Kandai.R #1

2016/06/19

自己紹介

基本データ

今日のお話

Rでドキュメント生成

Rでやるメリット

デモ

基本的な考え方

まずはMarkdown記法

注意事項

見出し(h1-h4)

段落(p)と強制改行(br)

番号なし箇条書き(ul>li)

番号あり箇条書き(ol>li)

コードブロック(pre>code)

強調表示

リンク、画像

その他

R Markdownの書き方

Markdownとの違い

R Markdownの仕組み

対応する出力形式

Rチャンク

Rチャンクとは

Rチャンクの基本

Rチャンク オプション

echo(コード部の表示・非表示)

eval(コード部の評価・非評価)

include(レポートに組み込むか否か)

yamlヘッダ

yamlヘッダの基本

主な項目

レンダリング

Knitボタン

論文をR Markdownで書きたい

論文をRmdで書くなら…?

citationの使い方

テンプレートの活用

参考資料

R Markdownのドキュメント

こちらもおすすめ

さいごに

Enjoy!

Rチャンクオプション