(R)Markdownのみで
音声つきスライド動画生成

前田和寛(kazutan)

2017年12月3日

はじめに

Ubuntu10.10リリース
Ubuntu Weekly Recipe 500回
おめでとうございます

自己紹介

前田和寛
比治山大学短期大学部
@kazutan
- twitter
- GitHub
- Qiita
Rおじさん

こんなことしてます

今回のお話

YouTubeRになりたい
動画コンテンツ作成のコスト
「それ、Rならできるよ?」

YouTubeRになりたい

動機

お小遣い，ほしい。

どうやったらYouTubeRになれる?

需要のある動画をつくる
投稿する
告知する

あとはこれをコンスタントに実施

でも、うちRおじさんだし…

トピックをRにしよう
- 国内向けのR関連Webinerはあまりない
- でも間違いなく需要はある
- これはチャンス!?

コンテンツを作成

RのコンテンツだからRで作りたい
- できればRを利用して作ったスライドを活用したい
- ムービーだから音声必須
- いちいち録画/録音したくない
便利なパッケージをフル活用しよう
- Rでスライドを作成しよう
- そのスライドを利用して動画まで作ってしまおう
- そこから音声も乗っけてしまおう

これを全部Rで、な?

Rでスライド作成

rmarkdownでドキュメント生成

Markdownベースのドキュメント生成システム
- チャンクと呼ばれる特殊なコードブロックをmdに差し込む
- それをRで評価させた後にPandocでドキュメント化
Pandoc経由なので非常に多彩
- 基本Pandocで出せるものは出せる
- その他でも(頑張れば)独自で組める

rmarkdownでスライド生成

Pandocで生成できる出力には標準で対応
- ioslides
- slidy
- beamer
- reveal.js(revealjsパッケージ)
他にも工夫次第で作成可能
- remark.js(xaringanパッケージ)
- fullpage.js(自作したfullpagejsパッケージ)

このあとむちゃくちゃスライド作成した

この後の都合上、音声つきを目指すなら以下の環境を推奨
- ioslides
- remark.js(xaringan)

というわけで、作ったことにします。pandocでhtmlに簡単出力!

htmlスライドを動画にする

ariパッケージ

Rmdから生成したhtmlスライドからmp4ムービーを生成
- 主に以下のRmdスライドに対応
  - ioslides_presentation
  - slidy_presentation
  - xaringan::moon_reader
- 読み上げ原稿はRmdに仕込める
  - 音声は自動生成
- 原稿にあわせてスライドも自動で切り替わる
  - タイミングも全自動で抽出

超簡単!

生成は`ari::narrate()`

ari_narrate(script, slides, output = "output.mp4", voice,
  capture_method = "vectorized", ...)

script: 読み上げる原稿があるファイル
- 詳細は後述
slides: htmlスライド
- Rmd直接ではなく，renderした後のhtmlスライドファイル
output: 出力ファイル名
voice: 声の選択(後述)
capture_method: スライドをキャプチャする方法
- 詳細は後述

実行例

kosaki.Rmdというioslidesで準備したファイル:

    ---
    title: "More Kosaki!"
    output: ioslides_presentation
    ---
    
    <!-- タイトルスライド用原稿 -->
    
    ## more! more kosaki.
    ```{r cars, echo = TRUE}
    summary(cars)
    ```
    <!-- 二枚目の原稿をひたすら綴る。-->
    ## kosaki! kosaki!
    ```{r pressure}
    plot(pressure)
    ```
    <!-- 三枚目の原稿を綴る -->

mp4を生成するコードは以下の通り:

# まずはrender
rmarkdown::render("kosaki.Rmd", output_file = "kosaki.html")

# mp4を生成するコード
ari::ari_narrate("kosaki.Rmd", slides = "kosaki.html", output = "kosaki.mp4",
                 voice = "Mizuki", capture_method = "iterative")

ところが，何も準備しないとエラーが出て生成されない
実はariパッケージはいろんなものを使って生成してる
- というわけで，仕組みと環境構築を解説

ariパッケージの仕組みと環境構築

ariパッケージの処理フロー

slides =のhtmlスライド一枚一枚をwebshotで画像にする
script =内容から，各スライドの読み上げ原稿を抽出
読み上げ原稿をAWS Pollyというサービスに投げて音声ファイルを取得
音声ファイルの長さから，各スライドの表示時間を計算
画像・音声と表示時間を元にffmpegで動画生成

ariパッケージに必要な環境

PhantomJS
- webshotパッケージが利用しているヘッドレスブラウザ
AWS PollyのAPIが使える環境
- AWSアカウント
- AWS Pollyが使えるトークン
ffmpeg
- Pathが通っている必要あり

…道は険しい。

PhantomJSの導入

Rでwebshotパッケージをインストール
webshot::install_phantomjs()でOK
- 各OSに応じて自動的にインストールされる
- うまくインストールできない場合は，手動でインストールしてください

webshotパッケージについては，以下のページを参照してください:
- webshotパッケージ - Kazutan.R
- https://kazutan.github.io/kazutanR/webshot_demo.html

AWS Pollyが使える環境

AWSのサービスのひとつ
- テキストから音声データを生成
- 詳しくはググってください
ariパッケージはaws.pollyパッケージを利用
- Cloudyrプロジェクトの一環
- 興味がある方は「aws.polly r」でググッて
日本語にも対応
- voiceで読み手を指定できる
- 日本の女性はvoice = "Mizuki"

やることは以下の通り:

AWSのアカウント取得
AWS Pollyが使えるトークンを発行(説明省略)
トークンの内容をRの設定として登録:

# 上2つは架空の文字列です
Sys.setenv("AWS_ACCESS_KEY_ID" = "KOSAKIKOSAKIKOSAKIKO",
           "AWS_SECRET_ACCESS_KEY" = "KosakiKosakiKosakiKosakiKosakiKosakiKosa",
           "AWS_DEFAULT_REGION" = "ap-northeast-1")

これらを設定しとけばOK
- ただ，これらトークン情報をRConsoleに直接入力するのは避けよう

ffmpegの準備

コマンドラインから各種フォーマットのメディアを生成するアプリケーション
- オープンソースでwindows, mac, 主要linuxディストリで利用可能
以下の公式サイトからダウンロード
- https://www.ffmpeg.org/download.html
Debian, UbuntuならaptでもOK
- ただし，対応codecが含まれていないとだめ
- 最終的にbuildしなきゃならん場合も…

これで準備は整った

ariパッケージのインストール

# cranから
install.packages("ari")

# githubはこちら(2017/11/24時点ではcranと同じ)
devtools::install_github("seankross/ari")

ari::narrate()を実行

# mp4を生成するコード
ari::ari_narrate("kosaki.Rmd", slides = "kosaki.html", output = "kosaki.mp4",
                 voice = "Mizuki", capture_method = "iterative")

Yeah!

YouTubeへ公開しよう

アカウント・チャンネルの準備

まあてきとうにやっといてください。

動画のアップ

mp4形式ならすんなりと公開できます:

OKできたぞい

Rユーザーに最適な
YouTube体験を

Rの動画をみながら作業するには

RStudioは画面を専有する
- tear(ウィンドウ切り離し)もある
- でも結構面倒
ブラウザとRStudioを行き来するのは面倒
- アクティブウィンドウの切り替えが面倒

RStudioでYouTubeを再生できれば解決!

tubeplayRパッケージ

RStudioのViewerでYouTubeを再生できるパッケージ
- Win, Linux版ではRStudio Server版のみ
- Macならデスクトップ版でも動作
GitHubでのみ公開
- devtools::install_github("kazutan/tubeplayR")
- もしくはgithubinstall::githubinstall("tubeplayR")
再生したいYouTubeのurlをコピーして関数へ
- `tubeplayR::tubeplay(“ここにurlを”)
詳しくは以下のスライド資料を
- https://kazutan.github.io/HijiyamaR6/intro_tubeplayR.html#/

これだ…!!

改善と補足

環境準備が大変

いろいろ事前の準備が大変
- Rのパッケージ外でもいろいろ
- 設定とか面倒
アプリケーションをあまり追加したくない
- 都合上あまり汚したくない
- そもそもアプリをインストールできないことも

docker、準備しました

kazutan/zousan-r:tube_box
- rocker/tidyverseをベース
  - tidyverseパッケージ全部入り
  - Debianベース
- Rの日本語化済、IPAexフォント導入済
- ariパッケージまで導入済
AWSのトークンさえあればOK

$ docker pull kazutan/zousan-r:tube_box
$ docker run -p 8787:8787 -v ~:/home/rstudio -d --name kosaki kazutan/zousan-r:tube_box

補足読み上げ原稿について

scriptにmdファイルを与えた場合、renderして生成されたhtmlファイルのpタグひとつ分をスライド1枚分の原稿として処理
- 見出しは原稿から無視
scriptにRmdファイルを与えた場合、htmlコメント()一つ分をスライド1枚分の原稿として処理
- htmlコメント以外は原稿から無視

状況や好みに応じて使い分ければ便利

補足画像解像度について

ari::narrate()の...はwebshotの引数として引き渡される
- 解像度とかヘッドレスブラウザへ情報を送ることも可能
ただし、解像度以外はいじらないほうがいい
- htmlスライドはそれぞれ独自のエンジンで実現
- 細かくやりたい場合はそれぞれの仕様をよく確認すること

補足 AWS Pollyの料金について

契約1年目は200万文字/月まで無料
それを超えてもごくわずか
多分1年超えてもそれほどの金額ではない
よほどのものを作り続けない限り心配なし!

補足音声のみを生成したい

ariパッケージではできない
でもAWS.Pollyパッケージならいけるはず
- このパッケージはまさに読み上げデータを取得するもの
- こちらについては、各自で確認をおねがいします

Enjoy!

参考資料:

R Markdown本家Webサイト
http://rmarkdown.rstudio.com/
めざせYouTubeRの星
https://kazutan.github.io/slides/HijiyamaR_final_youtubeR.html#/
ariパッケージリポジトリ
https://github.com/seankross/ari

(R)Markdownのみで音声つきスライド動画生成