(R)Markdownのみで
音声つきスライド動画生成

前田和寛(kazutan)

2017年12月3日

はじめに

Ubuntu10.10リリース
Ubuntu Weekly Recipe 500回
おめでとうございます

自己紹介

  • 前田 和寛
  • 比治山大学短期大学部
  • @kazutan
    • twitter
    • GitHub
    • Qiita
  • Rおじさん

こんなことしてます

今回のお話

  • YouTubeRになりたい
  • 動画コンテンツ作成のコスト
  • 「それ、Rならできるよ?」

YouTubeRになりたい

動機

お小遣い,ほしい。

どうやったらYouTubeRになれる?

  • 需要のある動画をつくる
  • 投稿する
  • 告知する

あとはこれをコンスタントに実施

でも、うちRおじさんだし…

  • トピックをRにしよう
    • 国内向けのR関連Webinerはあまりない
    • でも間違いなく需要はある
    • これはチャンス!?

コンテンツを作成

  • RのコンテンツだからRで作りたい
    • できればRを利用して作ったスライドを活用したい
    • ムービーだから音声必須
    • いちいち録画/録音したくない
  • 便利なパッケージをフル活用しよう
    • Rでスライドを作成しよう
    • そのスライドを利用して動画まで作ってしまおう
    • そこから音声も乗っけてしまおう

これを全部Rで、な?

Rでスライド作成

rmarkdownでドキュメント生成

  • Markdownベースのドキュメント生成システム
    • チャンクと呼ばれる特殊なコードブロックをmdに差し込む
    • それをRで評価させた後にPandocでドキュメント化
  • Pandoc経由なので非常に多彩
    • 基本Pandocで出せるものは出せる
    • その他でも(頑張れば)独自で組める

rmarkdownでスライド生成

  • Pandocで生成できる出力には標準で対応
    • ioslides
    • slidy
    • beamer
    • reveal.js(revealjsパッケージ)
  • 他にも工夫次第で作成可能
    • remark.js(xaringanパッケージ)
    • fullpage.js(自作したfullpagejsパッケージ)

このあとむちゃくちゃスライド作成した

  • この後の都合上、音声つきを目指すなら以下の環境を推奨
    • ioslides
    • remark.js(xaringan)

というわけで、作ったことにします。pandocでhtmlに簡単出力!

htmlスライドを動画にする

ariパッケージ

  • Rmdから生成したhtmlスライドからmp4ムービーを生成
    • 主に以下のRmdスライドに対応
      • ioslides_presentation
      • slidy_presentation
      • xaringan::moon_reader
    • 読み上げ原稿はRmdに仕込める
      • 音声は自動生成
    • 原稿にあわせてスライドも自動で切り替わる
      • タイミングも全自動で抽出

超簡単!

生成はari::narrate()

ari_narrate(script, slides, output = "output.mp4", voice,
  capture_method = "vectorized", ...)
  • script: 読み上げる原稿があるファイル
    • 詳細は後述
  • slides: htmlスライド
    • Rmd直接ではなく,renderした後のhtmlスライドファイル
  • output: 出力ファイル名
  • voice: 声の選択(後述)
  • capture_method: スライドをキャプチャする方法
    • 詳細は後述

実行例

kosaki.Rmdというioslidesで準備したファイル:

    ---
    title: "More Kosaki!"
    output: ioslides_presentation
    ---
    
    <!-- タイトルスライド用原稿 -->
    
    ## more! more kosaki.
    ```{r cars, echo = TRUE}
    summary(cars)
    ```
    <!-- 二枚目の原稿をひたすら綴る。-->
    ## kosaki! kosaki!
    ```{r pressure}
    plot(pressure)
    ```
    <!-- 三枚目の原稿を綴る -->

mp4を生成するコードは以下の通り:

# まずはrender
rmarkdown::render("kosaki.Rmd", output_file = "kosaki.html")

# mp4を生成するコード
ari::ari_narrate("kosaki.Rmd", slides = "kosaki.html", output = "kosaki.mp4",
                 voice = "Mizuki", capture_method = "iterative")
  • ところが,何も準備しないとエラーが出て生成されない
  • 実はariパッケージはいろんなものを使って生成してる
    • というわけで,仕組みと環境構築を解説

ariパッケージの仕組みと環境構築

ariパッケージの処理フロー

  1. slides =のhtmlスライド一枚一枚をwebshotで画像にする
  2. script =内容から,各スライドの読み上げ原稿を抽出
  3. 読み上げ原稿をAWS Pollyというサービスに投げて音声ファイルを取得
  4. 音声ファイルの長さから,各スライドの表示時間を計算
  5. 画像・音声と表示時間を元にffmpegで動画生成

ariパッケージに必要な環境

  • PhantomJS
    • webshotパッケージが利用しているヘッドレスブラウザ
  • AWS PollyのAPIが使える環境
    • AWSアカウント
    • AWS Pollyが使えるトークン
  • ffmpeg
    • Pathが通っている必要あり

…道は険しい。

PhantomJSの導入

  1. Rでwebshotパッケージをインストール
  2. webshot::install_phantomjs()でOK
    • 各OSに応じて自動的にインストールされる
    • うまくインストールできない場合は,手動でインストールしてください

AWS Pollyが使える環境

  • AWSのサービスのひとつ
    • テキストから音声データを生成
    • 詳しくはググってください
  • ariパッケージはaws.pollyパッケージを利用
    • Cloudyrプロジェクトの一環
    • 興味がある方は「aws.polly r」でググッて
  • 日本語にも対応
    • voiceで読み手を指定できる
    • 日本の女性はvoice = "Mizuki"

やることは以下の通り:

  • AWSのアカウント取得
  • AWS Pollyが使えるトークンを発行(説明省略)
  • トークンの内容をRの設定として登録:
# 上2つは架空の文字列です
Sys.setenv("AWS_ACCESS_KEY_ID" = "KOSAKIKOSAKIKOSAKIKO",
           "AWS_SECRET_ACCESS_KEY" = "KosakiKosakiKosakiKosakiKosakiKosakiKosa",
           "AWS_DEFAULT_REGION" = "ap-northeast-1")
  • これらを設定しとけばOK
    • ただ,これらトークン情報をRConsoleに直接入力するのは避けよう

ffmpegの準備

  • コマンドラインから各種フォーマットのメディアを生成するアプリケーション
    • オープンソースでwindows, mac, 主要linuxディストリで利用可能
  • 以下の公式サイトからダウンロード
  • Debian, UbuntuならaptでもOK
    • ただし,対応codecが含まれていないとだめ
    • 最終的にbuildしなきゃならん場合も…

これで準備は整った

ariパッケージのインストール

# cranから
install.packages("ari")

# githubはこちら(2017/11/24時点ではcranと同じ)
devtools::install_github("seankross/ari")

ari::narrate()を実行

# mp4を生成するコード
ari::ari_narrate("kosaki.Rmd", slides = "kosaki.html", output = "kosaki.mp4",
                 voice = "Mizuki", capture_method = "iterative")

Yeah!