人気のyoutube動画のタイトルを組み合わせて最強の動画を作ろう!

はじめに

生まれて28回目のGWなのでなにかしないとなと思いました。

28回目ですからね。大事です。

大事だと思ってはいたのですが、気づいたら3日過ぎてました。不思議です。

 

大事なGW4日目もいつも通りソファーでごろごろしながらyoutubeの動画を垂れ流していたところ、近所の小学生の「頑張れよ!!」という叫び声を聞いて頑張ることにしました。小学生ありがとう。

 

心が弱いので、小学生に言い訳をします。

「おじさんはyoutubeで食べていくための勉強をしてるんだ」

言い訳できました。しかし言い訳ばかりして何もしない大人の姿を見たら小学生もがっかりすることでしょう。

そのため、youtubeを使って何かしてたことを証明しなければならない私が思いついたアイディアが本記事のタイトルです。

 

私はこれまでyoutubeに動画を投稿したことはありませんし、なにか別のプラットフォームでクリエイト*1した経験もありません。

そんな私がyoutubeで見てもらうためには、先人の知恵に縋るしかなさそうです。ここでいう先人の知恵に縋るとは、伸びているyoutubeの動画を参考にさせていただこうということです。伸びる動画の要素は色々あると思うのですが、まずは個人的にとっつきやすかった動画タイトルをテーマとしてみました。巨人の肩に乗ってそのままキャリーしてもらいましょう。

 

youtubeで人気の動画のタイトルを引っ張ってこよう

Q.  youtubeの人気の動画のタイトルを引っ張ってくるにはどうすればいいの?

A. APIを使いましょう

世の中は便利です。流行っているサービスではだいたいAPIが提供されています。APIを使うと、サービスに関するデータを簡単に持ってくることができます。

developers.google.com

Pythonで書くことにしたので、サンプルコードを拝借します。

developers.google.com

書きました。仕様は下記となります。

  • 日本で人気の動画に絞る
  • 上位200件の動画が対象*2

 

コードを見たい方はgithubをどうぞ。

github.com

 

持ってきたタイトルのTOP10はこんな感じになりました。*3

  1. 【公式】大会最終日 決勝ラウンド|パナソニックオープンレディース
  2. 6年付き合ったレイナさんと別居しお別れしました。
  3. ンダホの人生を勝手にアニメにするドッキリしたら大泣きした。【フィッシャーズ】
  4. 【アニメ】急展開すぎるリモート通話
  5. 朝倉海・シバター】ワサビ入り たこ焼きを食べるのは誰だ!?3人で「タコパ」やってみた!
  6. TWICE「Kura Kura」Special Dance Clip
  7. 【公式】大会2日目 予選ラウンド|パナソニックオープンレディース 4月30日(金)〜5月2日(日)3日間LIVE配信
  8. 【APEX LEGENDS】とんでもない幼女と全力でツッコむ渋谷ハル【エーペックスレジェンズ
  9. SixTONES- LIVE配信 - 結成日カウントダウン
  10. 原英莉花 プロ初ホールインワン!|パナソニックオープンレディースゴルフトーナメント

引っ張ってきたタイトルを組み合わせよう

Q. いい感じに組み合わせるためにはどうすればよいのでしょうか。

A. 分かち書き*4して組み合わせてみましょう。

わかち書きするための形態素解析ツールとしてMeCabを利用することにしました。

MeCabに利用する辞書は新語に強いNEologdを使うことにします。

 

まずは何も考えずに下記の仕様で試してみましょう。

できたタイトルがこちらとなります。

  • プロジェクト】で|vs聞き消すチョモランマ泣き大リンゴ帰っだけ
  • の!「】」【開封今やつも【www焼ける人生/、た聞い
  • EXILEだ勝手のおせっかくミュージアム】で食100日篇バラが
  • 緑仙悲願×『】'ユーザーイメージソング】Ohtaniりょう…
  • Eveつかいデートした】デュエルロワイヤルます、視点】た歌ってみた]当時た×』5人目!が

流石に謎ですね。色々無視して1つ目を好意的に解釈すれば、「チョモランマが泣くほどのデカさのりんごとの対決を記録したプロジェクト」の動画でしょうか。

 

少しは賢い文章を出したいものです。ディープラーニングさんに頼ってみましょう。

TensorFlowが提供しているテキスト生成の例では文字*5単位による分割ですが、単語単位に改変して試してみます。

www.tensorflow.org

こんな仕様で実装します。

  • youtubeのタイトルを分かち書きして単語単位にする
  • 前の単語から次の単語群を予測するようなモデルをRNNで構築する
  • modelに人気動画のタイトルのランダムな単語をぶち込んでタイトルを生成する

5個くらい生成しました。

  • shorts)【怖い話女子&佐藤輝明を寮生活】
  • 【落とし穴】恐怖心のアイドル恩返しずっとレトルト・牛沢
  • 元カノがMafiaマインクラフト】モンハンは振ってもらった
  • 仕事の指示で大暴れ!!!!?
  • AGEHA-撮らなオイル交換をしたら大爆笑

少しはタイトルっぽくなった気がしますね。Deep Learning全然詳しくないので適当実装です。感想として下記らへんが特にダメそう。そのうち改善したいですね。

  • データ量増やしたい*6
  • サンプルシーケンスの長さを10単語とか適当に決めてるけど、これだとA動画とB動画のタイトルが混ざり合う

せっかく読めそうなタイトルができたので適当な動画を取ってみましょう。

最強のタイトルで最強の動画を取ろう

「仕事の指示で大暴れ!!!!?」を使って動画を作成してみます。

作成してみました。

www.youtube.com

おわりに

世の中のyoutuberはすごいですね。

タイトルだけ生成してみても、そこから何作るか全然思いつかなったですし、動画撮るのめんどくさいし、全然大暴れしてないですし、動画一本作るだけでもすごく大変なんだなということを実感しました。

改めて世のすべてのクリエイターに尊敬を抱いて生きていこうと思います。

結果としておじさんはyoutuberにはなれなさそうです。小学生ごめんなさい。

ここまで読んでくださりありがとうございました!

*1:執筆とか作画とか作曲とかなんかそういうめちゃくちゃすごいこと

*2:youtubeAPIで人気動画引っこ抜いたら、201件目から再び1-200位の動画を取得してきたため。Paging処理は1-50でループさせてるから、そこらへんの実装ミスではないと信じたいです。

*3:2021/05/03 01:02 JST時点

*4:文章において語の区切りに空白を挟んで記述すること。「わたし は くじら です」みたいな感じ

*5:アルファベット

*6:単語数が1431単語しかない。TensorFlowのサンプルだと1,000,000字くらい使ってた。