kanemeate

働きたくない

検索APIを使った関連動画取得

なんか関連動画取得するAPIがあったような気がするな〜ってAPIリファレンス眺めてたらありましたね1発100quota消費するSearch APIが。relatedToVideoId=[videoId]ってリクエストURLに含めておくと、関連する動画をいくらか取得できて、デフォルトだと関連度順に並べて提供してくれるという動きをする。

1本の動画につき1リクエストで最大50本の関連動画を引っ張ってこれるわけですが、先述の通り100quotaも消費するので頑張っても1日100回しか叩けない。

毎日の制限がある上に微量のデータしか取れないのでさっさと格納する仕組みを作りたかったのと、データサイエンス系御用達の分析用DWHとかを使うまでもないデータ量なのでとりあえず普通に使っているRDBに取得順通りにぶちこむだけにした。

取得と格納はシェルスクリプトでやった。さっさとやりたいのとjq使いたかったから。jqクソ便利。シェルの振る舞いで結構ハマってしまい出来上がったスクリプトzshじゃないと動かない残念なモノになってしまった(zsh使っててコマンドごとの動作確認もzshでやった結果)。

取得したデータを使ってマッピングしてみたいなことがやりたいんだけど、そのあたりの知見は全然ないのでとりあえずデータ貯めながら勉強しつつ試してみる方針。それっぽい技術に触れたのはだいぶ前に50%の確率で株価が上がるか下がるかを当てるアプリを作った時くらい(scikit-learnでSVMやった)。それもちょっと方向性違うよねって感じ。