·約1分で読めます
GitHub Actions で毎日データを自動収集する
#自動化#GitHub#個人開発
「毎日決まった時間に、自動でデータを集めたい」。そんなとき、自分は GitHub Actions のスケジュール実行を使っています。Amazon売れ筋ランキングでも、この仕組みで毎日データを蓄積しています。
サーバーを立てなくていい
定期的な処理というと、サーバーを用意して常駐させるイメージがあります。でも個人開発でそれをやると、管理も費用もそれなりに負担です。
GitHub Actions なら、決まった時刻に処理を走らせるだけならサーバーを持たずに済みます。リポジトリに設定ファイルを置いておけば、あとは自動で動いてくれます。
やっていることはシンプル
仕組み自体はとてもシンプルです。
- 毎日決まった時刻にワークフローが起動する
- APIを叩いて最新データを取得する
- 取得したデータを保存先(データベースなど)に積み上げる
これを毎日くり返すことで、気づけば時系列のデータが貯まっていきます。
「貯める」ことの価値
この手の自動収集で大事なのは、表示そのものよりもデータを貯め続けることだと感じています。スナップショットを毎日ためておけば、あとから「先週と比べてどう変わったか」を見せられるようになります。
最初に少し仕込んでおくだけで、あとからじわじわ効いてくる。スケジュール実行は、個人開発ととても相性の良い仕組みです。