目処がたったのでポスト。
2週間ほど前から地元ホールのデータサイトがGoogleのreCAPTCHAを採用、スクレイピングが弾かれるようになった(´・ω・`)
Googleの最新版は人の操作がない。文字の認識とかしなくて良い。プログラムが自動判定、人かbotか見分けてる模様。そもそも私のスクレイピングはhttpsのAPIリクエストを呼ぶだけで、GoogleのreCAPTCHAを実行してないからAPIが通らない(そりゃそーだ)。

VPSでのスクレイピングを諦めて、自宅PCのブラウザからアクセスする分には問題ない。ブラウザでの閲覧を自動化しその中でAPIを呼ぶのは本物と同じだからね。

ログインして会話に参加
Fedibird

様々な目的に使える、日本の汎用マストドンサーバーです。安定した利用環境と、多数の独自機能を提供しています。