とりあえず適切な技術アドバイスが得られて、昨日の遅延の対処ができたというだけで、先はわからないですけどね。
大きいサーバで起きる現象は、開発においても運用においても知見が得られるのでなるべく見ておきたいのですが、そうはいっても内部の詳細は見られないので、推測できる以上のことはわかりません。
まぁ自分の鯖でやるしかないわね……。
今回の現象は、pumaやsidekiqのプロセスは生きている感じで、外から見ると動いたり止まったりしていたので、PostgreSQLかredisとの問題があやしいです。遅延の件も含めて、おそらくredis。
redisを再起動して直ったのか、それプラス何かチューニングしたのか。