具体的にはこの一行の時間計算量が active リスト(実行中のジョブリスト)の要素数に比例してます。完了したジョブをリストから取り除く処理なんだけれど、増えた待機ジョブに対応してワーカーを増やしまくるなどして実行中のジョブがひとたび急増すると、ここの処理が激重になり、タイムアウトするようになり、つまりジョブは2度と完了せず、不幸が訪れる。ジョブに増加に対応しようとして逆に首が締まる最悪のループに入るわけです。
https://github.com/taskforcesh/bullmq/blob/0a70f4cf7ba21c18c55390d47069335c305559af/src/commands/moveToFinished-14.lua#L117
このところ発生した、misskey.ioの外部配送が遅延していた原因など、時系列で技術面の詳しいことが報告されてるよ。
https://misskeyhq.fanbox.cc/posts/7266127
あわせてKOBA789さんの投稿もみとくといいかも。 [参照]
@noellabo@fedibird.com なるほど