Parquetはfooterのmetadataにlengthとoffsetが記載されてて圧縮もcolumn単位なので集計に必要なカラムをseekで取り出せる省設計。DuckDBはS3から取得する際もRangeヘッダー対応で必要な部分だけ取ってる模様。すごく良いよね---Parquetフォーマット概観 - 発明のための再発明https://mrasu.hatenablog.jp/entry/2024/09/22/190000#bookmarks
様々な目的に使える、日本の汎用マストドンサーバーです。安定した利用環境と、多数の独自機能を提供しています。