「空白と見なされる文字の集合は、Unicode が "Pattern White Space" と 呼ぶもので、次のものです:
U+0009 CHARACTER TABULATION U+000A LINE FEED U+000B LINE TABULATION U+000C FORM FEED U+000D CARRIAGE RETURN U+0020 SPACE U+0085 NEXT LINE U+200E LEFT-TO-RIGHT MARK U+200F RIGHT-TO-LEFT MARK U+2028 LINE SEPARATOR U+2029 PARAGRAPH SEPARATOR」 perlre - Perl の正規表現 - perldoc.jp http://perldoc.jp/docs/perl/5.38.0/perlre.pod#47x32and32-47xx