正規表現後方参照
キャプチャグループでマッチした文字列を、同じパターン内で再利用する機能。\1、\2 などで参照する。
正規表現の後方参照 (バックリファレンス) とは、キャプチャグループ () でマッチした文字列を、同じ正規表現パターン内で \1、\2 などの記法で再利用する機能です。
例えば (\w+)\s+\1 は「同じ単語が連続する」パターンにマッチします。HTML のタグマッチング <(\w+)>.*?</\1> も後方参照の典型的な使用例です。正規表現詳解の書籍で高度なパターンを学べます。
置換操作では $1、$2 (言語によっては \1、\2) でキャプチャグループの内容を参照できます。テキストの整形や変換に強力なツールです。
文字数カウントの観点では、後方参照を使った正規表現は、繰り返しパターンの検出に有用です。重複する文字列の検出や、テキストの冗長性分析に活用できます。正規表現実践の書籍も参考になります。