【Python】seeモジュールで使える正規表現の特殊文字

一昨日のseeモジュールで使える正規表現の特殊文字を紹介します。

正規表現を使うと、似た文字列をまとめて表せます
例えば、.nan.+\(\)$ によって、.nanmax(), .nanmean(), .nanmin() といった .nan<1文字以上の文字列>() で終わる文字列をまとめて表わすことができます。

正規表現の特殊文字一覧

. ^ $ * + ? { } [ ] \ | ( )

正規表現 HOWTO – Python 3.8.0 ドキュメント

解説

seeモジュールの正規表現は、reモジュールで使われているものと同じもののようです。

This may be a compiled regular expression (from the re module) or a string that starts with a / (forward slash) character:

Usage — see 1.4.1 documentation

そのため、上記の特殊文字一覧はreモジュールのページから引用しました。

特殊文字を1つ紹介: \ (backslash)

特殊文字では、特殊文字そのものを表せません
例えば、正規表現の”(“は(“そのものを意味せず、特別な別の意味を持ちます。

では、”(“を正規表現で表わすにはどうすれば良いかというと”\(“とします。
つまり \ は、特殊文字が持つ機能をoffにしてくれる特殊文字ということです。

そのため、上記の特殊文字一覧に記載された文字そのものを正規表現で表すには、このようにします。

\. \^ \$ \* \+ \? \{ \} \[ \] \\ \| \( \)

おわりに

seeモジュールで使える正規表現の特殊文字と、特殊文字の1つである\を紹介しました。
この記事の内容は、正規表現の氷山の一角に過ぎません。
\にしても特殊文字以外と使ったときは別の意味(特別な機能をonにする)を持ちます。

覚えるというよりも使いながら慣れて行くのが良いかなと思います。
一昨日の記事などを参考にいろいろ試してみて下さい。

では。


YouTube: ミサキさん

問い合わせ先
Mail: caprico.aries@gmail.com
Twitter: https://twitter.com/caprico_aries(無言フォローもお気軽に)

コメント

タイトルとURLをコピーしました