Pythonで、正規表現を使って文字列の一部を抜き出す

Pythonで、正規表現を使って文字列の一部を抜き出す


 具体的には、'/thumbnail/abcdefg.html'という文字列があったら、abcdefgの部分だけを抜き出したかった。

>>> import re

>>> a = re.search('/thumbnail/(\w+)\.html', '/thumbnail/abcdefg.html')

>>> a.group()

'/thumbnail/abcdefg.html'

>>> a.group(1)

'abcdefg'

>>>

 \w+ …アルファベットまたはアンダースコアで構成される文字列にマッチした部分をgroup(1)で取り出すことが出来る。後方参照と言うらしい。