利用Python正则表达式匹配字符串中的http链接

利用Python正则表达式匹配字符串中的http链接。主要难点是用正则表示出http 链接的模式。

 

import re
pattern = re.compile(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+')    # 匹配模式

string = 'Its after 12 noon, do you know where your rooftops are? http://tinyurl.com/NYCRooftops '
url = re.findall(pattern,string)
print url

>>['http://tinyurl.com/NYCRooftops']

 

请登录后发表评论

    没有回复内容