福彩快乐彩玩法:the5fire的技术博客

彩票开奖查询 www.8a72.cn 关注Python、Django、Vim、Linux、Web开发、团队管理和互联网--Life is short, we need Python.


python正则表达式替换字符串

作者:the5fire | 标签:       | 发布:2012-02-26 11:29 p.m. | 阅读量: 35450, 34521

一个实例,有一段html代码,不符合xml格式规范,所以要用python对它进行下转换。 其中要转换的地方有:

1、[&]转为[&](但是不能把[ ]转了);
2、把代码中的["=""]去掉;
3、把[svg]和[path]标签都改为[svg:svg]和[svg:path];
4、关闭[img]标签;
5、将url()中的["]转为[']

使用正则对html进行了处理。 下面就是代码:

importrestr_url='test,&nbsp;url("//www.baidu.com")&,dddddd "="" <svg></svg><path></path><img src="//www.baidu.com">ininnnin<img src="//www.dd.com">'#2、把代码中的["=""]去掉;#3、把[svg]和[path]标签都改为[svg:svg]和[svg:path];str_url=str_url.replace('"=""','')str_url=str_url.replace('svg','svg:svg')str_url=str_url.replace('path','svg:path')#1、[&]转为[&amp;](但是不能把[&nbsp;]转了);url_re=re.compile('&(?!\w{4};)')str_result=url_re.sub('&amp;',str_url)#4、关闭[img]标签;img_list=re.findall('<img.*?>',str_result)forimg_rinimg_list:str_result=str_result.replace(img_r,img_r+'</img>')#5、将url()中的["]转为[']url_list=re.findall('url\(".*?"\)',str_result)printurl_listforurl_rinurl_list:url_new=url_r.replace('"','\'')str_result=str_result.replace(url_r,url_new)printstr_result
- from www.8a72.cn
----EOF-----

微信公众号:Python程序员杂谈

预售优惠价截止到7月8日23点59分。


其他分类:
  • 特朗普下令美国防部组建第六军种“太空军” 2019-02-17
  • 标致1008假想图曝光 主打小型SUV市场 2019-02-11
  • 美俄掀起新一轮互相制裁风波。 2019-02-08
  • 荷兰成国旗最大购买地-热门标签-华商网数码 2019-02-08
  • 浅析网络视频主持人的语言特点 2019-01-27
  • 防弹少年团刷新自身纪录 破亿 MV 之首出炉! 点阅 2019-01-25
  • 人民日报创刊70周年,社长李宝善提了13个“不会忘记” 2019-01-22
  • 【理上网来喜迎十九大】郑永年:希望十九大成为中华民族复兴的一个伟大转折点 2019-01-15
  • 一周人事:黑龙江、浙江等7省份12名省委常委履新 2019-01-01
  • 女子谎称刷单提成骗贫困大学生16万 用于买化妆品 2018-12-01
  • 西安体育学院体育传媒系与西部网签约校媒合作 2018-12-01
  • 网络投票刷礼物能不能帮孩子“争上游”? 2018-11-28
  • 中共山西省委组织部公示 2018-11-28
  • 【北京天气】最新北京今天天气,实时提供北京气温、空气质量、24小时天气预报、生活指数查询 2018-11-24
  • 格局生变 内容产业未来何去何从 2018-08-18
  • 820| 452| 722| 184| 737| 941| 691| 266| 632| 701|