福彩快乐彩玩法:the5fire的技术博客

彩票开奖查询 www.8a72.cn 关注Python、Django、Vim、Linux、Web开发、团队管理和互联网--Life is short, we need Python.


python正则表达式替换字符串

作者:the5fire | 标签:       | 发布:2012-02-26 11:29 p.m. | 阅读量: 35450, 34521

一个实例,有一段html代码,不符合xml格式规范,所以要用python对它进行下转换。 其中要转换的地方有:

1、[&]转为[&](但是不能把[ ]转了);
2、把代码中的["=""]去掉;
3、把[svg]和[path]标签都改为[svg:svg]和[svg:path];
4、关闭[img]标签;
5、将url()中的["]转为[']

使用正则对html进行了处理。 下面就是代码:

importrestr_url='test,&nbsp;url("//www.baidu.com")&,dddddd "="" <svg></svg><path></path><img src="//www.baidu.com">ininnnin<img src="//www.dd.com">'#2、把代码中的["=""]去掉;#3、把[svg]和[path]标签都改为[svg:svg]和[svg:path];str_url=str_url.replace('"=""','')str_url=str_url.replace('svg','svg:svg')str_url=str_url.replace('path','svg:path')#1、[&]转为[&amp;](但是不能把[&nbsp;]转了);url_re=re.compile('&(?!\w{4};)')str_result=url_re.sub('&amp;',str_url)#4、关闭[img]标签;img_list=re.findall('<img.*?>',str_result)forimg_rinimg_list:str_result=str_result.replace(img_r,img_r+'</img>')#5、将url()中的["]转为[']url_list=re.findall('url\(".*?"\)',str_result)printurl_listforurl_rinurl_list:url_new=url_r.replace('"','\'')str_result=str_result.replace(url_r,url_new)printstr_result
- from www.8a72.cn
----EOF-----

微信公众号:Python程序员杂谈

预售优惠价截止到7月8日23点59分。


其他分类:
  • 女子谎称刷单提成骗贫困大学生16万 用于买化妆品 2018-12-01
  • 西安体育学院体育传媒系与西部网签约校媒合作 2018-12-01
  • 网络投票刷礼物能不能帮孩子“争上游”? 2018-11-28
  • 中共山西省委组织部公示 2018-11-28
  • 【北京天气】最新北京今天天气,实时提供北京气温、空气质量、24小时天气预报、生活指数查询 2018-11-24
  • 格局生变 内容产业未来何去何从 2018-08-18
  • 土地不是劳动成果,而是一种自然资源,就像空气、阳光不是劳动成果而是自然资源一样,所以土地不具有价值,买房只应支付房屋费,不应该支付土地费。 2018-08-14
  • 安全生产月:铁路安全宣传走进车站 2018-08-02
  • 带动乡亲干 各自有实招——三位农村社区党组织书记的故事 2018-08-02
  • 长江中下游正式“入梅”!中东部高温降雨齐上阵 湖北中北部有大到暴雨 2018-07-31
  • 2018年4月27日划拨国家社科基金项目鉴定费名单(2) 2018-07-31
  • [微笑]未来的社会,必然是按需(基本需求)分配+按劳(劳动价值或劳动能力)分配相联合的混合分配方式。 2018-07-30
  • “一带一路”建设工作座谈会 2018-07-30
  • 只要等一等就能多“等”出8600万美元! 2018-07-29
  • 2017年秋季学期学员第十三支部风采 2018-07-18
  • 980| 865| 531| 569| 298| 391| 414| 925| 949| 111|