双色球复式中奖表格:the5fire的技术博客

彩票开奖查询 www.8a72.cn 关注Python、Django、Vim、Linux、Web开发、团队管理和互联网--Life is short, we need Python.


python正则表达式替换字符串

作者:the5fire | 标签:       | 发布:2012-02-26 11:29 p.m. | 阅读量: 37744, 36509

一个实例,有一段html代码,不符合xml格式规范,所以要用python对它进行下转换。 其中要转换的地方有:

::

1、[&]转为[&](但是不能把[ ]转了);
2、把代码中的["=""]去掉;
3、把[svg]和[path]标签都改为[svg:svg]和[svg:path];
4、关闭[img]标签;
5、将url()中的["]转为[']

使用正则对html进行了处理。 下面就是代码:

.. code:: python

import re
str_url = 'test,&nbsp;url("//www.baidu.com")&,dddddd "="" <svg></svg><path></path><img src="//www.baidu.com">ininnnin<img src="//www.dd.com">'
#2、把代码中的["=""]去掉;
#3、把[svg]和[path]标签都改为[svg:svg]和[svg:path];
str_url = str_url.replace('"=""','')
str_url = str_url.replace('svg','svg:svg')
str_url = str_url.replace('path', 'svg:path')

#1、[&]转为[&amp;](但是不能把[&nbsp;]转了);
url_re = re.compile('&(?!\w{4};)')
str_result = url_re.sub('&amp;', str_url)

#4、关闭[img]标签;
img_list = re.findall('<img.*?>',str_result)

for img_r in img_list:
    str_result = str_result.replace(img_r,img_r + '</img>')

#5、将url()中的["]转为[']
url_list = re.findall('url\(".*?"\)',str_result)
print url_list
for url_r in url_list:
    url_new = url_r.replace('"','\'')
    str_result = str_result.replace(url_r,url_new)
print str_result
- from www.8a72.cn
----EOF-----

微信公众号:Python程序员杂谈



其他分类:
  • 大众迈特威悠享版上市 国内限量260台 2019-06-16
  • 省国资运营公司机关召开党员大会选举产生第一届机关党委委员 2019-06-16
  • 本论坛上有位网名为“第十阶层1”的网友,你可问问他“阶层”与“阶级”有什么区别!呵呵! 2019-06-13
  • 国际在线:向世界报道中国,向中国报道世界 2019-06-06
  • 【理上网来喜迎十九大】美国丹佛大学孙晶:中国是世界“平稳的基石” 2019-06-06
  • 【清园20年】感恩大回馈!半价!半价! 2019-05-30
  • 詹姆斯不太可能加盟凯尔特人,但绿衫军将保持活跃 2019-05-30
  • 《中国海归人才吸引力》报告发布:“海外抢人大战”升温 2019-05-30
  • 黄河发源地青海“多管齐下”确保“一江清水向东流” 2019-05-28
  • 央视解读不动产登记体系全面运行 房价会下跌 2019-05-28
  • 关注改革最后一公里:湖北纪检等部门用新技术整合分散信息 2019-05-27
  • 中国三大球备战里约奥运 2019-05-27
  • “让劳动理念深入人心” 2019-05-25
  • 小米收购其韩国总代 在三星“后花园”落地 2019-05-24
  • 这个辅警,是朋友圈最能“吹”的人! 2019-05-24
  • 842| 283| 161| 52| 175| 644| 362| 474| 723| 636|