快乐12胆拖价格表图片:the5fire的技术博客

彩票开奖查询 www.8a72.cn 关注Python、Django、Vim、Linux、Web开发、团队管理和互联网--Life is short, we need Python.


python正则表达式替换字符串

作者:the5fire | 标签:       | 发布:2012-02-26 11:29 p.m. | 阅读量: 37687, 36453

一个实例,有一段html代码,不符合xml格式规范,所以要用python对它进行下转换。 其中要转换的地方有:

::

1、[&]转为[&](但是不能把[ ]转了);
2、把代码中的["=""]去掉;
3、把[svg]和[path]标签都改为[svg:svg]和[svg:path];
4、关闭[img]标签;
5、将url()中的["]转为[']

使用正则对html进行了处理。 下面就是代码:

.. code:: python

import re
str_url = 'test,&nbsp;url("//www.baidu.com")&,dddddd "="" <svg></svg><path></path><img src="//www.baidu.com">ininnnin<img src="//www.dd.com">'
#2、把代码中的["=""]去掉;
#3、把[svg]和[path]标签都改为[svg:svg]和[svg:path];
str_url = str_url.replace('"=""','')
str_url = str_url.replace('svg','svg:svg')
str_url = str_url.replace('path', 'svg:path')

#1、[&]转为[&amp;](但是不能把[&nbsp;]转了);
url_re = re.compile('&(?!\w{4};)')
str_result = url_re.sub('&amp;', str_url)

#4、关闭[img]标签;
img_list = re.findall('<img.*?>',str_result)

for img_r in img_list:
    str_result = str_result.replace(img_r,img_r + '</img>')

#5、将url()中的["]转为[']
url_list = re.findall('url\(".*?"\)',str_result)
print url_list
for url_r in url_list:
    url_new = url_r.replace('"','\'')
    str_result = str_result.replace(url_r,url_new)
print str_result
- from www.8a72.cn
----EOF-----

微信公众号:Python程序员杂谈



其他分类:
  • 坐观光巴士 小小代言人带你游广州 2019-04-15
  • 习近平为传统文化“代言” 2019-04-12
  • 这位游客骨骼清奇送你一份小长假游新疆攻略 2019-04-12
  • 5月济南房价走势如何?济南热门楼盘报价一览 ——凤凰网房产济南 2019-04-05
  • 默克尔政权要崩?联盟党闹分裂内政部长威胁“单飞” 2019-04-04
  • 孕妇也要喝奶粉?孕妇奶粉该不该喝要因人而异 2019-03-31
  • 5月份全国首套房贷款利率上涨至5.60% 2019-03-31
  • 新形势下如何做好社区党支部工作 2019-03-27
  • 国际足联成员也就是亚足联成员的中国(大陆)、朝鲜、中华台北、香港、澳门,也可以有蒙古,可联合申办2038年世界杯。其中,中国大陆、朝鲜,算东道主,直接参赛。 2019-03-27
  • 贵州省委常委赵德明任贵阳市委书记(图简历) 2019-03-25
  • 学习贯彻党的十九大精神中央宣讲团宣讲活动综述 2019-03-25
  • 鹿晗全新Remix专辑《Re:Play》发布 首支单曲全球上线鹿晗 专辑 2019-03-21
  • 【奋斗吧2018】风电检修工——荒原上的“听风者” 2019-03-21
  • 世界杯还可以这样看 日媒:中国AI产品抢眼亚洲电子展} 2019-02-27
  • 特朗普下令美国防部组建第六军种“太空军” 2019-02-17
  • 807| 406| 761| 488| 67| 902| 363| 824| 376| 892|