文章 44
浏览 11238
2018年——全国行政区划代码

2018年——全国行政区划代码

在进行一项基于爬虫的项目开发过程中,需要对行政区划代码进行匹配,如果是精确到省级单位还好处理,但如果是精确到市级单位或者更下一级,就不能单纯手写字典去匹配了。 一开始我采取的是爬取一个第三方网站:https://xingzhengquhua.51240.com/ 这个网站的设计比较简单,查询时的速率比较快。 下面放上爬取这个网站的代码 import requests from lxml import etree http_later="00000000__xingzhengquhua/" http_former="https://xingzhengquhua.51240.com/" city_num='2100' website=http_former+city_num+http_later html=requests.get(website).text htmls=etree.HTML(html) tip=htmls.xpath('//*[@id="main_content"]/table/tr/td/table/tr[1]/td/a[last()]') print(tip[0].....