python爬虫--08 淘宝比价-白红宇的个人博客

python爬虫--08 淘宝比价

发布日期：2021-05-14 12:19:01 浏览次数：19 分类：原创文章

本文共 1054 字，大约阅读时间需要 3 分钟。

import requestsimport redef getHTMLText(url):    try:        r = requests.get(url)        r.raise_for_status()        r.encoding = 'utf-8'        return r.text    except:        print('Fail')def parsePage(html,ilt):    try:        tits = re.findall(r'\"raw_title\"\:\".*?\"',html)        pris = re.findall(r'\"view_price\"\:\"[\d\.]*\"',html)        for i in range(len(tits)):            title = eval(tits[i].split(':')[1])            price = eval(pris[i].split(':')[1])            ilt.append([title,price])    except:        print("")def printGoodsList(ilt):    tplt = "{:4}\t{:32}\t{:8}"    print(tplt.format("序号","商品名称","价格"))    count = 0    for g in ilt:        count +=1        print(tplt.format(count,g[0],g[1]))def main():    page =3    goods = '书包'    start_url = 'https://s.taobao.com/search?q=' + goods    infolist = []    for i in range(page):        try:            url = start_url  +'&s=' + str(44*i)            html = getHTMLText(url)            parsePage(html,infolist)        except:            continue    printGoodsList(infolist)main()

上一篇：python爬虫--09 大学排名

下一篇：python爬虫--06 Scrapy爬虫框架

发表评论

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！

发表评论

最新留言

关于作者

推荐文章