python爬虫--11 京东商城-白红宇的个人博客

python爬虫--11 京东商城

发布日期：2021-05-14 12:19:04 浏览次数：23 分类：原创文章

本文共 1204 字，大约阅读时间需要 4 分钟。

import requestsfrom bs4 import BeautifulSoup## 获取网页信息def getHtmlText(url):    try:        r = requests.get(url)        r.raise_for_status()        r.encoding =r.apparent_encoding        return  r.text    except:        return 'false'## 解析网页参数，获取商品信息def parserHtml(goods_data,html):    soup =BeautifulSoup(html,'html.parser')    lis = soup.find_all('li',class_= 'gl-item')    print(len(lis))    for i in range(len(lis)):        try:            title = lis[i].a['title']            price = lis[i].find('div',class_='p-price').i.string            goods_data.append([title,price])        except:            print('')## 输出数据def  printHtmlGoods(goods_data):    std = r'{0:^100}{1:^8}'    print(std.format('商品名称', '价格'))    for i in range(len(goods_data)):        print(std.format(goods_data[i][0], goods_data[i][0]))def main():    url_basic = 'https://search.jd.com/Search?keyword='    pages = 3    keyword = '电脑'    goods_data = []    for i in range(pages):        page = 1+i*2        url = url_basic + keyword + '&enc=utf-8&wq'+ keyword + '&page=' + str(page)        print(url)        html =getHtmlText(url)        parserHtml(goods_data,html)    printHtmlGoods(goods_data)if __name__ == '__main__':    main()

上一篇：python爬虫--12 股票爬虫

下一篇：python爬虫--10 网易云音乐

发表评论

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！

发表评论

最新留言

关于作者

推荐文章