[Python学习]网络爬虫
发布时间:2025-06-24 17:34:53 作者:北方职教升学中心 阅读量:617
一、实现目标。
在JD.COM网站上获取商品的评论统计数据,并利用这些数据制作简单的柱状图。
二、实现步骤。
2.1 网页分析。
首先打开链接httpsps链接://www.jd.com/。在搜索框中输入巧克力关键字后,单击第一个产品打开产品网页,找到产品评估,并在产品评估模块中看到用户选择的评论标签。该产品的所有用户评论都是50万 ,数据量大。我们需要收集商品的特性,所以我们选择分析评价标签。
打开 https://item.jd.com/100034992588.html,查看网页源代码,使用鼠标定位法查看节点中要提取的评论标签 class="tag-1" 中。使用 Ctrl F 打开搜索栏,输入 .tag-1 查看检索结果,如图所示,可确定搜索数量为12,与评论数量一致,可直接使用标签-1 进行筛选。
2.2 网页请求。
“复制商品链接”https。