京东商品详情页采集工具介绍
打开京东商品详情页(实例网址:https://item.jd.com/100006607659.html#crumb-wrap),采集点击不同的参数(颜色、版本等)后得到的数据(商品编号、价格、主图链接等字段会随着参数变化而变化)。
京东商品详情页采集工具玩法
鼠标放到图片上,右键,选择【在新标签页中打开图片】可查看高清大图
下文其他图片同理
采集字段
商品标题、颜色、版本、价格、商品名称、商品编号、图片网址等。
采集结果
采集结果可导出为Excel、CSV、HTML、数据库等多种格式。导出为Excel示例:
京东商品详情页采集工具技巧
步骤一、打开网页
步骤二、循环点击颜色属性,并提取对应文本
步骤三、循环点击版本属性,并提取对应文本
步骤四、提取其他字段
步骤五、编辑字段
步骤六、启动采集
京东商品详情页采集工具使用方法
以下为具体步骤:
步骤一、打开网页
在首页输入框中,输入网址https://item.jd.com/100006607659.html#crumb-wrap,然后点击【开始采集】,八爪鱼自动打开网页。
特别说明:
a.打开网页后,如果开始开始【自动识别】,请等待自动识别完成。八爪鱼支持自动识别网页上的列表、滚动和翻页,识别成功后直接启动采集即可获取数据。如果【自动识别】的结果不是我们需要的,可点击【取消】关闭智能识别,自行配置采集流程。详情点击查看【自动识别】
步骤二、循环点击颜色属性,并提取对应文本
通过以下几步,实现点击每个颜色属性并提取对应文本
1、循环点击颜色属性
2、提取颜色属性的文本
3、将循环点击颜色属性与提取颜色文本联动起来
1、循环点击颜色属性
①选中页面上第1个颜色属性
②在黄色操作提示框中,选择【选中全部】
③选择【循环点击每个链接】
特别说明:
a.经过以上连续3步,【循环-点击元素】创建完成。【循环】中的项,对应着页面上所有颜色属性。启动采集以后,八爪鱼就会按照循环中的顺序依次点击每个颜色属性。
b.为何通过以上3步,可建立【循环-点击元素】?详情点击查看采集点击多个链接后的详情页数据教程。
2、提取颜色属性的文本
选中页面中的颜色属性框,在操作提示框中选择【采集该链接文本】,颜色属性的文本提取下来。
3、将循环点击颜色属性与提取颜色文本联动起来
进入【提取数据】设置页面,勾选【采集当前循环中设置的元素】后保存。
点击【颜色】字段后的 按钮,勾选【相对于循环里的XPath】后保存。
特别说明:
a.什么是【相对于循环里的XPath】?点击查看相对XPath教程
步骤三、循环点击版本属性,并提取对应版本文本
通过以下几步,实现点击每个版本属性并提取对应文本
1、循环点击版本属性
2、提取版本属性的文本
3、将循环点击版本属性与提取版本文本联动起来
1、循环点击版本属性
①选中页面上第1个版本属性
②在黄色操作提示框中,选择【选中全部】
③选择【循环点击每个链接】
特别说明:
a.经过以上连续3步,【循环-点击元素】创建完成。【循环】中的项,对应着页面上所有版本属性。启动采集以后,八爪鱼就会按照循环中的顺序依次点击每个版本属性。
b.为何通过以上3步,可建立【循环-点击元素】?详情点击查看采集点击多个链接后的详情页数据教程。
2、提取版本属性的文本
选中页面中的版本属性框,在操作提示框中选择【采集该链接文本】,版本属性的文本提取下来。
3、将循环点击版本属性与提取版本文本联动起来
进入【提取数据】设置页面,勾选【采集当前循环中设置的元素】后保存。
点击【版本】字段后的 按钮,勾选【相对于循环里的XPath】后保存。
特别说明:
a.什么是【相对于循环里的XPath】?点击查看相对XPath教程
b.经过步骤二和步骤三,版本属性的【循环-点击元素】内嵌在颜色属性的【循环-点击元素】中,根据采集原理与流程执行逻辑中学到的知识,我们知道它会从上到下,由内而外执行流程,展示出每种颜色属性和版本属性的组合,以采集其对应数据,如下图所示。如果有更多其他属性,则继续向内建立嵌套循环。
步骤四、提取其他字段
选中页面中的文本,然后在操作提示框中,点击【采集该元素文本】。
文本类字段都可以按照这样的方式提取。示例中我们提取了商品标题、商品价格、主图链接、商品编号等多个字段。
特别说明:
a.文本、图片、视频、源码是不同的数据形式,在操作提示框选择提取方式时稍有不同。文本一般为【采集该元素文本】,图片一般为【采集该图片地址】,更多提取方式请点击查看 不同数据类型(文本、图片、链接、源码等)的抓取方式教程
步骤五、编辑字段
1、编辑字段
进入【提取数据1】设置页面,可删除多余字段,修改字段名,移动字段顺序等。
2、格式化字段
【商品名称】和【商品编号】这2个字段,默认提取的内容有与表头重复的部分。如果没关系,可跳过此步骤。
如果想要去掉内容中多余的部分,可使用数据格式化功能。
以【商品名称】格式化为例:点击字段后的 按钮,选择【格式化数据】→点击【添加步骤】,选择【替换】,将【商品名称:】替换为【空】,输出【华为P40Pro】并保存。
特别说明:
a.数据格式化是什么?点击查看数据格式化教程。
步骤六、启动采集
1、单击【采集】并【启动本地采集】。启动后八爪鱼开始自动采集数据。
特别说明:
a.【本地采集】是使用自己的电脑进行采集,【云采集】是使用八爪鱼提供的云服务器采集,点击查看本地采集与云采集详解。
2、采集完成后,选择合适的导出方式来导出数据。支持导出为Excel,CSV,HTML,数据库等。这里导出为Excel。
拓展阅读
以上教程详解了如何采集京东单个商品详情页数据,多个商品详情页怎么办呢?
如果已有一批京东商品详情页链接,可使用URL循环功能
也可以通过 京东商品列表数据采集(搜索关键词)和京东商品列表数据采集(分类目),先获得一批京东商品详情页链接,再使用URL循环功能
能够下载京东商城的商品详情页图片、主图、SKU图,大尺寸高清原图无损。还支持下载京东主图视频,软件特色:下载后用商品标题作为文件夹的名称,然后sku图、主图、详情图分成三个小文件夹,并且sku图也带名称的,方便查看。
优乐彩靠谱吗 乐鱼 怎么下载 九游安卓官网 博彩众博合法 bob体彩下载 bet是什么电子产品 bet365一站式 锐万博狂犬每年要打吗 乐彩彩票论坛手机版 九游游戏刀塔传奇下载 近年我国体育方面政策 中国足球体育彩票下载 体育品牌店 乐动体育直播国际米兰 上期体育彩票开奖结果展开


YY童话故事app下载-YY童话故事2.2.8 最新版
卡通闹钟app-卡通闹钟1.1.6安卓版
碧桂园售楼系统-碧桂园线上买房9.4手机版
小朋友画廊活动-腾讯公益小朋友画廊最新版活动软件1.0 苹果版
爱奇艺小游戏下载-爱奇艺小游戏app2.13.1 安卓版
博士妈咪app-尿不湿提醒器(博士妈咪)1.09 通用版
犀牛并购app下载-犀牛并购最新版1.0.0正式版
萌宠音汇app-萌宠音汇猫狗翻译器1.2.0 苹果版
沃克校园学生端6.6.7 安卓版
伊利会员中心app最新版本下载-伊利会员中心APP2.21 官方客户端
黑骑士传说对决游戏下载-黑骑士传说对决(Black Knight Legend中文版)1.0.2正式版
刺沙游戏多游平台下载-刺沙h5单职业版1.0h5版
多彩屏幕取色助手软件下载-多彩屏幕取色助手2.0绿色免费版
mysql密码修改-护卫神·MySQL密码修改工具1.3 官方最新版
飞机快跑游戏下载-飞机快跑(Run Run)1.3 安卓最新版
合合家园手游下载-合合家园游戏1.20.0 安卓手机版
2017愚人节手抄报-2017小学生愚人节手抄报大全整合版
问学长app-问学长学霸app2.9.11 中文免费版
艺术猫-艺术猫(艺术品)3.0 拍卖版
明珠三国安卓版5.6.4免费版