淘宝卖家开店运营论坛_淘宝卖家经验交流学习社区

标题: 零一数据「21天小白成大家」No.4 EXCEL函数抓淘宝无线端百页数据 [打印本页]

作者: jiesion1982    时间: 1970-1-1 18:52
不知道实力运用这个方法会怎么样
作者: zhanglbei    时间: 2018-11-20 01:17
标题: 零一数据「21天小白成大家」No.4 EXCEL函数抓淘宝无线端百页数据



作者:零一、有点瘦的胖子
(, 下载次数: 0)



此篇可以视为第3篇的续篇,只是将对象从去哪儿网变化为淘宝网,附上师父的一句教导:被逼无奈,发展最快。再丢一张结果图,立刻进入实操:


(, 下载次数: 0)




打开360欣赏器
打开淘宝官网


(, 下载次数: 0)




→在键盘上按下F12键→左键单击手机端标识


(, 下载次数: 0)




→搜刮框


(, 下载次数: 0)




→在这里键入关键词:衬衫→回车


(, 下载次数: 0)




→销量优先


(, 下载次数: 0)




→Network


(, 下载次数: 0)




→XHR


(, 下载次数: 0)




→点击此链接


(, 下载次数: 0)




→preview


(, 下载次数: 0)




→listItem


(, 下载次数: 0)




→依次点开“0:“至”19:“


(, 下载次数: 0)




→如许大家就找到了必要的全部内容,接下来大家返归去找到链接联合函数就能抓取全部大家能看到的内容,所谓可见即可爬。


(, 下载次数: 0)




→Headers


(, 下载次数: 0)




→找到URL后,大家发现此中有一段编码,大家必要将其解码,一探毕竟。


(, 下载次数: 0)




→在百度搜刮框键入“站长解码”→回车


(, 下载次数: 0)




→站长工具


(, 下载次数: 0)




→URL编码/解码


(, 下载次数: 0)




→将之前的编码粘贴进去→UrlDecode解码


(, 下载次数: 0)




→解码之后大家发现编码原来就是关键词衬衫


(, 下载次数: 0)




→新建一张Excel表格→键入关键词→键入衬衫→选中→插入→表格


(, 下载次数: 0)




→在表包罗标题前打钩→确定


(, 下载次数: 0)




→数据→从表格


(, 下载次数: 0)




→添加列→自界说列


(, 下载次数: 0)




→将之前大家找到带有编码的整串链接复制到“=”背面


(, 下载次数: 0)




→将编码更换成函数Uri.EscapeDataString()
导盲犬:Uri.EscapeDataString()函数是转码用的,默认是utf-8。
注:函数需区分巨细写而且括号是在英文状态下键入的,插入函数的时间要在函数前后加上毗连符号“&”以及引号。


(, 下载次数: 0)




→在括号中心选中→双击关键词


(, 下载次数: 0)




→插入Web.Contents函数
导盲犬:函数Web.Contents()是将从web URL下载的内容返回为二进制值
注:插入的函数Web.Contents()必要在括号内里加“”号,表现引用文本。


(, 下载次数: 0)




→插入Json.Document函数
导盲犬:函数Json.Document()是返回一个JSON文件的内容,直接剖析json的格式化数据。


(, 下载次数: 0)




→确定


(, 下载次数: 0)




→继承


(, 下载次数: 0)




→倒三角符号


(, 下载次数: 0)




→扩展符号


(, 下载次数: 0)




→回到淘宝页面发现大家必要的数据在listItem下。


(, 下载次数: 0)




→仅勾选listItem,并把利用原始列名作为前缀前面的勾去掉→确定


(, 下载次数: 0)




→扩展


(, 下载次数: 0)




→扩展到新行


(, 下载次数: 0)




→扩展


(, 下载次数: 0)




→勾选本身必要的数据→确定


(, 下载次数: 0)




→必要的话,可双击标题键入中文,方便检察。


(, 下载次数: 0)




→开始→关闭并上载


(, 下载次数: 0)




→关闭并上载至


(, 下载次数: 0)




→到这里,一个简朴的爬虫就算完成了。Power Query有一个非常强盛的功能就是他可以记载大家的操纵,假如必要多个关键词的数据只必要在添加后革新一下即可。
→回到Sheet1→键入裤子→双击右侧表1


(, 下载次数: 0)




→革新预览


(, 下载次数: 0)




→开始→关闭并上载→关闭并上载至


(, 下载次数: 0)




→右击表1→革新


(, 下载次数: 0)




→如许就得到新的数据了


(, 下载次数: 0)




假如以为数据量太小,意义不大,可以添加恣意页码爬取,这里我把抓取前5的页的步调解说一下,方便咱们操纵。
→回到Sheet1→按图键入关键词和数字


(, 下载次数: 0)




→双击右侧表1


(, 下载次数: 0)




→双击已添加的自界说


(, 下载次数: 0)




→去掉数字1",加上毗连符号“&”→双击页码→确定


(, 下载次数: 0)




→单击右侧更改的范例→单击"页码"旁边的数字→文本→插入


(, 下载次数: 0)




→重定名的列


(, 下载次数: 0)




→开始→关闭并上载→关闭并上载至


(, 下载次数: 0)




→如许大家就得到了关键词前5页的数据。


(, 下载次数: 0)
作者: flybarca    时间: 2018-11-25 14:52
多谢楼主的分享
作者: foundgirl    时间: 2018-12-26 02:23
学习到了 赶快利用一下去
作者: shine7    时间: 2021-5-3 14:07
谢谢老板的帖子
作者: 419473133    时间: 2021-5-5 01:04
楼主很优秀啊
作者: wjx1985    时间: 2021-6-22 00:16
来学习下,每天学习才能不断地进步 开好淘宝店
作者: JdZclfQn    时间: 2021-6-25 02:26
写的不错 谢谢分享
作者: wdgwdg    时间: 2021-7-15 13:54
过来学习啦 哈哈
作者: huaxiahh    时间: 2021-7-26 16:49
谢谢楼主分享
作者: chenhu0108    时间: 2021-10-5 16:36
很好学习了
作者: eUzWWhFM    时间: 2021-11-10 10:46
66666666666666
作者: zukafuji    时间: 2021-11-13 04:29
看看学习下 支持个
作者: value163    时间: 2021-11-27 17:09
厉害学习到了
作者: kekeimm    时间: 2021-11-27 19:24
很不错 谢谢分享
作者: 花枝俏    时间: 2021-12-29 04:06
6666 不错好文章
作者: djhanleng    时间: 2022-5-2 09:02
来论坛来学习淘宝知识的
作者: culexiong    时间: 2022-6-23 23:56
文章很好,学习了楼主
作者: ...愛的回億...    时间: 2023-10-11 23:11
支持楼主  来学习一下




欢迎光临 淘宝卖家开店运营论坛_淘宝卖家经验交流学习社区 (https://www.tao92.com/) Powered by Discuz! X3.3