圖片來源:圖蟲創(chuàng)意
因?yàn)镼A模塊信息太重要,所以寫個(gè)QA自動(dòng)爬取程序,在瀏覽器中爬取競品QA。
部分?jǐn)?shù)據(jù)效果圖如下。
圖片來源:乃超老師
本文分4個(gè)部分:
1. QA的作用
2. 使用步驟
3. 觸類旁通思路
4. 工具代碼
一、QA的作用
1. 從競品中找到買家關(guān)注的點(diǎn),進(jìn)行產(chǎn)品優(yōu)化及問題規(guī)避
2. 弱客服情況下,盡可能從QA層面解答買家疑問,提高轉(zhuǎn)化率
二、使用步驟
1. 谷歌瀏覽器中安裝web scraper插件
2. 導(dǎo)入文章末尾代碼
3. 設(shè)置需爬取的鏈接
https://www.amazon.com/ask/questions/asin/愛森跨境/[1-n]?sort=SUBMIT_DATE
* 將‘愛森跨境’換成想爬的ASIN
* 將‘[1-n]’中的n換成想爬取的頁數(shù)
4. 點(diǎn)擊爬取按鈕、下載表格
圖片來源:乃超老師
三、觸類旁通思路
爬取思路很簡單,針對QA模塊,當(dāng)然能收集到的數(shù)據(jù)有很多,可以按思路自定義自己的爬取規(guī)則
1. 分析網(wǎng)頁結(jié)構(gòu),打開QA模塊主頁
https://www.amazon.com/ask/questions/asin/B08D6CLGLH/1?sort=SUBMIT_DATE
圖片來源:亞馬遜平臺(tái)截圖
根據(jù)網(wǎng)頁分析,得出三點(diǎn)結(jié)論:
* 鏈接拼湊結(jié)果為 公共部分+ASIN+頁序號(hào)+排序方式
* 排序方式有兩種 Most Helpful first 和 Newest first。對應(yīng)字段值為SUBMIT_DATE、HELPFUL
* 遇到多條回答的問題,無法展開,只能跳到問答詳情頁
因此,根據(jù)流程,要爬取一個(gè)問題的所有回答,則必須抓取詳情頁數(shù)據(jù)。問答詳情頁分析如下:
圖片來源:亞馬遜平臺(tái)截圖
由圖可知,一個(gè)問答對應(yīng)一個(gè)問答ID,問答詳情頁面也是由該ID拼接而成。所以只需打開不同問題拿到對應(yīng)問題下的所有回答就好。
加入我們獲取更多純干貨內(nèi)容,教你如何用通俗代碼解決平常數(shù)據(jù)收集和分析問題。
(來源:乃超老師)
以上內(nèi)容屬作者個(gè)人觀點(diǎn),不代表雨果跨境立場!本文經(jīng)原作者授權(quán)轉(zhuǎn)載,轉(zhuǎn)載需經(jīng)原作者授權(quán)同意。?