圖片來源:圖蟲創意
上篇文章發布后,很多朋友在問能不能爬關鍵詞,話不多說,立馬安排。
不要在意文章格式,程序員不知道搞花里胡哨的文章樣式。記得點贊、評論、轉發獲得更多規則代碼!
先上上篇文章演示的規則代碼。
#獲取指定精確關鍵詞的競品數據(復制以下代碼導入到web scraper中即可)
圖片來源:乃超老師
圖片來源:亞乃超老師圖片來源:乃超老師
圖片來源:乃超老師(由于上傳格式問題,所以截圖方便大家觀看,需要原版請留言)
本文你將學到:
拿到亞馬遜對產品的識別詞
詞頻分析挑出最重要的關鍵詞
通過上述代碼,按昨天方式,直接爬取表格,爬出來之后是下面這樣的:
(圖片來源:亞馬遜平臺截圖)
通過上圖可以發現,平臺識別詞是拿到了,但是并不好分析,好人做到底,簡單表格正則表達式處理方式也教個大家。
拆到干凈數據,主要做5步
1. 替換 %2F 為 / ------> 為了兼容廣告超鏈接轉義問題
2. 替換 *&url=/ 為空 ------> 為了劃分廣告超鏈接中的識別詞
3. 替換 /dp/* 為空 ------> 拆分正常鏈接
4. 替換 https://www.amazon.com 為空 ---> 其他站點對應替換
5. 替換 - 為 空格(記住是空格不是空)
不會換的參考下圖,Excel軟件點擊編輯再點切換
(圖片來源:乃超老師)
通過上述五步操作處理后就是如下圖的數據,干干凈凈,清清楚楚,隨你玩。
(圖片來源:乃超老師)
比如放到詞頻工具中分析哪些詞或詞組用的比較多,如下圖:
(圖片來源:乃超老師)
碼字半小時,純原創純干貨分享,持續關注持續分享。有額外需求的私下交流,能實現的盡量實現,打完收工。
(來源:乃超老師)
以上內容屬作者個人觀點,不代表雨果跨境立場!本文經原作者授權轉載,轉載需經原作者授權同意。?