采集亞馬遜熱搜關鍵詞的代碼竟如此簡單!
在我們日常應用搜索引擎的時候,用戶在搜索框搜索相干問題時,會輸入大批的癥結字,每一次輸入就是對癥結字的一次投票。那么癥結字被輸入的次數越多,它對應的查詢就比擬熱點,所以須要把查詢的癥結字記載下來,并且統計出每個癥結字的頻率,便利提醒成果依照頻率排序。而在亞馬遜中的搜索也是如此。那么如何批量的依據自己設置的癥結詞去采集亞馬遜推舉的熱搜詞呢?
很簡略,用Python只需4步即可實現!
1、打開閱讀器拜訪亞馬遜,在亞馬遜主頁按下“F12”或者右擊查看網頁源代碼,并切換到“Network”。
2、在搜索框中輸入任意字符,并抓包剖析數據。
這時候我們會看到掌握臺中涌現了“suggestions?.....”的要求。點擊并切換到Response選項卡中,可以清晰的看到亞馬遜返回的數據。我們將數據拷貝出來,美化一下拜訪——www.json.cn將所得數據拷貝進去,返回的數據是一個尺度的json數據,在數據中”Value”這個“鍵”對應的值就是亞馬遜的熱搜癥結字!
如此一來我們只須要帶上癥結字模仿要求這個接口,即可拿到亞馬遜返回的熱搜癥結字。是不是很簡略?
3、復制Curl,生成代碼。
還是用最簡略的辦法給大家演示,首先在“suggestions?.....”的要求上鼠標右鍵選擇Copy→Copy as cURL。
然后拜訪https://curl.trillworks.com/(注意這是英文網站,拜訪須要必定的時光),將復制的cURL填進去即可主動生成Python代碼。再將生成的代碼復制出來,在python的集成開發環境——PyCharm中復制進去。
4、完美代碼,運行程序。
在測試當中,將一些不必要的參數刪除最終只需三個參數、幾行代碼即可實現。
import requests
keyword = str(input('請輸入癥結字:'))
headers = {
'Accept': 'application/json, text/java, */*; q=0.01',
'Referer': 'https://www.amazon.com/',
'Origin': 'https://www.amazon.com',
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36',
}
params = (
('mid', 'ATVPDKIKX0DER'),
('alias', 'aps'),
('prefix', keyword),
)
response=requests.get('https://completion.amazon.com/api/2017/suggestions',
headers=headers, params=params)
suggestions = response.json()['suggestions']
for i in suggestions:
value = i['value']
print(value)
當然上述幾行代碼只能實現個別癥結詞熱搜詞的采集,面對多個癥結詞時,我們可以將癥結字批量的寫入然后挨個的要求即可實現批量采集的目標。
特別聲明:以上文章內容僅代表作者本人觀點,不代表ESG跨境電商觀點或立場。如有關于作品內容、版權或其它問題請于作品發表后的30日內與ESG跨境電商聯系。
平臺顧問
微信掃一掃
馬上聯系在線顧問
小程序
ESG跨境小程序
手機入駐更便捷
返回頂部