開始使用

設置通用抓取 API

LunaProxy的通用抓取API 可以從網頁中快速、高效、輕松地提取數據。無論您是新手還是已經有經驗,LunaProxy 都能滿足您的需求,讓您輕松地從網絡收集數據,同時克服現代網站帶來的常見挑戰,包括 CAPTCHA 反機器人機製

開始使用


1.登錄後,點擊側邊欄通用抓取API 進入請求配置頁面

2.配置請求參數

LunaProxy 的 API 提供了一種簡單的網絡抓取方法,只有兩個關鍵參數:

  • API Token – 用於驗證請求的唯一密鑰。

  • URL – 您想要抓取的目標 URL。

請務必仔細檢查您要抓取的 URL 是否正確,以避免出現空格、問號和 & 符號等特殊字符的問題。從而避免請求中斷或數據錯誤解析等常見問題。

您可以執行以下操作:

  1. 選擇想使用的API Token(如需創建新的Token,請點擊跳轉至子賬號頁面)

  2. 粘貼目標 URL 到輸入框。

  3. 選擇呈現方式html或png。

  4. 啟用其他參數如:js渲染、阻止加載、國家/地區。

  5. 選擇編程語言。對於一般用途,請選擇「cURL」以生成適用於任何 HTTP 客戶端的完整 API 端點。

  6. 復製生成的代碼並將其集成到自己的腳本中。

發送第一個請求


https://www.google.com/ 的數據抓取為例。請不要忘記將"token"替換為您的「API Token」。

curl --request POST --url 
https://unlocker-api.lunaproxy.com/request
 --header "Authorization: Bearer token" --header "content-type: application/json" --data "{\"url\":\"
https://www.google.com/\",\"type\":\"html\",\"js_render\":\"False\"}"
 > google.html

參數概覽


使用以下參數自定義您的抓取請求:

範圍
類型
默認
描述

token required

string

獲取您的免費 API 令牌(點擊跳轉創建api token頁面)

您用於身份驗證的唯一 API 密鑰。

url required

string

您要抓取的頁面的 URL。

js_render

boolean

false

使用Headless啟用 JavaScript 渲染。對於現代 Web 應用、SPA 和包含動態內容的網站至關重要。

proxy

string

設置用於請求的 IP 所在的國家/地區(需要高級代理)。

block

string

阻止特定資源(圖片、字體等)加載,以加快抓取速度並減少帶寬占用。

type

string

呈現類型為html或png,默認html。

Last updated

Was this helpful?