ЧОМУ SELENIUM + PROXY POLAND
Selenium — найпоширеніший фреймворк автоматизації браузера. Маршрутизуючи Selenium через виділені мобільні проксі 4G від Proxy Poland, ви можете скрейпити дані, запускати тести та автоматизувати завдання зі справжніми мобільними IP, що обходять антибот-виявлення.
ІНСТРУКЦІЯ З НАЛАШТУВАННЯ
Встановіть залежності
Встановіть Selenium та webdriver для вашого браузера:
pip install selenium webdriver-manager # or for Node.js: npm install selenium-webdriver
Отримайте дані проксі
Зареєструйтеся на proxypoland.com та отримайте IP проксі, порт, логін та пароль.
Налаштуйте Chrome з проксі (Python)
Налаштуйте Chrome WebDriver з SOCKS5 проксі:
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
PROXY = "socks5://username:password@proxy-ip:port"
options = Options()
options.add_argument(f'--proxy-server={PROXY}')
driver = webdriver.Chrome(options=options)
driver.get('https://whatismyipaddress.com')
print(driver.title)
driver.quit()Налаштуйте HTTP проксі (Python)
Альтернативна конфігурація HTTP проксі:
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
PROXY = "http://username:password@proxy-ip:port"
options = Options()
options.add_argument(f'--proxy-server={PROXY}')
driver = webdriver.Chrome(options=options)
driver.get('https://httpbin.org/ip')
print(driver.page_source)
driver.quit()Налаштуйте з Node.js
Selenium WebDriver з проксі в Node.js:
const { Builder } = require('selenium-webdriver');
const chrome = require('selenium-webdriver/chrome');
const options = new chrome.Options();
options.addArguments(
'--proxy-server=socks5://username:password@proxy-ip:port'
);
const driver = new Builder()
.forBrowser('chrome')
.setChromeOptions(options)
.build();
await driver.get('https://httpbin.org/ip');
console.log(await driver.getTitle());
await driver.quit();Додайте ротацію IP
Ротація IP між сесіями скрейпінгу:
import requests
def rotate_ip():
"""Call Proxy Poland's rotation API"""
response = requests.get(
'https://your-proxy-ip:port/rotate',
auth=('username', 'password')
)
return response.json()
# Rotate before each session
rotate_ip()
driver = webdriver.Chrome(options=options)
# ... scrape with new IPПеревірте ваш IP
Переконайтеся, що Selenium використовує IP проксі:
driver.get('https://httpbin.org/ip')
ip_text = driver.find_element('tag name', 'pre').text
print(f'Current IP: {ip_text}')
# Should show a Polish mobile IPПРОФЕСІЙНІ ПОРАДИ
Використовуйте SOCKS5 для повної маршрутизації трафіку, включаючи DNS-запити
Додайте прапорець --headless для продакшн-скрейпінгу
Реалізуйте експоненціальну затримку для сайтів з обмеженням швидкості
Ротуйте IP між завантаженнями сторінок для масштабного скрейпінгу
Використовуйте undetected-chromedriver для сайтів з просунутим виявленням ботів
ЧУДОВО ПІДХОДИТЬ ДЛЯ
FAQ
Який протокол проксі найкращий для Selenium?+
SOCKS5 для максимальної сумісності та запобігання витоків DNS. HTTP працює для базового скрейпінгу, але SOCKS5 маршрутизує весь трафік, включаючи DNS, через проксі.
Чи можна використовувати Selenium з undetected-chromedriver та цими проксі?+
Так. undetected-chromedriver + мобільні проксі Proxy Poland — найкраща комбінація для скрейпінгу захищених сайтів. Мобільний IP обходить виявлення за IP, а undetected-chromedriver обробляє перевірки відбитків браузера.
Як обробити автентифікацію проксі в Selenium?+
Для Chrome включіть дані в URL проксі: socks5://user:pass@host:port. Для Firefox використовуйте розширення автентифікації проксі або selenium-wire, який обробляє автентифікацію прозоро.
Чи можна запускати headless Selenium з цими проксі?+
Так. Додайте --headless=new до опцій Chrome. Проксі працює ідентично в headless-режимі. Для сайтів, що виявляють headless-браузери, використовуйте undetected-chromedriver.
Як швидко можна скрейпити з мобільними проксі порівняно з дата-центром?+
30-100 Мб/с пропускної здатності на наших 4G з'єднаннях. Хоча це повільніше за чисту швидкість дата-центру, перевага в тому, що вас не блокують. Один успішний запит через мобільний проксі цінніший за 100 заблокованих запитів через IP дата-центру.