POR QUÉ SELENIUM + PROXY POLAND
Selenium es el framework de automatización de navegadores más utilizado. Al enrutar Selenium a través de los proxies móviles 4G dedicados de Proxy Poland, puede recopilar datos, ejecutar pruebas y automatizar tareas con IPs móviles genuinas que evitan la detección anti-bot.
INSTRUCCIONES DE CONFIGURACIÓN
Instale Dependencias
Instale Selenium y el webdriver para su navegador:
pip install selenium webdriver-manager # or for Node.js: npm install selenium-webdriver
Obtenga las Credenciales del Proxy
Regístrese en proxypoland.com y obtenga su IP de proxy, puerto, usuario y contraseña.
Configure Chrome con Proxy (Python)
Configure Chrome WebDriver con proxy SOCKS5:
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
PROXY = "socks5://username:password@proxy-ip:port"
options = Options()
options.add_argument(f'--proxy-server={PROXY}')
driver = webdriver.Chrome(options=options)
driver.get('https://whatismyipaddress.com')
print(driver.title)
driver.quit()Configure con Proxy HTTP (Python)
Configuración alternativa de proxy HTTP:
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
PROXY = "http://username:password@proxy-ip:port"
options = Options()
options.add_argument(f'--proxy-server={PROXY}')
driver = webdriver.Chrome(options=options)
driver.get('https://httpbin.org/ip')
print(driver.page_source)
driver.quit()Configure con Node.js
Selenium WebDriver con proxy en Node.js:
const { Builder } = require('selenium-webdriver');
const chrome = require('selenium-webdriver/chrome');
const options = new chrome.Options();
options.addArguments(
'--proxy-server=socks5://username:password@proxy-ip:port'
);
const driver = new Builder()
.forBrowser('chrome')
.setChromeOptions(options)
.build();
await driver.get('https://httpbin.org/ip');
console.log(await driver.getTitle());
await driver.quit();Agregue Rotación de IP
Rote la IP entre sesiones de scraping:
import requests
def rotate_ip():
"""Call Proxy Poland's rotation API"""
response = requests.get(
'https://your-proxy-ip:port/rotate',
auth=('username', 'password')
)
return response.json()
# Rotate before each session
rotate_ip()
driver = webdriver.Chrome(options=options)
# ... scrape with new IPVerifique su IP
Compruebe que Selenium está usando la IP del proxy:
driver.get('https://httpbin.org/ip')
ip_text = driver.find_element('tag name', 'pre').text
print(f'Current IP: {ip_text}')
# Should show a Polish mobile IPCONSEJOS PRO
Use SOCKS5 para enrutamiento completo de tráfico incluyendo consultas DNS
Agregue el flag --headless para scraping en producción
Implemente backoff exponencial para sitios con límites de velocidad
Rote IPs entre cargas de página para scraping a gran escala
Use undetected-chromedriver para sitios con detección avanzada de bots
IDEAL PARA
FAQ
¿Qué protocolo de proxy es mejor para Selenium?+
SOCKS5 para máxima compatibilidad y prevención de fugas DNS. HTTP funciona para scraping básico pero SOCKS5 enruta todo el tráfico incluyendo DNS a través del proxy.
¿Puedo usar Selenium con undetected-chromedriver y estos proxies?+
Sí. undetected-chromedriver + los proxies móviles de Proxy Poland es la mejor combinación para hacer scraping de sitios protegidos. La IP móvil evita la detección basada en IP mientras undetected-chromedriver maneja las verificaciones de huellas digitales del navegador.
¿Cómo manejo la autenticación de proxy en Selenium?+
Para Chrome, incluya las credenciales en la URL del proxy: socks5://usuario:contraseña@host:puerto. Para Firefox, use una extensión de autenticación de proxy o selenium-wire que maneja la autenticación de forma transparente.
¿Puedo ejecutar Selenium headless con estos proxies?+
Sí. Agregue --headless=new a las opciones de Chrome. El proxy funciona de forma idéntica en modo headless. Para sitios que detectan navegadores headless, use undetected-chromedriver.
¿Qué tan rápido puedo hacer scraping con proxies móviles vs datacenter?+
30-100 Mb/s de rendimiento en nuestras conexiones 4G. Aunque más lento que la velocidad pura de datacenter, la ventaja es que no le bloquean. Una solicitud exitosa a través de un proxy móvil vale más que 100 solicitudes bloqueadas a través de una IP de datacenter.