Zbieranie danych

Web scraping z mobile proxy

Nowoczesne systemy anty-bot blokują IP datacenter w ciągu sekund. Polskie proxy mobilne 4G omijają limity zapytań, Cloudflare i wykrywanie behawioralne — pozwalając zbierać dane na dużą skalę bez trwałego blokowania.

14 min czytania·Aktualizacja: luty 2026

Dlaczego web scraping wymaga mobile proxy

Każdy poważny cel scrapingu wdraża infrastrukturę anty-bot. W chwili, gdy scraper wykona więcej niż 50-100 żądań z jednego IP, następują limity szybkości, wyzwania CAPTCHA lub trwałe bany IP — w ciągu minut na Google, Amazon, LinkedIn i każdej dużej stronie e-commerce.

Omijaj limity szybkości

Rotuj przez operatorskie IP. Każde nowe IP dostaje świeży limit żądań — umożliwiając ponad 10 000 pobrań stron na godzinę przez pulę proxy.

Unikaj trwałych banów

Mobilne IP nigdy nie trafiają trwale na czarne listy — operatorzy przekazują je z powrotem prawdziwym użytkownikom. Historia Twojego IP jest czyszczona przy każdej rotacji.

Pobieraj prawdziwe dane

Strony serwują inną treść podejrzanym IP — fałszywe ceny, puste wyniki, strony przekierowania. Mobilne IP otrzymują identyczne odpowiedzi jak prawdziwi użytkownicy.

Konfiguracja web scrapingu w Python

Zalecany stack Python

Scrapy-- Scraping na dużą skalę

Wbudowany middleware do rotacji proxy, logiki ponownych prób i zarządzania współbieżnością. Najlepszy wybór do scrapingu ponad 100 000 stron.

Requests + BeautifulSoup-- Lekki scraping

Proste parsowanie stron statycznych. Przekaż dane uwierzytelniające proxy bezpośrednio do requests.get(proxies={...}).

Playwright-- Nowoczesne omijanie anty-bot

Automatyzacja przeglądarki Microsoft z możliwościami stealth. Połącz z pluginem playwright-extra stealth do omijania Cloudflare.

Selenium-- Strony z dużą ilością JavaScript

Pełna automatyzacja przeglądarki z obsługą SOCKS5 przez ChromeOptions. Obsługuje SPA i dynamiczną treść.

Puppeteer (pyppeteer)-- Headless Chrome

Sterowanie przez Chrome DevTools Protocol. Doskonały dla stron wymagających renderowania JavaScript i zarządzania sesją.

Konfiguracja rotacji proxy w Scrapy

# settings.py
ROTATING_PROXY_LIST = [
    "http://user:pass@host1:port",
    "http://user:pass@host2:port",
]
DOWNLOADER_MIDDLEWARES = {
    'rotating_proxies.middlewares.RotatingProxyMiddleware': 610,
    'rotating_proxies.middlewares.BanDetectionMiddleware': 620,
}
ROTATING_PROXY_PAGE_RETRY_TIMES = 5

Konfiguracja proxy w Requests

import requests

proxies = {
    "http": "http://user:[email protected]:port",
    "https": "http://user:[email protected]:port",
}
response = requests.get(
    "https://target-site.com/page",
    proxies=proxies,
    timeout=10
)
print(response.text)

Gotowy do skalowania scrapera? Wypróbuj dedykowane Mobile 4G Proxy bezpłatnie przez 1 godzinę.

Strategie omijania systemów anty-bot

Wektor wykryciaRozwiązanie
Reputacja IPUżywaj operatorskich IP mobilnych (Orange 4G) -- najwyższy poziom zaufania, nigdy na listach blokowania ASN
Tempo żądańDodaj losowe opóźnienia (1,5-4,5 s), zmieniaj współbieżność między sesjami
User-AgentRotuj prawdziwe mobilne User-Agenty Chrome/Safari pasujące do OS proxy
Fingerprint przeglądarkiUżywaj pluginu Playwright stealth lub undetected-chromedriver
Śledzenie przez pliki cookieUtrzymuj sesje per IP, czyść pliki cookie przy rotacji IP
Fingerprint TLSUżywaj biblioteki tls-client Python, aby dopasować handshake TLS prawdziwych przeglądarek
Spójność nagłówkówWysyłaj kompletny zestaw nagłówków: Accept, Accept-Language, Referer, Sec-Fetch-*
Wykonanie JavaScriptUżywaj Playwright lub Puppeteer dla treści renderowanych przez JS

Najczęściej zadawane pytania

Dlaczego potrzebuję proxy do web scrapingu?

Strony limitują żądania per IP, aby zapobiec automatycznemu zbieraniu danych — zazwyczaj 10-100 żądań/godzinę przed uruchomieniem blokad lub CAPTCHA. Rotujące mobile proxy rozkładają żądania na czyste operatorskie IP, umożliwiając scrapowanie tysięcy stron na godzinę. Bez proxy IP Twojego serwera trafia na trwałą czarną listę w ciągu minut na każdym poważnym celu.

Jaki typ proxy jest najlepszy do scrapowania Google?

Mobile proxy są najbardziej niezawodne do scrapowania Google. System anty-bot Google (reCAPTCHA, limitowanie szybkości) jest skalibrowany tak, by tolerować ruch z operatorskich IP mobilnych, ponieważ miliardy użytkowników Androida uzyskują dostęp do Google z tych samych sieci. IP datacenter są blokowane niemal natychmiast; residential IP działają, ale są oznaczane szybciej niż mobilne.

Jak rotować proxy w Python ze Scrapy?

Użyj middleware scrapy-rotating-proxies. Skonfiguruj listę proxy z panelu Proxy Poland, następnie przekaż dane uwierzytelniające jako http://user:pass@host:port. Ustaw ROTATING_PROXY_LIST w settings.py lub zaimplementuj niestandardowy middleware downloadera z logiką ponownych prób dla nieudanych żądań.

Czy mobile proxy mogą ominąć Cloudflare?

Mobile proxy znacznie poprawiają wskaźniki omijania Cloudflare w porównaniu z IP datacenter. Bot Score Cloudflare w dużej mierze opiera się na reputacji IP — mobilne operatorskie IP uzyskują wynik 0-5 (najniższe ryzyko), podczas gdy IP datacenter osiągają 90-100 (oznaczone). W połączeniu z właściwym fingerprintem przeglądarki przez plugin Playwright stealth, mobile proxy omijają większość zabezpieczeń Cloudflare.

Ile żądań na godzinę mogę wysłać przez jedno mobile proxy?

Przy rotacji IP — efektywnie bez ograniczeń. Bez rotacji (trwałe IP) respektuj limity szybkości docelowej strony — zazwyczaj 60-300 żądań/godzinę przed uruchomieniem blokad. Do agresywnego scrapingu rotuj IP co 20-50 żądań. Jeden modem Proxy Poland obsługuje tysiące dziennych pobrań stron w połączeniu z inteligentną rotacją.

Czy potrzebuję mobile proxy do scrapowania Amazon?

Mobile proxy przewyższają residential dla Amazon. Strony produktów, ceny i dane Buy Box Amazon są silnie chronione i zwracają różne odpowiedzi w zależności od rodzaju IP. Mobilne IP otrzymują te same strony co prawdziwi kupujący — w tym ceny w czasie rzeczywistym, dostępność i promocje, których IP datacenter nigdy nie zobaczą.

95%+ skuteczność scrapingu

Skaluj scraper z polskimi proxy mobilnymi 4G

Dedykowane modemy Orange LTE. HTTP + SOCKS5. Błyskawiczna rotacja IP. Od $9/dzień.

Zaufały nam setki operatorów w Europie