Zbieranie danych

Web scraping z mobile proxy

Nowoczesne systemy anty-bot blokują IP datacenter w ciągu sekund. Polskie proxy mobilne 4G/5G omijają limity zapytań, Cloudflare i wykrywanie behawioralne — pozwalając zbierać dane na dużą skalę bez trwałego blokowania.

Proxy do web scrapingu dają crawlerom dodatkowe adresy wyjściowe, aby nie zużywać jednej tożsamości sieciowej. Ten poradnik pokazuje, kiedy mobile proxy jest warte kosztu, jak planować rotację i współbieżność oraz jak bezpiecznie łączyć protokół, fingerprint przeglądarki, limity targetu i wolumen zapytań w stabilnym procesie zbierania danych.

Proxy do scrapingu trzeba omawiać razem z całym crawlerem. Ten tekst powinien łączyć jakość IP z tempem zapytań, retry, sesjami, nagłówkami, zasadami targetu i legalnymi ograniczeniami, bez udawania, że proxy naprawi słaby scraper.

Autor: Proxy PolandOpublikowano: 1 lutego 2026Ostatnia aktualizacja: 29 maja 2026

Dlaczego web scraping wymaga mobile proxy

Każdy poważny cel scrapingu wdraża infrastrukturę anty-bot. W chwili, gdy scraper wykona więcej niż 50-100 żądań z jednego IP, następują limity szybkości, wyzwania CAPTCHA lub trwałe bany IP — w ciągu minut na Google, Amazon, LinkedIn i każdej dużej stronie e-commerce.

Wskaźniki blokad proxy według typu (DataDome, 2025)

IP datacenter: są blokowane na ponad 90% dużych stron e-commerce i mediowych — listy blokad ASN utrzymywane przez Cloudflare, DataDome i PerimeterX flagują je przy pierwszym żądaniu.
IP mobile 4G/5G: mają poniżej 2% blokad na tych samych celach — jeden carrier IP 4G/5G współdzieli jednocześnie 100–500 realnych użytkowników, więc banowanie na poziomie IP generowałoby ogromne false positive.
Popyt AI search: usługi takie jak Perplexity przetwarzają ponad 30 mln zapytań dziennie i potrzebują stale świeżych danych z webu — każde zapytanie zależy od scraperów skutecznych przy pierwszej próbie.

ograniczaj limity szybkości

Rotuj przez operatorskie IP. Każde nowe IP dostaje świeży limit żądań — umożliwiając ponad 10 000 pobrań stron na godzinę przez pulę proxy.

Unikaj trwałych banów

Mobilne IP nigdy nie trafiają trwale na czarne listy — operatorzy przekazują je z powrotem prawdziwym użytkownikom. Historia Twojego IP jest czyszczona przy każdej rotacji.

Pobieraj prawdziwe dane

Strony serwują inną treść podejrzanym IP — fałszywe ceny, puste wyniki, strony przekierowania. Mobilne IP otrzymują identyczne odpowiedzi jak zwykli użytkownicy.

Konfiguracja web scrapingu w Python

Zalecany stack Python

Scrapy-- Scraping na dużą skalę

Wbudowany middleware do rotacji proxy, logiki ponownych prób i zarządzania współbieżnością. Najlepszy wybór do scrapingu ponad 100 000 stron.

Requests + BeautifulSoup-- Lekki scraping

Proste parsowanie stron statycznych. Przekaż dane uwierzytelniające proxy bezpośrednio do requests.get(proxies={...}).

Playwright-- Nowoczesne omijanie anty-bot

Automatyzacja przeglądarki Microsoft z możliwościami stealth. Połącz z pluginem playwright-extra stealth do omijania Cloudflare.

Selenium-- Strony z dużą ilością JavaScript

Pełna automatyzacja przeglądarki z obsługą SOCKS5 przez ChromeOptions. Obsługuje SPA i dynamiczną treść.

Puppeteer (pyppeteer)-- Headless Chrome

Sterowanie przez Chrome DevTools Protocol. Doskonały dla stron wymagających renderowania JavaScript i zarządzania sesją.

Konfiguracja rotacji proxy w Scrapy

# settings.py
ROTATING_PROXY_LIST = [
    "http://user:pass@host1:port",
    "http://user:pass@host2:port",
]
DOWNLOADER_MIDDLEWARES = {
    'rotating_proxies.middlewares.RotatingProxyMiddleware': 610,
    'rotating_proxies.middlewares.BanDetectionMiddleware': 620,
}
ROTATING_PROXY_PAGE_RETRY_TIMES = 5

Konfiguracja proxy w Requests

import requests

proxies = {
    "http": "http://user:pass@proxy.proxypoland.com:port",
    "https": "http://user:pass@proxy.proxypoland.com:port",
}
response = requests.get(
    "https://target-site.com/page",
    proxies=proxies,
    timeout=10
)
print(response.text)

Gotowy do skalowania scrapera? Wypróbuj dedykowane Mobile 4G/5G Proxy bezpłatnie przez 1 godzinę.

Strategie omijania systemów anty-bot

Wektor wykrycia	Rozwiązanie
Reputacja IP	Używaj operatorskich IP mobilnych (4G/5G) -- mocniejszy sygnał zaufania, nigdy na listach blokowania ASN
Tempo żądań	Dodaj losowe opóźnienia (1,5-4,5 s), zmieniaj współbieżność między sesjami
User-Agent	Rotuj prawdziwe mobilne User-Agenty Chrome/Safari pasujące do OS proxy
Fingerprint przeglądarki	Używaj pluginu Playwright stealth lub undetected-chromedriver
Śledzenie przez pliki cookie	Utrzymuj sesje per IP, czyść pliki cookie przy rotacji IP
Fingerprint TLS	Używaj biblioteki tls-client Python, aby dopasować handshake TLS rzeczywistych przeglądarek
Spójność nagłówków	Wysyłaj kompletny zestaw nagłówków: Accept, Accept-Language, Referer, Sec-Fetch-*
Wykonanie JavaScript	Używaj Playwright lub Puppeteer dla treści renderowanych przez JS

ASN operatorów mobile mają 10–50x niższy udział ruchu botowego niż ASN datacenter według analiz baz reputacji Cloudflare i PerimeterX. Ta różnica strukturalna — nie technika obchodzenia zabezpieczeń — wyjaśnia, dlaczego mobile IP przechodzą challenge, których datacenter IP nie przechodzą.

Najczęściej zadawane pytania

01Dlaczego potrzebuję proxy do web scrapingu?+

Strony limitują żądania per IP, aby zapobiec automatycznemu zbieraniu danych — zazwyczaj 10-100 żądań/godzinę przed uruchomieniem blokad lub CAPTCHA. Rotujące mobile proxy rozkładają żądania na czyste operatorskie IP, umożliwiając scrapowanie tysięcy stron na godzinę. Bez proxy IP Twojego serwera trafia na trwałą czarną listę w ciągu minut na każdym poważnym celu.

02Jaki typ proxy jest najlepszy do scrapowania Google?+

Mobile proxy są najbardziej niezawodne do scrapowania Google. System anty-bot Google (reCAPTCHA, limitowanie szybkości) jest skalibrowany tak, by tolerować ruch z operatorskich IP mobilnych, ponieważ miliardy użytkowników Androida uzyskują dostęp do Google z tych samych sieci. IP datacenter są blokowane niemal natychmiast; residential IP działają, ale są oznaczane szybciej niż mobilne.

03Jak rotować proxy w Python ze Scrapy?+

Użyj middleware scrapy-rotating-proxies. Skonfiguruj listę proxy z panelu Proxy Poland, następnie przekaż dane uwierzytelniające jako http://user:pass@host:port. Ustaw ROTATING_PROXY_LIST w settings.py lub zaimplementuj niestandardowy middleware downloadera z logiką ponownych prób dla nieudanych żądań.

04Czy mobile proxy mogą ominąć Cloudflare?+

Mobile proxy znacznie poprawiają wskaźniki omijania Cloudflare w porównaniu z IP datacenter. Bot Score Cloudflare w dużej mierze opiera się na reputacji IP — mobilne operatorskie IP uzyskują wynik 0-5 (najniższe ryzyko), podczas gdy IP datacenter osiągają 90-100 (oznaczone). W połączeniu z właściwym fingerprintem przeglądarki przez plugin Playwright stealth, mobile proxy omijają większość zabezpieczeń Cloudflare.

05Ile żądań na godzinę mogę wysłać przez jedno mobile proxy?+

Przy rotacji IP — efektywnie bez ograniczeń. Bez rotacji (trwałe IP) respektuj limity szybkości docelowej strony — zazwyczaj 60-300 żądań/godzinę przed uruchomieniem blokad. Do agresywnego scrapingu rotuj IP co 20-50 żądań. Jeden modem Proxy Poland obsługuje tysiące dziennych pobrań stron w połączeniu z inteligentną rotacją.

06Czy potrzebuję mobile proxy do scrapowania Amazon?+

Mobile proxy przewyższają residential dla Amazon. Strony produktów, ceny i dane Buy Box Amazon są silnie chronione i zwracają różne odpowiedzi w zależności od rodzaju IP. Mobilne IP otrzymują te same strony co prawdziwi kupujący — w tym ceny w czasie rzeczywistym, dostępność i promocje, których IP datacenter nigdy nie zobaczą.

07Jak rotować nagłówki User-Agent razem z rotacją IP mobile proxy?+

Paruj każdy rotowany IP ze świeżym, wiarygodnym User-Agentem z tej samej klasy urządzeń — jeśli rotujesz na mobilne IP, używaj mobilnych UA (Chrome na Android, Safari na iOS). Utrzymuj bibliotekę aktualnych UA i losuj losowo. Unikaj UA z datą przeglądarki starszą niż 6 miesięcy — stare wersje są sygnałem ryzyka dla Cloudflare i Akamai. Aktualizuj bibliotekę UA co 4–8 tygodni.

08Jaki jest właściwy poziom współbieżności przy scrapingu za mobile proxy?+

Jeden dedykowany mobile proxy komfortowo obsługuje 5–15 równoległych żądań dla większości celów i 50–200 równoległych dla celów bez captcha na wolniejszych requestach. Przekraczając 20 równoległych na jednym IP, ryzykujesz ograniczenie przepustowości przez operatora i detekcję opartą na rate-limicie. Skaluj przez wiele modemów, a nie przez wyższe współbieżności na jednym.

09Czy powinienem stosować łańcuchowanie proxy, czy rotować przez jeden mobilny endpoint?+

Pomiń łańcuchowanie proxy dla mobile proxy — dodaje 200–400 ms opóźnienia, podwaja tryby awarii i destabilizuje ASN (zdalny serwer widzi inny ASN niż carrier). Zamiast tego rotuj przez jeden mobilny endpoint za pomocą wywołania API lub zaplanowanego timera. Jeden dedykowany modem albo telefon Android z fizyczną kartą SIM i czystym ASN carriera jest bardziej wiarygodny dla celów niż łańcuch przez datacenter.

10Czy mobile proxy obsługują scraping renderowany przez JavaScript z Playwright lub Puppeteer?+

Tak — proxy jest agnostyczne protokołowo, więc ruch HTTP(S) z headless Chrome przechodzi przez nie identycznie jak standardowe żądania. W Playwright ustaw serwer proxy w opcjach launchContext lub browserType.launch. W Puppeteer użyj flagi --proxy-server w argumentach launch. Konfiguracja jest identyczna jak dla każdego innego proxy SOCKS5 lub HTTP — nie ma specyfiki mobile proxy.

11Czy SOCKS5 jest szybszy niż proxy HTTP do scrapingu?+

Marginalnie w teorii — SOCKS5 operuje na niższej warstwie i nie przepisuje nagłówków HTTP, eliminując kilka cykli CPU na żądanie. W praktyce dla mobile proxy różnica jest poniżej 2 ms per żądanie i jest zamaskowana przez opóźnienie LTE. Wybieraj SOCKS5 gdy scraper lub biblioteka natywnie go obsługuje; używaj HTTP proxy gdy cel wymaga określonego nagłówka HTTP lub Twój kod ma gotową obsługę HTTP.

12Jak uniknąć blokad przy scrapingu dużych platform e-commerce jak Allegro lub Ceneo?+

Allegro i Ceneo śledzą fingerprint przeglądarki, opóźnienia między żądaniami, wzorce nawigacji i zachowanie sesji, nie tylko IP. Dla polskich platform: używaj dedykowanego polskiego mobile IP od Proxy Poland (prawidłowy ASN carrier), dodaj losowe opóźnienia 2–8 sekund między żądaniami, imituj rzeczywiste nawigacje (strona główna → kategoria → produkt), utrzymuj sesję ciasteczek przez kilka żądań i rotuj IP najwyżej co 30–60 minut, nie co żądanie.

95%+ skuteczność scrapingu

Skaluj scraper z polskimi proxy mobilnymi 4G/5G

Dedykowane modemy LTE 4G/5G. HTTP + SOCKS5. Błyskawiczna rotacja IP. Od $2/dzień.

Zaufały nam setki operatorów w Europie

Darmowe narzędzia

Zastosowania

Funkcje

Powiązane poradniki

Podstawy

Czym jest mobile proxy?

E-Commerce

Poradnik e-commerce

SEO

Poradnik monitorowania SEO