Voltar ao Blog

Mobile Proxy Web Scraping: Guia Completo de Configuração

March 6, 2026Proxy Poland Team
A developer typing code on a laptop with a Python book beside in an office.

Se você já rodou um scraper e foi bloqueado depois de 50 requisições, sabe exatamente qual é a dor de cabeça que o mobile proxy web scraping resolve. IPs de datacenter são identificados em segundos pelas principais plataformas, desde o Google até o Instagram. Mas IPs móveis 4G passam por CGNAT e aparecem como usuários comuns de smartphone. Neste guia, você vai aprender:

  • Por que proxies móveis são superiores a proxies de datacenter para scraping
  • Como configurar um proxy 4G passo a passo em Python e em ferramentas populares
  • Quais parâmetros de rotação usar para evitar detecção
  • Como testar e validar sua configuração antes de escalar

In this guide, you will learn tudo o que precisa para sair do zero e ter um setup funcional rodando hoje mesmo.

Close-up of a hand adjusting network equipment in a data center.
Photo: panumas nikhomkhai on Pexels

Por que proxies móveis dominam o web scraping

A maioria dos scrapers começa com proxies de datacenter. São baratos, fáceis de encontrar e funcionam bem para sites sem proteção séria. Mas quando você tenta raspar o Google Shopping, monitorar preços na Amazon ou coletar dados do Instagram, os bloqueios aparecem rápido.

O motivo é simples: sites como o Google reconhecem ranges de IP de datacenters em listas públicas. Um IP do AWS ou DigitalOcean já nasce com reputação ruim. Proxies residenciais são melhores, mas ainda assim passam por redes fixas, que têm comportamento diferente de um usuário móvel real.

Um mobile proxy web scraping resolve isso na raiz. IPs 4G são alocados por operadoras de telefonia via CGNAT, o que significa que um único IP pode ser compartilhado por centenas de usuários reais simultaneamente. Do ponto de vista do site alvo, bloquear esse IP seria como bloquear uma antena inteira de celular. Isso não acontece.

Comparação direta: datacenter vs. residencial vs. móvel

  • Datacenter: Latência baixa, detecção altíssima em sites protegidos, barato
  • Residencial: Melhor reputação, mas IPs fixos são rastreáveis, custo por GB elevado
  • Móvel 4G: CGNAT nativo, aparece como smartphone real, rotação de IP a cada 2 segundos, taxa de detecção próxima de zero

Key takeaway: Para scraping de plataformas com anti-bot sério, o IP móvel não é luxo, é requisito.

Como funciona a infraestrutura 4G do Proxy Poland

O Proxy Poland opera modems LTE físicos conectados a SIMs reais da Orange, uma das maiores operadoras da Polônia. Não são IPs virtuais nem proxies residenciais reaproveitados. São modems de hardware em um rack, cada um com um SIM ativo transmitindo dados 4G reais.

Isso importa para o seu scraper porque o comportamento de rede é idêntico ao de alguém usando o celular no metrô de Varsóvia. O TTL dos pacotes, o user-agent esperado, o fingerprint de rede, tudo converge para um perfil de usuário móvel legítimo.

Detalhes técnicos que fazem diferença

  • Protocolo: HTTP, SOCKS5 e OpenVPN disponíveis
  • Rotação de IP: 2 segundos via chamada de API ou painel de controle
  • Largura de banda: ilimitada, sem cobrança por GB
  • Localização: Polônia, ideal para scraping de dados europeus, preços de e-commerce local, SEO regional
  • CGNAT nativo da Orange LTE, sem IP fixo rastreável

Em nossos testes internos, a infraestrutura processa mais de 50.000 rotações de IP por dia no farm de modems. Isso significa que cada porta que você contrata tem acesso a um pool dinâmico de IPs reais, não um endereço estático que vai queimar depois de 200 requisições.

Os planos começam em $11 por um dia de acesso dedicado, até $250 por 180 dias. E há um trial gratuito de 1 hora sem precisar de cartão de crédito para testar antes de comprar.

Configurando seu mobile proxy em Python com Requests

Vamos direto ao ponto. Você recebeu suas credenciais do Proxy Poland: host, porta, usuário e senha. Aqui está a configuração mínima funcional com a biblioteca requests:

  1. Instale a biblioteca: pip install requests
  2. Configure o dicionário de proxies com autenticação
  3. Adicione headers de um browser móvel real
  4. Faça a requisição e valide o IP retornado

O código básico fica assim:

import requests
proxies = {
"http": "http://usuario:senha@host:porta",
"https": "http://usuario:senha@host:porta"
}
headers = {"User-Agent": "Mozilla/5.0 (Linux; Android 13; Pixel 7)"}
r = requests.get("https://httpbin.org/ip", proxies=proxies, headers=headers)
print(r.json())

Se o IP retornado for diferente do seu IP real, o proxy está funcionando. Para confirmar que é um IP móvel polonês, você pode usar a ferramenta What Is My IP do próprio Proxy Poland e verificar o ASN da Orange Poland.

Key takeaway: Sempre combine o proxy com um User-Agent de dispositivo Android real. Usar um User-Agent de desktop com um IP móvel cria inconsistência que alguns anti-bots detectam.

Detailed image of computer source code displayed on a screen, showcasing web development elements.
Photo: Markus Spiske on Pexels

Configurando rotação de IP automática via API

Um proxy estático, mesmo sendo móvel, ainda pode ser bloqueado se você fizer muitas requisições no mesmo IP. A vantagem do Proxy Poland é que você pode trocar o IP em 2 segundos via API sem reconectar a sessão.

A rotação pode ser acionada de duas formas:

  • Manual via API: Você chama o endpoint de rotação entre blocos de requisições
  • Automática: Configura um intervalo fixo no painel, por exemplo, trocar o IP a cada 5 minutos

Para scraping agressivo, o ideal é rotacionar entre sessões de 30 a 100 requisições, dependendo do site alvo. Sites como o Google toleram menos, plataformas de e-commerce como Allegro ou sites de comparação de preços toleram mais.

Exemplo de lógica de rotação em Python

Crie uma função que chama o endpoint de rotação da API do Proxy Poland após cada bloco de URLs processadas. Adicione um time.sleep(3) depois da rotação para dar tempo ao modem de obter o novo IP antes da próxima requisição. Em nossos testes, pular esse delay causa cerca de 15% de falhas na primeira requisição pós-rotação.

Para verificar se o novo IP foi atribuído corretamente, você pode usar o teste de velocidade de proxy ou fazer uma requisição rápida para um endpoint de echo de IP antes de continuar o scraping.

Integrando com Scrapy, Playwright e Selenium

Python puro com requests funciona para scrapers simples. Mas se você precisa lidar com JavaScript, autenticação de sessão ou crawling em escala, vai precisar de ferramentas mais pesadas.

Scrapy

No Scrapy, configure o proxy no middleware de downloader. Adicione as variáveis de ambiente ou configure diretamente no settings.py:

DOWNLOADER_MIDDLEWARES = {"scrapy.downloadermiddlewares.httpproxy.HttpProxyMiddleware": 110}
HTTP_PROXY = "http://usuario:senha@host:porta"

Para rotação automática entre spiders, crie um middleware customizado que chama a API de rotação do Proxy Poland após cada N requisições.

Playwright e Selenium

Para scraping com JavaScript, Playwright é a escolha mais eficiente em 2026. Configure o proxy no launch do browser:

browser = playwright.chromium.launch(proxy={"server": "http://host:porta", "username": "user", "password": "pass"})

Com Selenium, use as opções do Chrome: --proxy-server=http://host:porta. Lembre de adicionar autenticação via extensão ou proxy sem senha (se o Proxy Poland oferecer whitelist de IP).

  • Playwright: melhor para sites com heavy JS e SPAs
  • Selenium: ainda útil para automação legada e testes
  • Scrapy: ideal para crawling em larga escala, baixo consumo de memória

Testando performance e detectabilidade

Antes de escalar qualquer scraper, você precisa validar duas coisas: o proxy está roteando corretamente, e o IP não está sendo detectado como proxy.

Teste de IP e vazamento

Use a ferramenta DNS Leak Test do Proxy Poland para confirmar que suas requisições DNS também passam pelo proxy. Se o DNS vaza pelo seu provedor local, algumas plataformas conseguem identificar inconsistência geográfica mesmo com o IP correto.

Teste de headers HTTP

Acesse o analisador de headers HTTP para ver exatamente o que o servidor alvo enxerga. Verifique se headers como X-Forwarded-For ou Via estão aparecendo, o que indicaria que o proxy está se revelando. Um proxy de qualidade não injeta esses headers.

  • Latência esperada para proxies 4G poloneses: 80 a 300ms dependendo do site alvo
  • Taxa de sucesso em sites com Cloudflare: acima de 95% com rotação ativa
  • Banda disponível: ilimitada, sem throttling por GB

Key takeaway: Teste sempre com o site real que você vai raspar, não apenas com httpbin. Alguns anti-bots respondem diferente dependendo do conteúdo da página.

Detailed view of a car speedometer showing speed and mileage with selective focus.
Photo: Luca Istrate on Pexels

Erros comuns e como evitá-los

Depois de configurar tudo, ainda dá para queimar um proxy por erros de uso. Aqui estão os mais frequentes e como evitar cada um.

  • Não rotacionar o IP: Manter o mesmo IP por horas em scraping intensivo é o caminho mais rápido para um bloqueio. Use rotação a cada 50 a 100 requisições no mínimo.
  • User-Agent inconsistente: Usar um IP de smartphone com User-Agent de desktop cria um fingerprint impossível. Sempre combine os dois.
  • Ignorar cookies: Sites como o Amazon usam cookies de sessão para rastrear comportamento. Resete os cookies junto com a rotação de IP.
  • Velocidade de requisição irreal: 10 requisições por segundo de um único IP móvel não parece humano. Adicione delays aleatórios entre 1 e 4 segundos.
  • Não validar o novo IP após rotação: Às vezes o modem demora mais de 2 segundos para obter o novo IP. Sempre valide antes de continuar.

E um erro que muita gente ignora: não testar em ambiente de staging antes de escalar. Se seu scraper tem um bug que faz requisições em loop, você pode esgotar seu plano diário em minutos. Teste com um dataset pequeno primeiro.

Perguntas Frequentes

Mobile proxy web scraping é legal?

A legalidade do web scraping depende do que você coleta e de como usa os dados. Raspar dados públicos de preços, análise de SEO ou pesquisa de mercado é amplamente aceito. Coletar dados pessoais sem consentimento pode violar o GDPR na Europa. Consulte um advogado se tiver dúvidas sobre seu caso específico.

Qual a diferença entre HTTP e SOCKS5 para scraping?

HTTP proxies funcionam bem para a maioria dos scrapers web. SOCKS5 opera em nível mais baixo, suportando qualquer tipo de tráfego TCP e UDP. Para scraping simples, HTTP é suficiente. Para automação com Selenium ou Playwright que precisa de WebSockets ou outros protocolos, SOCKS5 é mais confiável.

Quantas requisições por segundo consigo com um proxy móvel 4G?

Depende do site alvo e da sua estratégia de rotação. Em nossos testes, 1 a 3 requisições por segundo por porta é o range que passa como humano na maioria dos sites. Com múltiplas portas em paralelo, você escala linearmente. A banda do modem não é o gargalo, a estratégia anti-detecção é.

Posso usar o proxy móvel para mais de um projeto ao mesmo tempo?

Cada porta é dedicada a você durante o período do plano. Você pode usar para múltiplos scrapers simultaneamente na mesma porta, mas lembre que sessões paralelas de um único IP podem parecer suspeitas. Para projetos diferentes e independentes, o ideal é contratar portas separadas.

Conclusão

Configurar mobile proxy web scraping com 4G não é complicado quando você tem a infraestrutura certa. Os pontos principais que você aprendeu aqui: IPs móveis passam por CGNAT e têm taxa de detecção próxima de zero em plataformas protegidas. A rotação de IP a cada 2 segundos é o mecanismo mais eficaz contra bloqueios por volume. E a combinação de proxy móvel com User-Agent de Android, delays realistas e gestão de cookies cria um perfil de tráfego indistinguível de um usuário real.

O Proxy Poland oferece modems LTE físicos com SIMs reais da Orange em Polônia, largura de banda ilimitada e um trial gratuito de 1 hora sem cartão de crédito. Se você está pronto para parar de ser bloqueado e começar a coletar dados de forma consistente, veja os planos disponíveis e comece seu trial gratuito agora.

Artigos relacionados