为何选择 PYTHON + PROXY POLAND
Python 是网络爬取、数据收集和自动化最流行的语言。通过 Proxy Poland 的 4G 手机代理路由您的 Python 请求,您将获得真实的手机运营商 IP,可绕过反机器人系统和地理限制。
设置说明
安装 Requests 库
安装 requests 库或您喜欢的 HTTP 客户端:
pip install requests # For SOCKS5 support: pip install requests[socks] # For async scraping: pip install aiohttp
获取代理凭据
在 proxypoland.com 注册并获取您的代理 IP、端口、用户名和密码。
配置 HTTP 代理(requests)
通过 HTTP 代理路由请求:
import requests
proxies = {
'http': 'http://username:password@proxy-ip:port',
'https': 'http://username:password@proxy-ip:port',
}
response = requests.get(
'https://httpbin.org/ip',
proxies=proxies
)
print(response.json())
# Should show Polish mobile IP配置 SOCKS5 代理
使用 SOCKS5 进行包括 DNS 在内的完整流量路由:
import requests
proxies = {
'http': 'socks5://username:password@proxy-ip:port',
'https': 'socks5://username:password@proxy-ip:port',
}
response = requests.get(
'https://httpbin.org/ip',
proxies=proxies
)
print(response.json())与 Scrapy 一起使用
配置 Scrapy 使用手机代理:
# scrapy settings.py
HTTP_PROXY = 'http://username:password@proxy-ip:port'
DOWNLOADER_MIDDLEWARES = {
'scrapy.downloadermiddlewares.httpproxy.HttpProxyMiddleware': 110,
}
# Or use ROTATING_PROXY_LIST:
ROTATING_PROXY_LIST = [
'http://username:password@proxy-ip:port',
]添加 IP 轮换
使用轮换 API 在爬取会话之间轮换 IP:
import requests
def rotate_ip(proxy_ip, port, username, password):
"""Trigger IP rotation via Proxy Poland API"""
response = requests.get(
f'http://{proxy_ip}:{port}/rotate',
auth=(username, password)
)
return response.json()
# Rotate before each scraping batch
new_ip = rotate_ip('proxy-ip', 'port', 'user', 'pass')
print(f'New IP: {new_ip}')验证您的 IP
检查您的请求是否通过代理路由:
import requests
proxies = {
'http': 'http://username:password@proxy-ip:port',
'https': 'http://username:password@proxy-ip:port',
}
response = requests.get('https://httpbin.org/ip', proxies=proxies)
print(response.json()['origin'])
# Should show Polish mobile carrier IP专业提示
使用 SOCKS5 防止敏感爬取任务中的 DNS 泄露
对有速率限制的网站实施带指数退避的重试逻辑
在爬取批次之间轮换 IP 以避免基于 IP 的封禁
使用 aiohttp 与 asyncio 进行高吞吐量并发爬取
设置真实的 User-Agent 标头以补充手机 IP
适用于以下场景
FAQ
哪个 Python 库最适合手机代理?+
requests 是基本爬取最简单的选择。对于异步工作负载使用 aiohttp。对于大规模爬取框架,带代理中间件的 Scrapy 是理想选择。
我可以在 Python 中使用 SOCKS5 吗?+
可以。安装 requests[socks](pip install requests[socks]),并使用 socks5://用户:密码@主机:端口 作为代理 URL。SOCKS5 路由所有流量包括 DNS。
如何在 Python 中处理代理认证?+
直接在代理 URL 中传递凭据:http://用户名:密码@主机:端口 或使用 requests 的代理字典。HTTP 和 SOCKS5 认证都支持。
我可以将这些代理与 Scrapy 一起使用吗?+
可以。设置 ROTATING_PROXY_LIST 或配置带代理凭据的自定义下载器中间件。Scrapy 的内置代理支持与我们的代理无缝配合。
使用 Python + 手机代理的爬取速度有多快?+
我们的 4G 连接提供 30-100 Mb/s 的吞吐量。使用异步 Python(aiohttp + asyncio),您可以通过单个代理处理数十个并发请求。