WARUM PUPPETEER + PROXY POLAND
Puppeteer ist Googles offizielle Node.js-Bibliothek zur Steuerung von Headless Chrome. In Kombination mit Proxy Polands dedizierten 4G-Mobile-Proxys wird Puppeteer zu einem leistungsstarken Werkzeug für Web-Scraping, Tests und Automatisierung, das selbst die aggressivsten Anti-Bot-Systeme umgeht.
EINRICHTUNGSANLEITUNG
Puppeteer installieren
Installieren Sie Puppeteer in Ihrem Node.js-Projekt:
npm install puppeteer # or for minimal install: npm install puppeteer-core
Proxy-Zugangsdaten holen
Registrieren Sie sich auf proxypoland.com und holen Sie sich Ihre Proxy-IP, Port, Benutzername und Passwort vom Dashboard.
Grundlegende Proxy-Einrichtung
Puppeteer mit SOCKS5-Proxy starten:
const puppeteer = require('puppeteer');
const browser = await puppeteer.launch({
args: [
'--proxy-server=socks5://proxy-ip:port',
'--no-sandbox',
],
});
const page = await browser.newPage();
// Authenticate with proxy
await page.authenticate({
username: 'your-username',
password: 'your-password',
});
await page.goto('https://httpbin.org/ip');
const content = await page.content();
console.log(content);
await browser.close();HTTP-Proxy-Alternative
Verwendung von HTTP-Proxy mit Authentifizierung:
const browser = await puppeteer.launch({
args: ['--proxy-server=http://proxy-ip:port'],
});
const page = await browser.newPage();
await page.authenticate({
username: 'your-username',
password: 'your-password',
});
await page.goto('https://example.com');Stealth-Modus + Proxy
Verwenden Sie puppeteer-extra für verdecktes Browsing:
const puppeteer = require('puppeteer-extra');
const StealthPlugin =
require('puppeteer-extra-plugin-stealth');
puppeteer.use(StealthPlugin());
const browser = await puppeteer.launch({
args: ['--proxy-server=socks5://proxy-ip:port'],
headless: 'new',
});
const page = await browser.newPage();
await page.authenticate({
username: 'user', password: 'pass'
});
// Now scrape with stealth + mobile proxy
await page.goto('https://target-site.com');IP-Rotation zwischen Seiten
IP mit Proxy Polands API rotieren:
const axios = require('axios');
async function rotateIP() {
const response = await axios.get(
'https://proxy-ip:port/rotate',
{ auth: { username: 'user', password: 'pass' } }
);
console.log('New IP:', response.data);
}
// Rotate between scraping sessions
await rotateIP();
await page.goto('https://next-target.com');Proxy-Funktion verifizieren
Schnelltest zur Bestätigung der Proxy-Verbindung:
const page = await browser.newPage();
await page.authenticate({
username: 'user', password: 'pass'
});
await page.goto('https://httpbin.org/ip');
const ip = await page.$eval(
'pre', el => el.textContent
);
console.log('Proxy IP:', JSON.parse(ip).origin);
// Should show Polish mobile IPPROFI-TIPPS
Verwenden Sie puppeteer-extra-plugin-stealth für Sites mit fortgeschrittener Bot-Erkennung
Setzen Sie den Viewport auf mobile Dimensionen für mobilspezifisches Scraping
Implementieren Sie Request-Interception, um unnötige Ressourcen (Bilder, CSS) für schnelleres Scraping zu blockieren
Verwenden Sie page.waitForNavigation() nach Aktionen, um sicherzustellen, dass Seiten vollständig über das Proxy geladen werden
Für hohe Nebenläufigkeit starten Sie mehrere Browser-Instanzen mit verschiedenen Proxys
FUNKTIONIERT HERVORRAGEND FÜR
FAQ
Ist Puppeteer besser als Selenium für die Proxy-Nutzung?+
Puppeteer hat native Proxy-Unterstützung, die einfacher zu konfigurieren ist als bei Selenium. Es hat auch eingebautes page.authenticate() für Proxy-Authentifizierung. Für Node.js-Projekte ist Puppeteer in der Regel die bessere Wahl.
Kann ich Puppeteer im Headless-Modus mit diesen Proxys ausführen?+
Ja. Verwenden Sie headless: 'new' in den Startoptionen. Das Proxy funktioniert identisch im Headless- und Headed-Modus. Für Stealth fügen Sie puppeteer-extra-plugin-stealth hinzu.
Wie handhabe ich CAPTCHAs beim Scraping über Mobile-Proxys?+
Mobile IPs reduzieren die CAPTCHA-Häufigkeit erheblich. Die meisten Sites zeigen weniger CAPTCHAs für Mobile-Carrier-IPs. Für verbleibende CAPTCHAs integrieren Sie einen Lösungsdienst wie 2Captcha oder verwenden Stealth-Plugins.
Kann ich mehrere Puppeteer-Instanzen mit verschiedenen Proxys ausführen?+
Ja. Starten Sie separate Browser-Instanzen, jede mit einem anderen Proxy Poland Proxy in den Argumenten. Ideal für paralleles Scraping mit IP-Isolation.
Was ist mit Playwright — funktioniert es auch mit diesen Proxys?+
Ja. Playwright hat eingebaute Proxy-Unterstützung: browser.launch({ proxy: { server: 'socks5://ip:port', username: 'user', password: 'pass' } }). Dieselben Proxy-Zugangsdaten funktionieren sowohl mit Puppeteer als auch mit Playwright.