Auf derselben Website wird einem Besucher eine reCAPTCHA-Challenge auf Englisch und einem anderen auf Japanisch angezeigt. Ein Cloudflare Turnstile-Widget gibt seinen Ladetext in der Sprache des Browsers wieder. Einige Websites stellen je nach erkannter Region des Besuchers völlig unterschiedliche CAPTCHA-Typen bereit. Wenn Sie verstehen, wie sich die Lokalisierung auf CAPTCHAs auswirkt, können Sie diese in der Automatisierung richtig handhaben.
Was sich mit dem Gebietsschema ändert
| CAPTCHA-Anbieter | Was lokalisiert | Was gleich bleibt |
|---|---|---|
| reCAPTCHA | UI-Text, Bildbeschriftungen, Audiosprache | Sitekey, Verifizierungsablauf, Tokenformat |
| Turnstile | Widget-Text und Fehlermeldungen | Sitekey, Tokenformat, Lösungsmechanismus |
| hCaptcha | Herausforderungsanweisungen, Kategoriebeschriftungen | Sitekey, Tokenformat |
| Image/OCR | Zeichensatz, Textsprache | Bildformat, Fluss „submit/poll“. |
Wie Sprache erkannt wird
CAPTCHA-Anbieter bestimmen die Sprache anhand mehrerer Signale:
1. Accept-Language-Header
Accept-Language: ja-JP,ja;q=0.9,en-US;q=0.8,en;q=0.7
Dadurch wird dem Server mitgeteilt: Bevorzugen Sie Japanisch (Japan), dann Englisch (USA) und dann generisches Englisch. reCAPTCHA und Turnstile verwenden dies, um die UI-Sprache auszuwählen.
2. HTML-hl-Parameter
reCAPTCHA akzeptiert beim Laden einen expliziten Sprachparameter:
<!-- Force English reCAPTCHA -->
<script src="https://www.google.com/recaptcha/api.js?hl=en"></script>
<!-- Force Japanese -->
<script src="https://www.google.com/recaptcha/api.js?hl=ja"></script>
Der Parameter hl überschreibt den Accept-Language-Header. Beim Lösen ist keine Übereinstimmung erforderlich – CaptchaAI gibt ein Token zurück, unabhängig von der Sprache der Benutzeroberfläche.
3. Geo-IP-Standort
Einige CAPTCHA-Konfigurationen variieren je nach Region:
| Signal | Wirkung |
|---|---|
| IP aus China | Möglicherweise erhalten Sie GeeTest anstelle von reCAPTCHA (reCAPTCHA ist in China blockiert) |
| IP aus der EU | Möglicherweise wird die DSGVO-Zustimmung vor dem CAPTCHA angezeigt |
| IP aus eingeschränkter Region | Es kann zu strengeren Herausforderungen kommen |
4. Browser navigator.language
JavaScript-basierte CAPTCHAs lesen die Sprache des Browsers:
navigator.language // "en-US"
navigator.languages // ["en-US", "en", "ja"]
In Headless-Browsern wird standardmäßig das Systemgebietsschema verwendet. Stellen Sie sie explizit so ein, dass sie Ihrem Ziel entsprechen:
// Playwright
const context = await browser.newContext({
locale: 'ja-JP',
});
// Puppeteer
const page = await browser.newPage();
await page.setExtraHTTPHeaders({
'Accept-Language': 'ja-JP,ja;q=0.9',
});
Auswirkungen auf die Lösung
Tokenbasierte CAPTCHAs (reCAPTCHA, Turnstile, hCaptcha)
Spracheinstellungen wirken sich auf die Benutzeroberfläche aus, nicht jedoch auf das Token. Der Lösungsprozess von CaptchaAI ist sprachunabhängig:
- Senden Sie den Sitekey und die Seiten-URL
- CaptchaAI gibt ein gültiges Token zurück
- Das Token funktioniert unabhängig davon, welche Sprache das CAPTCHA-Widget anzeigt
Beim Aufruf von CaptchaAI für tokenbasierte CAPTCHAs ist kein Sprachparameter erforderlich.
Bild-CAPTCHAs
Die Sprache wirkt sich direkt auf die Zeichen im Bild aus:
| Website-Sprache | CAPTCHA-Inhalt | CaptchaAI Sprachparameter |
|---|---|---|
| Englisch | „Geben Sie den Text ein: XKCD42“ | 0 (Standard /Latin) |
| Russisch | „Lesen Sie den Text: ШКАФ“ | 1 (Kyrillisch) oder 2 |
| Chinesisch | „请输入验证码: 汉字“ | 2 (nicht lateinisch) |
| Arabisch | „أدخل النص: عربي“ | 2 (nicht lateinisch) |
| Japanisch | „文字を入力: ひらがな“ | 2 (nicht lateinisch) |
Audio-CAPTCHAs
reCAPTCHA-Audioherausforderungen werden in der Sprache gesprochen, die dem Parameter hl oder dem Accept-Language-Header entspricht. CaptchaAI handles these through its standard reCAPTCHA solving flow — the solving method doesn't depend on audio language.
Häufige Lokalisierungsprobleme
Nicht übereinstimmende Sprache zwischen Schaber und Ziel
Wenn Ihr Scraper Accept-Language: en-US an eine japanische Site sendet, wird das CAPTCHA möglicherweise auf Englisch gerendert – was für tokenbasierte CAPTCHAs in Ordnung ist, aber zu Problemen führen kann, wenn die Site die Sprachkonsistenz überprüft.
Unterschiede zwischen regionalen CAPTCHA-Anbietern
Einige Länder nutzen unterschiedliche CAPTCHA-Anbieter:
| Region | Typische Anbieter |
|---|---|
| Westliche Märkte | reCAPTCHA, Turnstile, hCaptcha |
| China | GeeTest, Tencent CAPTCHA, benutzerdefiniertes Bild |
| Russland/CIS | Benutzerdefinierte Bild-CAPTCHAs, reCAPTCHA |
| Südkorea | Benutzerdefinierte Schieberegler, Bild-CAPTCHAs |
Fehlerbehebung
| Problem | Ursache | Lösung |
|---|---|---|
| Ergebnis passt nicht zum eigenen Fall | Solver-Typ oder Eingabeparameter wurden falsch auf den Zieltyp gemappt | Vergleiche Zielseite, Solver-Methode und Pflichtparameter noch einmal systematisch |
| Beispiel läuft, aber Produktion scheitert | Session, Header oder Proxy-Kontext weichen vom Test ab | Übertrage erfolgreiche Testbedingungen möglichst unverändert in den Live-Workflow |
| Fehler bleiben unklar | Logs enthalten zu wenig Kontext für eine belastbare Diagnose | Protokolliere Solver-Typ, Latenz, Fehlercode und Downstream-Reaktion gemeinsam |
Verwandte Leitfäden
- CaptchaAI Schnellstart
- API-Antwortformate und Fehlercodes
- reCAPTCHA v2 per API lösen