Explainers

CAPTCHA-Lokalisierung: Wie sich Spracheinstellungen auf Herausforderungen auswirken

Auf derselben Website wird einem Besucher eine reCAPTCHA-Challenge auf Englisch und einem anderen auf Japanisch angezeigt. Ein Cloudflare Turnstile-Widget gibt seinen Ladetext in der Sprache des Browsers wieder. Einige Websites stellen je nach erkannter Region des Besuchers völlig unterschiedliche CAPTCHA-Typen bereit. Wenn Sie verstehen, wie sich die Lokalisierung auf CAPTCHAs auswirkt, können Sie diese in der Automatisierung richtig handhaben.

Was sich mit dem Gebietsschema ändert

CAPTCHA-Anbieter Was lokalisiert Was gleich bleibt
reCAPTCHA UI-Text, Bildbeschriftungen, Audiosprache Sitekey, Verifizierungsablauf, Tokenformat
Turnstile Widget-Text und Fehlermeldungen Sitekey, Tokenformat, Lösungsmechanismus
hCaptcha Herausforderungsanweisungen, Kategoriebeschriftungen Sitekey, Tokenformat
Image/OCR Zeichensatz, Textsprache Bildformat, Fluss „submit/poll“.

Wie Sprache erkannt wird

CAPTCHA-Anbieter bestimmen die Sprache anhand mehrerer Signale:

1. Accept-Language-Header

Accept-Language: ja-JP,ja;q=0.9,en-US;q=0.8,en;q=0.7

Dadurch wird dem Server mitgeteilt: Bevorzugen Sie Japanisch (Japan), dann Englisch (USA) und dann generisches Englisch. reCAPTCHA und Turnstile verwenden dies, um die UI-Sprache auszuwählen.

2. HTML-hl-Parameter

reCAPTCHA akzeptiert beim Laden einen expliziten Sprachparameter:

<!-- Force English reCAPTCHA -->
<script src="https://www.google.com/recaptcha/api.js?hl=en"></script>

<!-- Force Japanese -->
<script src="https://www.google.com/recaptcha/api.js?hl=ja"></script>

Der Parameter hl überschreibt den Accept-Language-Header. Beim Lösen ist keine Übereinstimmung erforderlich – CaptchaAI gibt ein Token zurück, unabhängig von der Sprache der Benutzeroberfläche.

3. Geo-IP-Standort

Einige CAPTCHA-Konfigurationen variieren je nach Region:

Signal Wirkung
IP aus China Möglicherweise erhalten Sie GeeTest anstelle von reCAPTCHA (reCAPTCHA ist in China blockiert)
IP aus der EU Möglicherweise wird die DSGVO-Zustimmung vor dem CAPTCHA angezeigt
IP aus eingeschränkter Region Es kann zu strengeren Herausforderungen kommen

4. Browser navigator.language

JavaScript-basierte CAPTCHAs lesen die Sprache des Browsers:

navigator.language       // "en-US"
navigator.languages      // ["en-US", "en", "ja"]

In Headless-Browsern wird standardmäßig das Systemgebietsschema verwendet. Stellen Sie sie explizit so ein, dass sie Ihrem Ziel entsprechen:

// Playwright
const context = await browser.newContext({
  locale: 'ja-JP',
});

// Puppeteer
const page = await browser.newPage();
await page.setExtraHTTPHeaders({
  'Accept-Language': 'ja-JP,ja;q=0.9',
});

Auswirkungen auf die Lösung

Tokenbasierte CAPTCHAs (reCAPTCHA, Turnstile, hCaptcha)

Spracheinstellungen wirken sich auf die Benutzeroberfläche aus, nicht jedoch auf das Token. Der Lösungsprozess von CaptchaAI ist sprachunabhängig:

  • Senden Sie den Sitekey und die Seiten-URL
  • CaptchaAI gibt ein gültiges Token zurück
  • Das Token funktioniert unabhängig davon, welche Sprache das CAPTCHA-Widget anzeigt

Beim Aufruf von CaptchaAI für tokenbasierte CAPTCHAs ist kein Sprachparameter erforderlich.

Bild-CAPTCHAs

Die Sprache wirkt sich direkt auf die Zeichen im Bild aus:

Website-Sprache CAPTCHA-Inhalt CaptchaAI Sprachparameter
Englisch „Geben Sie den Text ein: XKCD42“ 0 (Standard /Latin)
Russisch „Lesen Sie den Text: ШКАФ“ 1 (Kyrillisch) oder 2
Chinesisch „请输入验证码: 汉字“ 2 (nicht lateinisch)
Arabisch „أدخل النص: عربي“ 2 (nicht lateinisch)
Japanisch „文字を入力: ひらがな“ 2 (nicht lateinisch)

Audio-CAPTCHAs

reCAPTCHA-Audioherausforderungen werden in der Sprache gesprochen, die dem Parameter hl oder dem Accept-Language-Header entspricht. CaptchaAI handles these through its standard reCAPTCHA solving flow — the solving method doesn't depend on audio language.

Häufige Lokalisierungsprobleme

Nicht übereinstimmende Sprache zwischen Schaber und Ziel

Wenn Ihr Scraper Accept-Language: en-US an eine japanische Site sendet, wird das CAPTCHA möglicherweise auf Englisch gerendert – was für tokenbasierte CAPTCHAs in Ordnung ist, aber zu Problemen führen kann, wenn die Site die Sprachkonsistenz überprüft.

Unterschiede zwischen regionalen CAPTCHA-Anbietern

Einige Länder nutzen unterschiedliche CAPTCHA-Anbieter:

Region Typische Anbieter
Westliche Märkte reCAPTCHA, Turnstile, hCaptcha
China GeeTest, Tencent CAPTCHA, benutzerdefiniertes Bild
Russland/CIS Benutzerdefinierte Bild-CAPTCHAs, reCAPTCHA
Südkorea Benutzerdefinierte Schieberegler, Bild-CAPTCHAs

Fehlerbehebung

Problem Ursache Lösung
Ergebnis passt nicht zum eigenen Fall Solver-Typ oder Eingabeparameter wurden falsch auf den Zieltyp gemappt Vergleiche Zielseite, Solver-Methode und Pflichtparameter noch einmal systematisch
Beispiel läuft, aber Produktion scheitert Session, Header oder Proxy-Kontext weichen vom Test ab Übertrage erfolgreiche Testbedingungen möglichst unverändert in den Live-Workflow
Fehler bleiben unklar Logs enthalten zu wenig Kontext für eine belastbare Diagnose Protokolliere Solver-Typ, Latenz, Fehlercode und Downstream-Reaktion gemeinsam

Verwandte Leitfäden

Kommentare sind für diesen Artikel deaktiviert.

Verwandte Beiträge

Explainers User-Agent-Verwaltung für CAPTCHA-Lösungsworkflows
User-Agent-Verwaltung für CAPTCHA-Lösungs-Workflows: Browser-Fingerprint optimieren und Erkennung vermeiden.

User-Agent-Verwaltung für CAPTCHA-Lösungs-Workflows: Browser-Fingerprint optimieren und Erkennung vermeiden.

May 01, 2026
Explainers Auswirkungen der DNS-Auflösung auf die Leistung der CAPTCHA-API
DNS-Auflösung und ihre Auswirkungen auf die CAPTCHA-API-Performance: Latenzmessung, DNS-Caching und Optimierungsstrategien für Captcha AI.

DNS-Auflösung und ihre Auswirkungen auf die CAPTCHA-API-Performance: Latenzmessung, DNS-Caching und Optimierun...

Apr 24, 2026