Słownik browser automation.
17 haseł — od podstaw browser automation, przez anti-bot detection, po inżynierskie patterny jak idempotency i dead-letter queues.
Bezpieczeństwo3
- Anti-bot detection
Systemy wykrywające automatyczny ruch — Cloudflare Bot Management, Akamai, Datadome, PerimeterX. Sprawdzają 40+ sygnałów: TLS fingerprint, JS fingerprint, behavior.
- Browser fingerprinting
Identyfikacja przeglądarki przez kombinację unikatowych sygnałów — canvas, WebGL, fonts, audio, screen, plugins. Główny mechanizm anti-bot detection.
- CAPTCHA
Test sprawdzający czy użytkownik jest człowiekiem. reCAPTCHA, hCaptcha, Cloudflare Turnstile, FunCaptcha. Bypass przez solving services lub session warming.
Infrastruktura3
- Account warming
Stopniowe budowanie zaufania konta na platformie (LinkedIn, Twitter, Instagram) przez normalną aktywność. Wymagane przed automation żeby uniknąć banów.
- Datacenter proxy
Proxy z IP datacenterów (AWS, Hetzner, OVH). Tanio ($1-5/GB), masowo, ale łatwo wykrywalne na protected sites. Dobre dla unprotected targets.
- Residential proxy
Proxy z IP prawdziwych użytkowników ISP (Orange, T-Mobile, Comcast). Drogie ($5-15/GB) ale trudno wykrywalne. Standard dla protected targets.
Inżynieria5
- CDP (Chrome DevTools Protocol)
Protokół komunikacji z Chrome / Chromium używany przez DevTools i wszystkie narzędzia automation (Playwright, Puppeteer). WebSocket-based, ~150 metod.
- Dead letter queue (DLQ)
Kolejka dla wiadomości które wielokrotnie nie powiodły się w processing. Nie tracimy danych — failed jobs idą do DLQ do manual review lub later replay.
- Idempotency
Właściwość operacji która daje ten sam rezultat niezależnie od liczby uruchomień. Krytyczne w automation — pozwala bezpiecznie retry-ować po failure.
- Rate limiting
Ograniczanie liczby requestów per czas — chroni API przed abuse i overload. Token bucket, leaky bucket, fixed window. Krytyczne dla integracji z external APIs.
- Webhook
HTTP callback wysyłany przez systemy do twojego endpointu gdy zdarzenie się wydarzy. Push-based vs polling. Stripe, GitHub, Slack, Salesforce wszystkie używają.
Narzędzia2
- Playwright
Open-source biblioteka Microsoft do automatyzacji przeglądarek — Chromium, Firefox, WebKit. De facto standard w 2026 dla browser automation.
- Puppeteer
Biblioteka Google do automatyzacji Chromium. Starszy poprzednik Playwrighta. Tylko Chrome, tylko Node.js — w 2026 stopniowo wypierany przez Playwright.
Podstawy4
- Browser automation
Programowe sterowanie przeglądarką do wykonywania zadań które normalnie robi człowiek — klikanie, wypełnianie formularzy, scraping, monitoring.
- Headless browser
Przeglądarka działająca bez graficznego interfejsu (UI) — renderuje strony i wykonuje skrypty, ale nic nie wyświetla. Standardowy mode dla automation w produkcji.
- RPA (Robotic Process Automation)
Automatyzacja procesów biznesowych przez software-owych "robotów" — symulują pracę człowieka w GUI aplikacji. UiPath, Automation Anywhere, Blue Prism.
- Web scraping
Automatyczne pobieranie i parsowanie danych ze stron internetowych — przez HTTP request lub browser automation. Podstawa monitoringu cen, lead intel, data aggregation.