Automatyzacja przeglądarek
Headless i headful orkiestracja odporna na zmiany DOM, CAPTCHA i limity rate. Playwright, Puppeteer i nasza warstwa odporności.
Gdy API istnieje — integrujemy. Gdy nie istnieje — budujemy warstwę, która udaje, że istnieje. Kontrakt jest ten sam: po prostu działa.
Integracje API to chleb powszedni nowoczesnej infrastruktury i miejsce, gdzie najwięcej projektów grzęźnie. Zła autentykacja, źle obsłużone rate limity, błędne założenia o idempotencji, brak retry strategy — każde z tych zostawia dług, który wybucha pół roku później. Robimy integracje, które się nie psują, bo zajmujemy się też tym, czego dokumentacja API nie mówi.
Każdy styl ma swoje pułapki. REST: paginacja, niespójne nazewnictwo, niedoprecyzowane kody błędów. GraphQL: nadmierna głębokość zapytań, problem N+1, ograniczenia kosztu zapytania. Webhooki: dostarczanie, retry, weryfikacja sygnatury, kolejność. gRPC: zarządzanie schematem, kompatybilność wsteczna.
Implementujemy integrację per styl, nie per template. Każda dostaje warstwę retry z backoff, idempotency keys, circuit breaker, structured error handling i logi audit-trail.
Czasem trzeba zintegrować się z systemem, który nie ma API — stary ERP, panel banku, narzędzie wewnętrzne klienta. Wtedy budujemy „API layer" nad UI: serwis Node lub Python, który udaje API, a pod spodem prowadzi headless browser albo bezpośrednio rozmawia z back-endowymi endpointami pomijając UI. Z punktu widzenia integratora to zwykłe REST API. Z punktu widzenia operacyjnego to drugie życie systemu, który nie miał gotowego interfejsu integracyjnego.
Każda integracja ma jawny kontrakt danych: schemat, semantyka pól, polityka wersjonowania. Używamy OpenAPI / JSON Schema dla REST, SDL dla GraphQL, Protobuf dla gRPC. Zmiana wersji jest świadoma, deprecation jest komunikowany, klient ma okno na migrację.
Bez limitu na liczbę, decyzja dotyczy złożoności i kosztu utrzymania. Realistycznie: 5–15 systemów w jednej iteracji projektu. Powyżej tego — etapujemy.
Podstawowa: tak, kilka dni. Realna integracja z customizacjami klienta, walidacją, deduplikacją i regułami biznesowymi: 2–6 tygodni zależnie od skali. Większość projektów upada na założeniu, że to będzie „kliknij i działa".
Standardowo: OAuth 2.0 z PKCE, tokeny w secret managerze (AWS Secrets, GCP Secret Manager, Vault), rotacja zgodna z politykami klienta, audit log każdego wywołania. Dla compliance enterprise dokładamy mTLS gdzie wymagane.
Headless i headful orkiestracja odporna na zmiany DOM, CAPTCHA i limity rate. Playwright, Puppeteer i nasza warstwa odporności.
Produkcyjne pipeline'y od jednego źródła po tysiące. Rotacja proxy, walidacja schematów, dedup, change detection i ustrukturyzowana dostawa danych.
Agenci celowani na zadanie — przeglądają, rozumują, działają. Projektujemy tool use, pamięć i guardrails tak, żeby agent wykonał pracę, nie odegrał ją.
Krótka rozmowa o tym, co chcesz zautomatyzować. Wycena w 5 dniach roboczych.