Case study: agent AI dla wywiadu finansowego

Wyzwanie

Klient — boutique equity research firm z 14 analitykami i portfelem 220 spółek — spędzał każdy poranek (5:00–8:30 ET) na ręcznym zbieraniu danych z raportów (SEC EDGAR), prasy, transkryptów konferencji, kanałów social i baz wewnętrznych. Zanim rynki otwierały, każdy analityk musiał mieć briefing na swoich 12–18 spółek.

Próba zastąpienia tego ChatGPT skończyła się chaosem — model konfabulował, mylił spółki, nie miał dostępu do raportów w PDF, halucynował liczby. Klient potrzebował systemu, który dostarcza fakty, nie esej.

Podejście

Zbudowaliśmy agenta z trzema warstwami: tool layer (12 narzędzi: pobieranie z SEC, ekstrakcja PDF, wyszukiwanie prasy, scraping Twitter/X, lookup w bazie historycznej, kalkulacje finansowe), reasoning layer (Claude jako planner — który dla każdej spółki dobiera narzędzia i ich kolejność), oraz output layer (structured JSON, walidowany schema-first, renderowany jako Markdown briefing).

Każdy briefing przechodzi walidację: czy każda liczba ma cytat źródłowy, czy każde stwierdzenie ma datę, czy nie ma sprzeczności wewnętrznych. Failed validations trafiają do queue dla analityka — z konkretnym wskazaniem co poszło nie tak.

Ewaluacja: zbudowaliśmy z klientem zbiór 280 historycznych briefingów (oceny S/A/B/C/F), agent musi osiągnąć średnio >A- przed każdą zmianą produkcyjną. Trzy iteracje promptu i narzędzi przed pierwszym deploymentem.

Wynik

Briefingi gotowe codziennie do 6:40 ET. 220 spółek pokrytych, average jakość briefingu (assessed by clients weekly) między A- a A. Halucynacje (assessed strictly): 0.4% claims, każda wychwytywana przez walidację.

Analitycy zaoszczędzili średnio 72% czasu poprzednio spędzanego na zbieraniu danych. Ten czas idzie w analizę, kontakty z klientami i mniej oczywiste insighty.

Koszt operacyjny: ~3 200 USD/mies (głównie Anthropic API). Klient zwolnił dwie pozycje junior associate research, których wcześniej szukał — oszczędność miesięczna ~22 000 USD.

Stack

Claude (Anthropic)LangGraphPythonPyMuPDFPostgrespgvectorTemporalNext.js dashboard

Wskaźniki

220 — Spółki pokryte
6:40 ET — Briefing gotów
−72% — Czas zaoszczędzony
0.4% — Halucynacje
$3.2k/mies — Koszt operacyjny
A- — Avg jakość briefingu

Autonomiczny agent badawczy dla firmy wywiadu finansowego

Wyzwanie

Podejście

Wynik

Stack

Wskaźniki

System ciągłego pozyskiwania leadów dla B2B SaaS

Real-time monitoring cen na 1 200 marketplace'ach

Wielokontowa orkiestracja treści i outreachu dla creator network

Każdy projekt jest inny, ale wzorce się powtarzają.

Autonomiczny agent badawczy dla firmy wywiadu finansowego

§01Wyzwanie

§02Podejście

§03Wynik

Stack

Wskaźniki

System ciągłego pozyskiwania leadów dla B2B SaaS

Real-time monitoring cen na 1 200 marketplace'ach

Wielokontowa orkiestracja treści i outreachu dla creator network

Każdy projekt jest inny, ale wzorce się powtarzają.

Wyzwanie

Podejście

Wynik