OPS-25-C2Agent Operations

Autonomiczny agent badawczy dla firmy wywiadu finansowego

Agent celowany na zadanie, który przeszukuje raporty, prasę, social i źródła wewnętrzne — produkuje ustrukturyzowane briefingi codziennie przed 7 rano czasu wschodniego.

−72%godzin analityków
Sektor
Finanse · Equity research
Powierzchnie
Agents · LLM · Data
Czas pracy
8 miesięcy autonomicznie
Opublikowano
2025-04-15

Wyzwanie

Klient — boutique equity research firm z 14 analitykami i portfelem 220 spółek — spędzał każdy poranek (5:00–8:30 ET) na ręcznym zbieraniu danych z raportów (SEC EDGAR), prasy, transkryptów konferencji, kanałów social i baz wewnętrznych. Zanim rynki otwierały, każdy analityk musiał mieć briefing na swoich 12–18 spółek.

Próba zastąpienia tego ChatGPT skończyła się chaosem — model konfabulował, mylił spółki, nie miał dostępu do raportów w PDF, halucynował liczby. Klient potrzebował systemu, który dostarcza fakty, nie esej.

Podejście

Zbudowaliśmy agenta z trzema warstwami: tool layer (12 narzędzi: pobieranie z SEC, ekstrakcja PDF, wyszukiwanie prasy, scraping Twitter/X, lookup w bazie historycznej, kalkulacje finansowe), reasoning layer (Claude jako planner — który dla każdej spółki dobiera narzędzia i ich kolejność), oraz output layer (structured JSON, walidowany schema-first, renderowany jako Markdown briefing).

Każdy briefing przechodzi walidację: czy każda liczba ma cytat źródłowy, czy każde stwierdzenie ma datę, czy nie ma sprzeczności wewnętrznych. Failed validations trafiają do queue dla analityka — z konkretnym wskazaniem co poszło nie tak.

Ewaluacja: zbudowaliśmy z klientem zbiór 280 historycznych briefingów (oceny S/A/B/C/F), agent musi osiągnąć średnio >A- przed każdą zmianą produkcyjną. Trzy iteracje promptu i narzędzi przed pierwszym deploymentem.

Wynik

Briefingi gotowe codziennie do 6:40 ET. 220 spółek pokrytych, average jakość briefingu (assessed by clients weekly) między A- a A. Halucynacje (assessed strictly): 0.4% claims, każda wychwytywana przez walidację.

Analitycy zaoszczędzili średnio 72% czasu poprzednio spędzanego na zbieraniu danych. Ten czas idzie w analizę, kontakty z klientami i mniej oczywiste insighty.

Koszt operacyjny: ~3 200 USD/mies (głównie Anthropic API). Klient zwolnił dwie pozycje junior associate research, których wcześniej szukał — oszczędność miesięczna ~22 000 USD.

Stack

Claude (Anthropic)LangGraphPythonPyMuPDFPostgrespgvectorTemporalNext.js dashboard

Wskaźniki

  • 220Spółki pokryte
  • 6:40 ETBriefing gotów
  • −72%Czas zaoszczędzony
  • 0.4%Halucynacje
  • $3.2k/miesKoszt operacyjny
  • A-Avg jakość briefingu
Podobny problem w Twojej firmie?

Każdy projekt jest inny, ale wzorce się powtarzają.

Jeśli rozpoznajesz fragmenty tego case study u siebie — napisz. Zwykle widzimy w pierwszym callu, czy to skala godzin tygodniowo, czy infrastruktura na miesiące.