GDPR Broker Bot

Lokální GDPR agent, který mapuje, kdo drží moje data — a systematicky vymáhá přístup, výmaz a důkazy pro stížnost

O co jde?

Problém: Existují stovky data brokerů — firem, které tiše sbírají, agregují a přeprodávají osobní data. Nikde neexistuje seznam „kdo má zrovna ta moje". Ručně obeslat desítky firem, hlídat zákonné lhůty a vést si přehled je práce na týdny — kterou nikdo neudělá.

Řešení: Lokální Python agent, který tu otravnou práci dělá za mě. Rozesílá GDPR žádosti o přístup (čl. 15) a výmaz (čl. 17), čte příchozí odpovědi, hlídá 30denní lhůty, počítá u každého brokera skóre rizika a u mlčících složí důkazní balíček pro stížnost na ÚOOÚ. A co je nejlepší — z odpovědí sám zjišťuje, komu broker data prodal dál.

Princip (access-first): Žádost podle čl. 15 není dotaz „prosím", je to páka — správce musí přiznat, odkud data má (zdroj) a komu je předal (příjemci). Proto bot u sběračů dat posílá nejdřív jen přístup a o výmaz požádá až když firma potvrdí, že data drží — jinak by smazala dřív, než stihne přiznat, kudy data tečou. Nejdřív zmapovat, pak uklízet.

85 brokerů
v hledáčku

25 žádostí
v terénu

0 závislostí
čistá stdlib

30 dní lhůta
hlídá ji bot

Jak to funguje

Od žádosti po eskalaci — a zpátky k novým cílům

Co bot umí

Celá smyčka od žádosti po stížnost

Síť, která se rozrůstá sama

Nejchytřejší část — a jediná, kde hraje roli AI

Neexistuje master-seznam „kdo má moje data". Klíčový trik je proto v tom, že GDPR nutí každého správce přiznat své příjemce — komu data předal nebo prodal. A přesně tohle bot využívá k tomu, aby se sám rozrůstal:

1 · Broker odpoví

„Vaše data jsme získali od firmy A a předali jsme je firmám B a C." Přesně to po něm čl. 15 vyžaduje.

2 · Claude vytáhne příjemce

Sonnet přečte volný text odpovědi a vrátí strukturovaný seznam: zdroj, příjemci, jestli firma data drží. Žádné ruční čtení desítek mailů.

3 · Noví brokeři do fronty

Firmy B a C se samy přidají jako nové cíle (ke schválení) a do Telegramu přijde upozornění. Příští dávka jde i na ně.

Je to jediná část celého bota, která sahá na AI — a běží na mém vlastním Anthropic klíči. A i sem jde jen redigovaný text odpovědi: moje známé údaje bot předem nahradí značkami, takže Claude vidí jen příjemce a zdroj. Zbytek (odesílání, párování, lhůty, skóre, důkazy) je čistá Python logika, která jede zadarmo.

odpověď brokera ›
„data jsme získali od A,
předali firmám B, C"

Sonnet › { zdroj: A,
příjemci: [B, C] }

+ 2 noví brokeři → fronta
Telegram › „přibyli B, C"

Stack & Tech

Co jsem se naučil

Co bylo nejtěžší a co bych dnes udělal jinak

🪪

Nejtěžší je ověřování identity

B2B brokeři párují data podle profesní identity, ne osobního e-mailu — proto osobní žádost často vrátí „o vás nic nemáme", i když data mají. Někteří chtějí prokázat identitu přes portál (LinkedIn, pracovní mail, telefon). Kompromis: dávám jen veřejný LinkedIn odkaz, ale pracovní mail ani telefon brokerovi nerozdávám — to by jim jen prozradilo další vazbu.

🗺️

Nejdřív zmapovat, pak mazat

Původně bot posílal přístup i výmaz najednou. Lekce z provozu: firma, která data nedrží (nebo je nechce přiznat), klidně „smaže" a zmizí dřív, než řekne, komu je prodala. Proto teď jede access-first — výmaz až po potvrzení, že data drží. Mapa toku dat je cennější než rychlý úklid.

🤖

AI čte odpovědi líp než moje pravidla

První verze klasifikovala odpovědi heuristikou („obsahuje slovo X → má data") a pletla se — několik mailů označila špatně. Claude (Sonnet) na strukturovanou extrakci je výrazně přesnější; jednoduchá pravidla zůstala jen jako záloha, když AI není po ruce.

Soukromí a bezpečnost

Bot běží čistě lokálně na mém home serveru. Všechna data — seznam brokerů, odeslané žádosti i jejich odpovědi — jsou v lokální SQLite databázi u mě doma. Přihlašovací údaje (e-mail, klíče, token) jsou mimo verzování a nikdy se nedostanou do gitu. Do Claude API putuje jen redigovaný text odpovědí brokerů kvůli vytažení příjemců — moje známé údaje jsou předtím nahrazené značkami. A protože jde o vymáhání mých vlastních práv, posílá bot ven jen to, co podle GDPR sám smím žádat. Tahle stránka popisuje, jak je bot postavený — žádné konkrétní osobní údaje ani seznam firem tu nenajdeš.

Pro celou komunikaci jsem navíc založil úplně samostatnou e-mailovou schránku určenou jen pro tyhle GDPR žádosti. Veškerá pošta s brokery (odeslané žádosti, odpovědi, bounce, urgence) tak teče přes ni — moje osobní schránka zůstává čistá a nepřijdou mi do ní desítky automatických odpovědí. Zároveň mám korespondenci pěkně pohromadě na jednom místě, kdyby došlo na stížnost k ÚOOÚ.

GDPR Broker Bot

O co jde?

Jak to funguje

Co bot umí

Žádosti čl. 15 → 17 (access-first)

Approval gate

Čte odpovědi

Řetězení příjemců

Hlídá lhůty

Eskalace na ÚOOÚ

Report „kdo drží data"

Skóre rizika

Důkazní balíček pro ÚOOÚ

Redakce před AI

Běží sám přes cron

Síť, která se rozrůstá sama

Stack & Tech

Jádro bota

E-mail vrstva

AI vrstva

Provoz & data

Co jsem se naučil

Soukromí a bezpečnost