Is This Safe? #6: Posíláte firemní dokumenty do překladače. Víte, kam jdou?

Začnu konkrétním scénářem.

Právní oddělení středně velké firmy dostane ke kontrole smlouvu od zahraničního partnera. Je v angličtině, 14 stran, plná právního žargonu. Termín je zítra. Interní překladatel není k dispozici, agentura by trvala tři dny.

Někdo otevře ChatGPT, zkopíruje celý text a napíše: „Přelož do češtiny, zachovej formální styl.“

Za dvě minuty je hotovo. Všichni spokojeni.

Jenže ta smlouva obsahovala jména smluvních stran, finanční podmínky, penalizační doložky a důvěrná obchodní ujednání. A všechno tohle právě opustilo firemní infrastrukturu.

Co se přesně děje, když pošlete text do AI / překladače

Když zadáte text do ChatGPT, DeepL nebo Google Translate, ten text putuje přes internet na servery daného poskytovatele. To je nutné – překlad probíhá tam, ne u vás v počítači.

Otázka není, jestli data odejdou. Odejdou vždy. Otázka je, co se s nimi stane potom.

Google Translate

Pokud jdete na translate.google.com v prohlížeči, váš text spadá pod obecné podmínky Googlu. A tam je jasně napsáno, že Google může obsah používat ke zlepšování produktů včetně trénování AI modelů. Rychlé, zadarmo – a váš text rovnou pomáhá trénovat příští verzi Googlu.

DeepL

Ve výchozím nastavení DeepL zpracovává data globálně přes servery v EU, USA a Japonsku. Pokud chcete garantovat, že data zůstanou v EU, musíte si připlatit za Data Residency add-on, dostupný pouze přes přímý prodej.

Drobné písmo: i zákazníci s placeným Data Residency add-onem – DeepL si vyhrazuje právo zpracovávat provozní komponenty jako logy a monitoring mimo vámi vybraný region. Tvrdí, že neobsahují obsah překladu, ale ověřit to nemůžete.

ChatGPT (OpenAI)

Ve free verzi OpenAI explicitně říká, že konverzace mohou být použity k trénování modelů. V placené verzi (Team) je trénování ve výchozím stavu vypnuté. Ale administrátor účtu ho může ručně zapnout zpět, a vy o tom jako řadový uživatel nemáte žádný způsob, jak to zjistit. Žádné upozornění, žádný banner, žádný varovný e-mail.

Překládáte citlivou smlouvu a nevíte, jestli ji OpenAI zrovna používá k trénování příštího modelu. Pokud vaši kolegové používají ChatGPT přes firemní kartu na Team tarifu – zkontrolujte si nastavení. Teď.

A pak je tu ChatGPT Enterprise, který data k trénování nepoužívá vůbec. Většina firem ale Enterprise nemá.

A to ještě nemluvíme o tom, kde OpenAI servery vůbec stojí. ChatGPT funguje výhradně na amerických serverech a ve zpracování dat figurují třetí strany.

GDPR a překladače: kombinace, na kterou nikdo není připraven

Tohle je místo, kde se „teoretické riziko“ mění v konkrétní právní problém.

GDPR říká, že pokud zpracováváte osobní údaje (jména, e-maily, rodná čísla, adresy), musíte vědět, kde se zpracovávají, kdo k nim má přístup a na základě jakého právního titulu.

Když pošlete HR dokument do Google Translate, Google se tím pádem stává zpracovatelem osobních údajů ve smyslu GDPR. A vy jako firma byste s ním měli mít uzavřenou smlouvu o zpracování osobních údajů (DPA).

Máte ji? Většina firem ne. Většina firem o tom ani neví.

Pokuta za porušení GDPR může dosáhnout 4 % z ročního obratu – to není číslo, které chcete ignorovat.

Tři situace, které se v praxi opakují

Situace 1: HR dokumenty

Pracovní smlouvy, výplatní pásky, hodnocení zaměstnanců. Obsahují osobní údaje ze zákona chráněné. Překládat je přes veřejný nástroj bez DPA je přímé porušení GDPR.

Situace 2: Smlouvy s NDA doložkou

Podepsali jste s klientem dohodu o mlčenlivosti. Pak jejich dokumenty přeložíte přes ChatGPT. Obsah jste předali třetí straně, byť neúmyslně – to může být přímé porušení NDA.

Situace 3: Cenové nabídky a interní reporty

Nejsou chráněné zákonem, ale jsou strategicky citlivé. Competitor intelligence existuje. Jednou uniklá data nemůžete vzít zpět.

Co firmy dělají špatně (a jak to opravit)

Největší problém není, že by lidé byli leniví. Problém je, že ve firmách chybí pravidlo. Každý řeší překlad ad hoc, s nástrojem, který má zrovna po ruce.

Řešení není zakázat AI překlady – to by nikdo nedodržoval. Řešení je mít jasný framework:

Krok 1: Kategorizujte dokumenty

Kategorie	Příklady	Pravidlo
Veřejné	Marketingové materiály, webový obsah	Bez omezení
Interní	Reporty, cenové nabídky, strategie	Pouze schválené nástroje
Citlivé	Smlouvy s NDA, HR dokumenty, finanční data	Pouze schválená infrastruktura
Tajné	Obchodní tajemství, patenty, akvizice	Nesmí opustit firemní infrastrukturu

Napište to do jedné stránky a dejte ji na intranet. Nemusí být dokonalá – musí existovat.

Krok 2: API není automaticky bezpečné

Hodně IT oddělení si myslí, že API přístup = bezpečný přístup. Není to tak jednoduché. API sice může mít uzavřenou DPA a lepší smluvní podmínky, ale data stále opouštějí vaši infrastrukturu. A při špatné implementaci může dojít k úniku dat, aniž by to kdokoliv okamžitě zaznamenal.

Krok 3: Zkontrolujte nástroje, které teď používáte

Pro každý překladový nástroj zjistěte: Kde jsou servery? Je uzavřená DPA? Jaká je data retention policy?

Praktická zkratka: DeepL pro free a většinu placených uživatelů DPA standardně nenabízí – musíte o ni aktivně požádat v rámci enterprise tarifu. Pokud to nevíte, zjistěte to, nebo nástroj přestaňte používat na citlivá data.

Krok 4: Hledejte nástroje s jasnou datovou politikou

Ideální řešení pro firmy, které překládají pravidelně a pracují s citlivými dokumenty, jsou nástroje provozované na dedikované infrastruktuře – buď on-premises, nebo u poskytovatele, který smluvně garantuje, že data zůstávají v EU a nejdou nikam jinam. Víte přesně, co se s daty děje, máte auditovatelnost a dokážete to doložit při kontrole.

Jedno cvičení na dnešní den

Otevřete si chatovou historii v ChatGPT nebo historii překladů v DeepL. Prolistujte posledních deset položek.

Byl by problém, kdyby se jakýkoli z těch textů dostal ven?

Pokud ano, máte teď jasno, co řešit jako první.

Pokud hledáte překladový nástroj, který funguje na dedikované infrastruktuře v EU, zachovává formát dokumentů a umožňuje auditovat, kdo co překládal – podívejte se na Syntax Translate.