Začnu konkrétním scénářem.
Právní oddělení středně velké firmy dostane ke kontrole smlouvu od zahraničního partnera. Je v angličtině, 14 stran, plná právního žargonu. Termín je zítra. Interní překladatel není k dispozici, agentura by trvala tři dny.
Někdo otevře ChatGPT, zkopíruje celý text a napíše: „Přelož do češtiny, zachovej formální styl.“
Za dvě minuty je hotovo. Všichni spokojeni.
Jenže ta smlouva obsahovala jména smluvních stran, finanční podmínky, penalizační doložky a důvěrná obchodní ujednání. A všechno tohle právě opustilo firemní infrastrukturu.
Co se přesně děje, když pošlete text do AI / překladače
Když zadáte text do ChatGPT, DeepL nebo Google Translate, ten text putuje přes internet na servery daného poskytovatele. To je nutné – překlad probíhá tam, ne u vás v počítači.
Otázka není, jestli data odejdou. Odejdou vždy. Otázka je, co se s nimi stane potom.
Google Translate
Pokud jdete na translate.google.com v prohlížeči, váš text spadá pod obecné podmínky Googlu. A tam je jasně napsáno, že Google může obsah používat ke zlepšování produktů včetně trénování AI modelů. Rychlé, zadarmo – a váš text rovnou pomáhá trénovat příští verzi Googlu.
DeepL
Ve výchozím nastavení DeepL zpracovává data globálně přes servery v EU, USA a Japonsku. Pokud chcete garantovat, že data zůstanou v EU, musíte si připlatit za Data Residency add-on, dostupný pouze přes přímý prodej.
ChatGPT (OpenAI)
Ve free verzi OpenAI explicitně říká, že konverzace mohou být použity k trénování modelů. V placené verzi (Team) je trénování ve výchozím stavu vypnuté. Ale administrátor účtu ho může ručně zapnout zpět, a vy o tom jako řadový uživatel nemáte žádný způsob, jak to zjistit. Žádné upozornění, žádný banner, žádný varovný e-mail.
Překládáte citlivou smlouvu a nevíte, jestli ji OpenAI zrovna používá k trénování příštího modelu. Pokud vaši kolegové používají ChatGPT přes firemní kartu na Team tarifu – zkontrolujte si nastavení. Teď.
A pak je tu ChatGPT Enterprise, který data k trénování nepoužívá vůbec. Většina firem ale Enterprise nemá.
A to ještě nemluvíme o tom, kde OpenAI servery vůbec stojí. ChatGPT funguje výhradně na amerických serverech a ve zpracování dat figurují třetí strany.
GDPR a překladače: kombinace, na kterou nikdo není připraven
Tohle je místo, kde se „teoretické riziko“ mění v konkrétní právní problém.
GDPR říká, že pokud zpracováváte osobní údaje (jména, e-maily, rodná čísla, adresy), musíte vědět, kde se zpracovávají, kdo k nim má přístup a na základě jakého právního titulu.
Když pošlete HR dokument do Google Translate, Google se tím pádem stává zpracovatelem osobních údajů ve smyslu GDPR. A vy jako firma byste s ním měli mít uzavřenou smlouvu o zpracování osobních údajů (DPA).
Máte ji? Většina firem ne. Většina firem o tom ani neví.
Pokuta za porušení GDPR může dosáhnout 4 % z ročního obratu – to není číslo, které chcete ignorovat.
Tři situace, které se v praxi opakují
Pracovní smlouvy, výplatní pásky, hodnocení zaměstnanců. Obsahují osobní údaje ze zákona chráněné. Překládat je přes veřejný nástroj bez DPA je přímé porušení GDPR.
Podepsali jste s klientem dohodu o mlčenlivosti. Pak jejich dokumenty přeložíte přes ChatGPT. Obsah jste předali třetí straně, byť neúmyslně – to může být přímé porušení NDA.
Nejsou chráněné zákonem, ale jsou strategicky citlivé. Competitor intelligence existuje. Jednou uniklá data nemůžete vzít zpět.
Co firmy dělají špatně (a jak to opravit)
Největší problém není, že by lidé byli leniví. Problém je, že ve firmách chybí pravidlo. Každý řeší překlad ad hoc, s nástrojem, který má zrovna po ruce.
Řešení není zakázat AI překlady – to by nikdo nedodržoval. Řešení je mít jasný framework:
Krok 1: Kategorizujte dokumenty
| Kategorie | Příklady | Pravidlo |
|---|---|---|
| Veřejné | Marketingové materiály, webový obsah | Bez omezení |
| Interní | Reporty, cenové nabídky, strategie | Pouze schválené nástroje |
| Citlivé | Smlouvy s NDA, HR dokumenty, finanční data | Pouze schválená infrastruktura |
| Tajné | Obchodní tajemství, patenty, akvizice | Nesmí opustit firemní infrastrukturu |
Napište to do jedné stránky a dejte ji na intranet. Nemusí být dokonalá – musí existovat.
Krok 2: API není automaticky bezpečné
Hodně IT oddělení si myslí, že API přístup = bezpečný přístup. Není to tak jednoduché. API sice může mít uzavřenou DPA a lepší smluvní podmínky, ale data stále opouštějí vaši infrastrukturu. A při špatné implementaci může dojít k úniku dat, aniž by to kdokoliv okamžitě zaznamenal.
Krok 3: Zkontrolujte nástroje, které teď používáte
Pro každý překladový nástroj zjistěte: Kde jsou servery? Je uzavřená DPA? Jaká je data retention policy?
Krok 4: Hledejte nástroje s jasnou datovou politikou
Ideální řešení pro firmy, které překládají pravidelně a pracují s citlivými dokumenty, jsou nástroje provozované na dedikované infrastruktuře – buď on-premises, nebo u poskytovatele, který smluvně garantuje, že data zůstávají v EU a nejdou nikam jinam. Víte přesně, co se s daty děje, máte auditovatelnost a dokážete to doložit při kontrole.
Jedno cvičení na dnešní den
Otevřete si chatovou historii v ChatGPT nebo historii překladů v DeepL. Prolistujte posledních deset položek.
Byl by problém, kdyby se jakýkoli z těch textů dostal ven?
Pokud ano, máte teď jasno, co řešit jako první.
Pokud hledáte překladový nástroj, který funguje na dedikované infrastruktuře v EU, zachovává formát dokumentů a umožňuje auditovat, kdo co překládal – podívejte se na Syntax Translate.
