Detektor Raksa

Cestuje v noci, je podozrivý. Tajný program nájde teroristov aj novinárov

Loading

Tajný program Skynet americkej tajnej služby NSA údajne slúži na identifikáciu podozrivých osôb na základe ich správania. Analytici NSA sledujú dáta o mobilných telefónoch obyvateľov Pakistanu.
Podľa dátového odborníka sú však v uniknutých prezentáciách evidentné chyby, ktoré mohli viesť k mylným dôkazom proti nevinným ľuďom.

Americké bezpilotné lietadlá uskutočnili od roku 2004 v Pakistane 422 útokov na najrôznejšie ciele, pri ktorých zomrelo podľa odhadov 2 500 až 4 000 ľudí – z toho až 965 civilistov. Naznačujú to aspoň dáta od The Bureau of Investigative Journalism, neziskovej organizácie, ktorá už od roku 2010 mapuje podobné útoky schválené vládou USA.

Na základe čoho sú vyberané ciele, označené k likvidácii ako “extrémisti”, mohol napovedať už citát Michaela Haydena, bývalého riaditeľa NSA a CIA: “Zabíjame ľudí na základe metadát.” Minulý rok odhalená prísne tajná prezentácia NSA potom priblížila, ako prebieha určovanie, kto je terorista a kto nie, a teraz podľa vyjadrenia experta vychádza najavo, že zvolená metóda má vážne chyby, ktoré môžu viesť k smrti mnohých nevinných ľudí.
Ide o ďalší z utajovaných programov NSA, tentoraz nazvaný Skynet. Filmovým fanúšikom ihneď pripomenie počítačový systém z filmovej série Terminátor, ktorý rozpútal celosvetovú jadrovú vojnu s cieľom vyhladiť ľudstvo. Reálny Skynet je trochu odlišný a silne špecializovaný. Bol vytvorený s cieľom rozpoznať teroristov na základe ich strojovo merateľného správania.

Ako funguje vyhľadávanie teroristov podľa veľkých dát
O programe Skynet sa svet dozvedel v máji 2015 vďaka prezentácii NSA (zrejme z roku 2011 – 2012), ktorú vyniesol Edward Snowden a po overení ju publikoval bezpečnostný magazín Intercept. Názov dokumentu – Detekcia kuriérov pomocou strojovej analýzy – dobre vystihuje podstatu tohto projektu. NSA tu využíva tzv. metadáta, teda informácie o hovoroch z mobilných telefónov, nie obsah týchto hovorov.

Analytici z niekoľkých tímov NSA v prezentácii ukazujú, ako z informácií o hovoroch obyvateľov Pakistanu dokážu detekovať kuriérov (myslené “pomocníkov teroristov”). Pri hľadaní podozrivých vzorcov správania (tzv. Selektorov) vychádzali zo správania známych teroristov alebo ich pomocníkov a spätne analyzovali ich správanie. Potom skúsili tieto selektory použiť na odhalenie známych teroristov a boli podľa svojich slov “veľmi úspešní”. Princíp detekcie sa podobá fungovaniu anti-spamového filtra. Ten sa na základe každého označeného spamu učí, aké aspekty má nevyžiadaná pošta a na základe týchto aspektov potom označuje podobné správy ako spam.

Sú príliš optimistickí, varuje štatistik
V tejto súvislosti však dátový vedec Patrick Ball varuje, že posúdenie vlastnej úspešnosti prebiehalo veľmi povrchne. Analytici NSA vybrali sedem známych kuriérov a na šiestich z nich svoj algoritmus pre identifikáciu podozrivých vzorcov správania vytrénovali. Potom vybrali náhodných sto tisíc Pakistancov (krajina má takmer 200milionovou populáciu) a nechali algoritmus, aby vyhľadal podozrivé osoby. A bol medzi nimi bol aj siedmy kuriér. To je ale podľa Balla chybný postup, ktorý účinnosť metódy značne skresľuje a zveličuje. “Je to značne nevedecký záver,” povedal pre Ars Technica.
Ballovi sa nepáči najmä už spomínaný spôsob, akým sa algoritmus učí: “Keď používajú rovnaké záznamy na učenie aj na testovanie, dostanú úplne nezmyselné výsledky (myslené veľmi priaznivé výsledky, pozn. red.). Zvyčajne sa model trénuje na časti dát a iná časť dát sa schová až na testovanie. Bez tohto oddelenia je akékoľvek posudzovanie efektívnosti smiešne optimistické. “


Program Skynet vie z GSM metadát vyvodiť štýl života, sieť kontaktov a cestovateľské návyky

V čase, keď bola prezentácia vytvorená (2011 – 2012) bolo v Pakistane približne 120 miliónov aktívnych mobilných telefónov a NSA mala prístup k záznamom takmer polovice z nich. Na analýzu takého množstva dát nemožno pristupovať ručne a tak NSA zvolila techniku ​​regresného učenia (tzv. “Random forest”, teda “náhodný les”). Podľa George Danezis, profesora University College London špecializujúceho sa na bezpečnosť, ide o vhodne vybranú metódu: “A trochu si ju inovovali, rôznym rozhodovacím stromom dávajú rôznu váhu.”

Čo keď niekto uviazne v site?
Ball sa obáva, že agentúra sa tak môže odvolávať na vysokú pravdepodobnosť úspešnej identifikácie, aj keď v reáli sú tieto pravdepodobnosti nižšie. Ani najoptimistickejší odhad falošných poplachov (0,008% chybovosť a polovičná úplnosť) však nie je pri miliónoch sledovaných Pakistanci príliš pozitívne. Znamená stovky až tisíce ľudí, ktoré by systém označil za teroristov a prípadne – špekuluje Ars Technica – za ciele dronového náletu.


Algoritmus sa učí, ako odlíšiť náhodne vybraného Pakistanca (celkovo sto tisíc) od predvybraného teroristu / kuriéra. Potom sa algoritmus pokúsil svoje poznatky zužitkovať a týchto teroristov na základe naučených selektorov nájsť

Ako NSA testovala výsledky: pri 50% spoľahlivosti (miss rate, teda keď identifikuje len polovicu kuriérov) vraj má len 0,008% šancu, že niekoho ako kuriéra označí mylne.

Reklamy

Pre príklad zrejme chybne identifikovaného teroristu z Pakistanu nie je potrebné chodiť ďaleko: v samotnej prezentácii NSA ukazujú analytici fotografiu človeka, ktorého algoritmus označil ako “najpodozrivejšieho” z terorizmu.Najvyššie skóre “podozrivosti” získal novinár Ahmad Zaidan zo stanice Al-Džazíra, ktorý často cestuje do oblastí, kde operujú ozbrojené skupiny.

Je ním Ahmad Muaffaq Zaidan, reportér Al Džazíry a šéf jej kancelárie v Islamabade. Prezentácia NSA ho na základe jeho ciest po Pakistane označila ako “člena al-Kájdy” a “člena Moslimského bratstva”. Takéto obvinenia katarská stanica Al Džazíra odmieta: “Na základe toho, komu náš zamestnanec telefonoval, kto telefonoval jemu a kde sa tieto hovory odohrali, ho Skynet označil za člena teroristických organizácií. (…) Takéto obvinenia by boli smiešne, keby neboli zároveň veľmi vážne. Ak takto vyzerá činnosť americkej spravodajskej služby, tak sa nie je čomu diviť, že je toľko civilistov zabitých náletmi dronov. “Tiež organizácia CPJ.org zaoberajúce sa ochranou novinárov vyjadrila svoje znepokojenie nad takouto kriminalizáciou “legitímnej práce rešpektovaného novinára”.

Uniknutá prezentácia NSA hovorí len o testovaní programu Skynet, nie o jeho konkrétnych použitiach. Nemožno teda odhadnúť, akým spôsobom bol alebo nebol tento program využitý na sledovanie či vytipovanie cieľov v Pakistane. Spolu s ostatnými sledovacími programami NSA však táto demonštrácia práce s veľkými dátami ukazuje, akým spôsobom sa môže nielen NSA, ale aj akákoľvek iná tajná organizácia, dopúšťať ťažko overiteľných omylov.

Zdroj: idnes.cz

Reklamy

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *