A számítógépek megjelenése előtti időkben a legbiztosabb módja egy dokumentum érzékeny információinak eltüntetésére az volt, hogy ollóval vagy egy sebészkéssel kivágták azokat. A filctollak feltalálása után a fekete tollak vették át az olló szerepét, csak arra kellett ügyelni, hogy alaposan kisatírozzák a nem kívánt részeket. A digitális formában készült dokumentumoknál ezek a hagyományos módszerek nem jöhetnek szóba, ám mint mindenre erre is van elektronikus megoldás, azaz vannak kitakaró szoftverek, amelyek fekete négyzetekkel fedik a titokban tartandó információkat.
Pontosabban csak fednék, mert az Egyesült Államokban lévő University of Illionis kutatói megvizsgálták ezeket a szoftvereket, és az találták, hogy meglepően könnyen vissza lehet nyerni azokat az információkat, amelyeket a segítségükkel kitakartak - derül ki a Wired magazin cikkéből. Az ezen dolgozó kutatócsoport, amelynek tagjai Maxwell Bland, Amushya Lyer és Kirill Levchenko voltak arról számolt be kutatási jelentésében, hogy a leggyakrabban használt kitakarószoftverek közül kettő hatástalan. Több 10 ezer dokumentum – köztük bírósági akták, különböző felügyeleti szervezetek iratai – átvizsgálása során több ezerben tudták lehámozni az elektronikus kitakarást olyan érzékeny információkról, mint például informátorok és jó szándékú bejelentők nevei.
A jól ismert “kopipaszta”
A kutatók 11 népszerű kitakaróeszközt teszteltek. Tapasztalataik szerint ezek közül a PDFzorro és a PDFescape Online kitakarása teljesen eltávolíthatónak bizonyult. Csak annyit kellett tenniük, hogy a szöveget kimásolták a PDF-dokumentumból majd beillesztették egy World-dokumentumba. A Wired szakírói a PDFzorro programjával „kitakart” részt úgy is vissza tudták csalogatni a napvilágra, hogy fényesebbé tették a szöveget. Ez a fejlesztő nem reagált a sajtóorgánum megkeresésére, a PDFescape Onilne-nál azt a választ kapták, hogy a szoftvert nemrégiben eladták egy másik vállalatnak, amely előállt a frissített változattal.
Az illinois-i kutatók azonban kifejlesztettek egy szofisztikáltabb módszert is arra, hogy betekintsenek a kitakarások alá. A nevekre koncentráltak, mert a dokumentumokban a leggyakrabban neveket takarnak ki és ezek igen érzékeny információk. Edact-Ray szoftverük részben vizuális elemekkel dolgozik. Arra alapoz, hogy például az L betű kitakarása kisebb felületet érint, mint az M betűké. Ezt kiegészítik, azzal, hogy a betűk pozícióját összevetik egy előre meghatározott szótárral, amely megpróbálja belőni, mi lehet a kitakarás alatti szó. Ehhez jön a szöveg elemzése, amely annak tartalmából próbál következtetni a kitakart szóra. A kutatók a tesztek során képesek voltak másodpercenként 80 ezer tippet előállítani. Beszámolójuk szerint, ha egy Calibri betűtípussal, tízpontos nagyságú betűkkel megírt Microsoft World-dokumentumot mentettek le pdf-es formátumban, akkor az abban lévő kitakart nevek 14 százalékát vissza tudták állítani csak a hátramaradt jelek alapján.
Meggyőző eredmények
Daniel Lopesti a Lehigh University számítástudományi professzora, aki a kitakarási technológiák szakértője, úgy látja, hogy illinois-i kollégái meggyőző kutatási anyagot tettek le az asztalra. Ennek alapján riasztó kép tárul elénk a kitakarások megbízhatatlanságáról. A legkomolyabban érintett intézmények, köztük az USA igazságügyi minisztériuma nem reagált a Wired megkeresésére az ügyben. A Microsoft álláspontja szerint nem érintettek ebben a problémában, mert a kitakarószoftverek fejlesztőinek dolga, hogy jól működjenek a termékeik.
Eközben számos botrányt szültek a kitakarások hiányosságai. Legutóbb például 2021 februárjában az Európai bizottság hozta nyilvánosságra az AstraZeneca gyógyszergyártóval a covidoltások szállítására vonatkozó egyik szerződésváltozatát úgy, hogy azon nem végezték el kellő alapossággal a kitakarásokat. A szakértők azt ajánlják, hogy aki biztosra akar menni, az dokumentumaiban helyettesítse „x”-ek sorozatával azokat a szövegrészeket, amelyeket nem kíván nyilvánosságra hozni.
______
Forrás: https://www.wired.com/story/redact-pdf-online-privacy/