Illusztráció (pixabay.com)

A héten elindított népszámlálás az egyik legnagyobb informatikai kihívás Szlovákia eddigi történetében. A tízévente megrendezésre kerülő népszámlálás során a legszélesebb körű statisztikai felmérés készül a lakosokról. Elkészítése és végrehajtása az egyik legigényesebb és legdrágább statisztikai feladat, amelynek költsége 2011-ben körülbelül 29 millió euró volt, 2021-ben pedig mintegy 60 millió euróba kerül majd. 

A regiszterekből már rendelkezésre álló adatok és a lakosság által most megadott adatok összevetésével készülő felmérés, idén első alkalommal történik teljes mértékben elektronikus formában. A Statisztikai Hivatal hangsúlyozta, a lakosok személyes adatainak védelme prioritást élvez, az adatgyűjtés és az adatok biztonságos kezelése pedig a népszámlálás végrehajtásának alapfeltétele. Az összegyűjtött adatokat kizárólag a népszámlálás céljából dolgozzák fel. 

Visszaélhetnek-e az adatainkkal a népszámlálás során? Hogyan működik egy ilyen rendszer, és milyen veszélyeket hordozhat magában? Kérdéseinkre Hideghéthy Adrián matematikus, szoftverfejlesztő válaszolt.

Hogyan működnek az elektronikus népszámláláshoz hasonló rendszerek? 

Minden rendszer felépítése más, viszont az alapkoncepció ugyanaz. Az adatok begyűjtése és a begyűjtött adatok feldolgozása. Majdnem minden esetben többrétegű alkalmazásról beszélünk. Van egy felhasználói felület, ami egy köztes réteggel (middleware) kommunikál, és a köztes réteg kapcsolódik a szerver oldali részhez, ami utána az adatbázisba betölti az adatokat. Ez egy eléggé leegyszerűsített séma, de valójában minden rendszer ezeken az alapokon nyugszik. A felhasználói felület az, ami a böngészőben jelenik meg, itt tudjuk bevinni a kívánt adatokat. 

Ha viszont magasabb perspektívából nézzük, akkor nem mindig az adatbázis az utolsó rész. Sőt, feldolgozás szempontjából jobb nem az elsődleges adatbázisban ezeket az adatokat feldolgozni, hanem egy másik, konkrétan erre a célra készített másik adatbázisban/adatbázisokban, adatkockában. Ez azért szükséges, mivel az elektronikus felület adatbázisa nem terhelődik le. A felhasználói felület adatbázisából az adatkockába az adatok adatcsomagokban jutnak el. Ez lehet heti, napi szinten, vagy egyéb időtartományok szerint. Ezzel szintén a rendszer terhelése csökkenthető, mindig csak a változásokat (új adatokat) kell átmásolni a tényleges feldolgozó rendszerbe.

Hogyan szűrik ki az egyes adatokat?

A feldolgozásra váró adatokat ezek a rendszerek először csoportosítják, majd elvégzik az első átfogó próbákat, amivel megpróbálják a lehető legnagyobb mértékben kiszűrni a hibás adatokat, mint például a többszöri adatbevitelt ugyanazzal a születési számmal. Tegyük fel, hogy többszörös adatbevitel a bevitt adatok 10%-ban történik meg. Ezeket a hibás adatokat utána tovább szűrik, például úgy, hogy megkeresik azon eseteket, amikor minden adat megegyezik. Itt is elmondhatjuk, hogy nagy általánosságban újabb 10% adat az, ami fennakad a rostán. Viszont ez már az összes adat, ami valójában az összes adat 1%-ának felel meg. Ezt az egy százalékot kell komolyabban górcső alá venni és elemezni. Nem hinném, hogy jó ötlet lenne javítani ezeket az adatokat, mármint az, hogy az adatbázis elemzői kézzel javítsák őket. Jobb ötletnek tartom javítást kérni ezekre az adatokra azoktól, akikhez tartoznak. 

Mi tudható meg az emberekről, ha azok megadják a személyi számukat (a regiszterekből összekapcsolják ezt a lakhelyükkel), az ideiglenes lakcímet, a munkahelyi címet és természetesen ismert az IP-cím is? 

A belügyminisztérium regiszterében minden alapvető adat szerepel rólunk: név, születési dátum és hely, az egyén neme, állampolgársága és a születési szám kiosztásának időpontja. A születési szám alapján az adóhivatal rendszerében utánakereshetőek az egyén adóbevallásai – itt belső rendszerről beszélünk. Online viszont bárki számára elérhető a cégjegyzék, ahol például kereszt- és vezetéknév alapján kereshetőek a cégek, a cégekhez tartozó fiskális adatok szintén online elérhetőek. Most csak pár dolgot említettem, viszont léteznek más online oldalak, amelyek grafikus módon vagy szövegben sok adathoz adnak módot a bepillantásra. 

Az IP cím, ahonnan az adatok kitöltése történt, érdekes kérdés. Az IP címek tartománya alapján beazonosítható, hogy az adott személy milyen szolgáltatón keresztül töltötte ki az űrlapot. Továbbmegyek: nem csak az IP cím, hanem a böngésző típusa, operációs rendszer is beazonosítható. Összegezve, jó kis digitális ujjlenyomat kerülhet a szakemberek kezébe, ezért nagyon fontos ezen adatok biztonságos tárolása.

Melyik a biztonságosabb? Telefonon, egy applikáció segítségével kitölteni az íveket, vagy számítógépről? Van jelentősége egyáltalán?

Mikor megnéztem, hogy milyen engedélyeket kér a mobil applikáció, túlzónak tartottam például, hogy az eszköz hozzáférhet a telefon kamerájához és képet/videót készíthet. Mivel nem próbáltam az applikációt, így nem tudom, mire használják ezt a jogosultságot. Nem szeretnék senkit ösztönözni a mobil applikáció elvetésére, viszont én maradok a számítógépen történő kitöltésnél.

Ezek az adatok nagyon vonzóak lehetnek az adathalászoknak. Milyen rendszerek biztosítják, hogyan lehet bebiztosítani, hogy ezek az adatok ne kerüljenek harmadik fél kezébe? Hogyan lehet ezekkel az adatokkal visszaélni?

Itt egy kicsit pontosítok. Az adathalászás olyan folyamat, amikor a csaló, egy „megcsalni” próbált internetes oldalnak kiadva magát levélben egy hivatkozást küld, egy kinézetében hasonló oldalra viszi a látogatóját, viszont az adatok a csaló adatbázisába kerülnek. Nem kizárt, hogy az ilyen típusú csalások is meg fognak jelenni a népszámlálással kapcsolatban. Mindig fontos, hogy figyeljünk, ha ismeretlen címről érkező leveleket nyitunk meg. A népszámlálás hivatalos honlapja a https://www.scitanie.sk/ – erre ügyeljünk.

Adatvédelmi szempontból biztonságos a népszámlálás?

A népszámlálási rendszer biztonságáról elég tetemes mennyiségű szöveget olvashatunk a hivatal oldalán. Az ilyen rendszerek többféle biztosítással vannak ellátva, komoly cégek foglalkoznak az adatok biztonságával/biztosításával. Igaz, minden, mit ember alkot, magában hordozza a tökéletlenséget. Nincs tökéletesen biztos rendszer, nincs tökéletes biztonság, viszont ez a tökéletlenség viszi előre a biztonságtechnikai fejlődést.