Kui suhtekorraldus ja tegelikkus kohtuvad: tõde masinõppimise kohta küberjulgeolekus

Tõejärgsed müüjad mainivad tihti masinõpet enda suurima müügiargumendi ja peamise eelisena. Kuid õigesti tehtud masinõppega kaasnevad probleemid ja piirangud.

ESET on automatiseeritud avastust aastaid täiustanud. Automatiseeritud avastus on termin, mida kasutame masinõppe jaoks küberjulgeoleku kontekstis. Siin on mõned suurimad väljakutsed, mida oleme täheldanud ja millest oleme tänu selle tehnoloogia enda äri-ja kodulahendustes kasutamisele jagu saanud.

Esiteks on masinõppimise kasutamiseks vaja palju sisendeid, millest igaüks peab olema korrektselt märgistatud. Küberjulgeolekus tähendab see tohutu hulga näidiste jagamist kahte gruppi: pahatahtlikku ja puhtasse. Oleme veetnud peaaegu kolmkümmend aastat meie masinõppesüsteemi koolitamiseks andmeid kogudes.

Kust saaks äsja moodustunud tõejärgne müüja selliseid andmeid? Juhul, kui ta ei kasuta ebaeetiliselt konkurentide uuringute tulemusi, siis ei ole tal kuidagi võimalik piisavalt suurt ja usaldusväärset andmebaasi luua.

Prügi sisse – prügi välja

Isegi, kui masinõppe algoritmile on antud suur kogus andmeid, ei ole veel mingit garantiid, et see suudaks kõik uued näidised õigesti määratleda. Seega on vaja inimestepoolset kontrollimist. Ilma selleta võib isegi üks ainus vale sisend viia lumepalliefektini ja võib juhtuda, et see viib algoritmi täieliku läbikukkumiseni.

Sama olukord leiab aset kui algoritm kasutab oma väljundandmeid sisenditena. Iga viga tugevdatakse ja mitmekordistatakse kuna sama vale tulemus siseneb üha uuesti sisendanmetesse ja tekitab rohkem „prügi“ – valepositiivseid andmeid või kogemata läbi lastud pahatahtlikke kirjeid –, mis seejärel algoritmi sisenevad.

„ISEGI, KUI MASINÕPPE ALGORITMILE ON ANTUD SUUR KOGUS ANDMEID, EI OLE VEEL MINGIT GARANTIID, ET SEE SUUDAKS KÕIK UUED NÄIDISED ÕIGESTI MÄÄRATLEDA.”

Mõned tõejärgsed turvaprogrammide müüjad väidavad, et sarnased olukorrad ei saa nende masinõppe algoritmidega juhtuda, sest nad suudavad iga näidise enne selle käivitamist tuvastada ja otsustada, kas see on puhas või pahatahtlik vaid „arvutusi“ tehes.

Kuid kuulus matemaatik, krüptoanalüüsija ja arvutiteadlane Alan Turing (mees, kes murdis teise maailmasõja ajal natside Enigma koodi) on tõestanud, et see ei ole võimalik. Isegi täiuslik masin ei suuda alati otsustada, kas uus teadmata sisend viib soovimatu käitumiseni – Turingu puhul olukorrani, mis paneks masina lõputult koodi ringiratast täitma.

Fred Cohen, arvutiteadlane, kes sõnastas arvutiviiruse mõiste, läks ühe sammu võrra kaugemale ning näitas, et see nn „peatamise probleem“ käib ka küberjulgeoleku kohta. Ta märkis, et ainult programmi välisilmet vaadates ei ole võimalik otsustada, kas see hakkab pahatahtlikul viisil tegutsema, ning nimetas seda „lahendamatuks probleemiks“. Sama probleem tekib tulevikusisendite või spetsiifiliste seadete korral, sest need võivad programmi pahatahtlikku sfääri viia.

Niisiis, kuidas on see küberjulgeoleku hetkeseisuga seotud? Kui müüja väidab, et tema masinõppe algoritm suudab kõigi näidiste puhul enne nende tööle panemist otsustada, kas need on puhtad või pahatahtlikud, siis peaks ta ennetavalt blokeerima suurel hulgal kirjeid, mille kohta ta ei suuda otsust langetada, mattes firmade IT-osakonnad valehäirete alla.

Teine võimalus oleks vähem agressiivne avastamine vähemate valehäiretega. Kuid sellisel juhul, kui kasutatakse ainult masinõpet, ei suudaks avastamise määr küündida paljulubatud maagilise 100%ni.

Küberjulgeoleku „mäng” võib igal hetkel muutuda

See viib meid ühe kõige suurema masinõppe tehnoloogia kasutamise piiranguni küberjulgeoleku maailmas – intelligentse vastaseni. Kolm aastakümmet kogemust antud valdkonnas on meile näidanud, et sellise vastase ehk inimesega võitlemine on kassi-hiire mäng, mis ei lõpe kunagi. Iga kord, kui kaitseme oma kliente pahavara eest, proovivad ründajad leida uue viisi, kuidas meie lahendustest läbi murda. Meie uuendada enda kaitset ning nemad otsivad üha uusi võimalusi mööda hiilimiseks – nii jätkub see lõputult.

Küberjulgeolekumaailma pidevalt muutuv keskkond teeb universaalse kaitselahenduse loomise võimatuks, kui me just ei soovi mõlemal poolel olijate arengut keelata. ESET usub, et peame kohanema ja reageerima muutuvale ohumaastikule, mis tegelikult eksisteerib, mitte mingile staatilisele kujuteldavale maastikule.

Võite väita, et masinad on saanud targemaks punktini, kus nad suudavad inimesi nende enda mängus võita – näiteks Google’i algoritm AlphaGo – ja teil on õigus. Kuid nendel algoritmidel on vaid väga kitsas fookus ja funktsioon olukorras, kus reeglid on ettearvatavad. Küberjulgeolekus ei järgi ründajad aga mingeid reegleid. Mis veelgi hullem, nad suudavad kogu mängu ilma ettehoiatamata muuta.

„KÜBERJULGEOLEKUS EI JÄRGI RÜNDAJAD MINGEID REEGLEID. MIS VEELGI HULLEM, NAD SUUDAVAD KOGU MÄNGU ILMA ETTEHOIATAMATA MUUTA.“

Et võidelda vastasega, kellel on nn üldine intelligents, peaks turvalisuslahendus olema ehitatud sama tugevale (või üldisele) tehisintellektile, mis on võimeline uute keskkondade ja uute väljakutsetega kohanema. Tänane nõrk (või kitsalt fokusseeritud) masinõpe lihtsalt ei küündi sellise ülesandeni.

Puhtalt masinõppepõhise küberjulgeoleku lahenduse korral on vaja vaid ühte edukat pahatahtlikku rünnakut, et teie firma jääks terve kurikaelade armee eest kaitseta. ESETi lahendused pakuvad seega rohkemat kui lihtsalt masinõpet. Me kasutame mitmeid tehnoloogiaid, mis tavaliselt tõejärgsete müüjate toodetest puuduvad. Nii hoiame tänu kõrgele avastamise määrale sulid eemal, kuid samas suudame ka valepositiivsete määra madala hoida.

Kogu seeria:
1.   Juhtkiri: Küberjulgeoleku reaalsuse abil tõejärgsusega võitlemine
2.   Mis on masinõpe ja tehisintellekt?
3.   Kõige sagedasemad valearusaamad masinõppe ja tehisintelligentsi kohta
4.   Miks masinõppepõhine turvalisus intelligentseid vastaseid ei hirmuta
5.   Miks üherealisest küberkaitsest ei piisa – isegi kui tegu on masinõppega
6.   Kummituste tagaajamine: kõrge valepositiivsuse määra tegelik hind küberjulgeolekus
7.   Kuidas värskendused teie turvalahenduse tugevamaks muudavad
8.   Me tunneme masinõpet – oleme seda juba üle kümne aasta kasutanud

Loodame, et teile see seeria meeldib.

Panuse on andnud Jakub Debski & Peter Kosinar

Allikas: WeLiveSecurity