Kan datamaskiner se? Hvis du lærer dem hvordan, ja, og de gir et nyttig ekstra lag med sikkerhet mot cybertrusler.
Fremveksten av kunstig intelligens-plattformer som ChatGPT har sett teknologien komme inn i det offentlige domene. Enten du elsker det, avskyr det eller frykter det, AI er her for å bli. Men AI representerer mer enn bare en smart chatbot. Bak kulissene blir den brukt på mange innovative måter.
En slik måte er bruken av AI-drevet datasyn (CV) som et annet lag av cybersikkerhet. La oss ta en titt på hvordan CV hjelper mot phishing-angrep.
Hva er datasyn?
Datasyn ligner i konseptet på store språkmodeller som GPT-4. Verktøy som ChatGPT og Bing Chat bruker disse enorme tekstdatabasene til å generere menneskelignende svar på brukerinndata. CV bruker det samme konseptet bare med et massivt lager av bildedata.
Men CV er mer komplekst enn bare å ha en enorm database med bilder. Kontekst er en kritisk faktor som må inkluderes i ligningen.
De store språkmodeller bak AI chatbots fungerer ved å bruke dyp læring
å forstå faktorer som kontekst. På samme måte bruker CV dyp læring for å forstå konteksten til bilder. Det kan beskrives som menneskesyn ved datamaskinhastigheter.Men hvordan hjelper CV med å oppdage phishing-angrep?
Hvordan datasyn brukes til å oppdage phishing-angrep
Phishing-angrep er en av de største nettsikkerhetstaktikkene som brukes av svindlere. Tradisjonelle metoder for å oppdage dem er langt fra perfekte, og truslene blir stadig mer sofistikerte. CV tar sikte på å plugge en av de kjente sårbarhetene – tidenes. Mer spesifikt, avhengigheten av svartelister over mer "tradisjonelle" metoder.
Problemet her er at det er problematisk å holde svartelister oppdatert. Selv et par timer mellom et phishing-nettsted blir lansert og det blir inkludert på en svarteliste er lenge nok til at mye skade kan gjøres.
CV er ikke avhengig av svartelister, og oppdager heller ikke innebygd ondsinnet kode. I stedet bruker den flere teknikker for å flagge mistenkelige gjenstander.
- Bilder samles inn fra relevante e-poster, nettsider eller andre kilder som kan inneholde trusler. Disse behandles deretter ved hjelp av datasyn.
- Bildebehandlingsstadiet undersøker fire hovedelementer: logo/varemerkegjenkjenning, gjenstand/scenegjenkjenning, tekstgjenkjenning og visuelt søk.
- Disse kontrolleres ved hjelp av en prosess kalt "Risk Elements Aggregation" og resultatene flagger mistenkelige elementer.
La oss se nærmere på hvordan CV finner ledetråder i elementene den undersøker.
Logo/varemerkegjenkjenning
Merkeforfalskning er en vanlig teknikk som brukes av svindlere. Computer Vision er programmert til å oppdage logoer som ofte brukes av svindlere, men det kan også kombinere denne informasjonen med innholdet og prioriteringen av e-posten.
For eksempel kan en e-post merket som haster med logoen til en bank bli flagget som potensielt uredelig. Den kan også sjekke sannheten til logoen mot forventede resultater fra CV-datalageret.
Objektdeteksjon
Svindlere vil ofte konvertere objekter som knapper eller skjemaer til grafikk. Dette gjøres ved å bruke en rekke grafiske og kodeteknikker designet for å "gjøre vannet". I tillegg kan krypterte skript brukes til å utføre handlinger som å lage skjemaer, men bare etter at e-posten eller nettstedet er gjengitt.
Objektdeteksjon ser etter visuelle ledetråder etter at et nettsted eller en e-post er gjengitt. Den kan oppdage objekter som knapper eller skjemaer selv i grafisk format. Dessuten, fordi den sjekker etter at e-posten eller nettstedet er gjengitt, blir krypterte elementer sjekket.
Tekstgjenkjenning
På samme måte kan tekst skjules ved hjelp av en rekke teknikker. Blant de foretrukne taktikkene brukt av svindlere er:
- Utfylling av ord med tilfeldige bokstaver som fjernes når siden eller e-posten gjengis.
- Å skjule ord ved å stave dem feil. Et vanlig eksempel er pålogging som lett kan skjules ved å bytte L for stor I som i — Iogin. Kan du fortelle det?
- Konvertering av tekst til grafikk.
CV kan bruke tekstanalyse (litt som Optical Character Recognition, men på steroider!) for å oppdage triggerord som passord, kontodetaljer og pålogging. Igjen, fordi den kjører etter gjengivelse kan all tekst fanges opp og skannes.
Visuelt søk
Selv om dette er en del av CV-anti-phishing-verktøysettet, er det avhengig av referansedata for å fungere. Derfor er den bare så god som dataene den har registrert. Dette etterlater den med samme akilleshæl som ethvert annet system som er avhengig av en svarteliste.
Det fungerer ved å holde en "mal" av kjente gode bilder (KGI) og kjente dårlige bilder (KBI) i bildedatabasen. Denne informasjonen kan deretter brukes til å utføre sammenligninger for å oppdage anomalier.
Er Computer Vision et frittstående phishing-beskyttelsessystem?
Det korte svaret er «nei». Foreløpig fungerer CV som et ekstra lag med sikkerhet og er kun et levedyktig alternativ for kommersielle virksomheter.
Men for disse virksomhetene legger CV til et nytt lag med sikkerhet som kan skanne objekter i sanntid uten å stole på svartelister eller oppdage kodede trusler. Og i det pågående våpenkappløpet mellom svindlere og sikkerhetseksperter, kan dette bare være en god ting.
Ser vi fremover, viser den plutselige og voldsomme økningen av AI-drevne chatbots som ChatGPT hvor vanskelige spådommer er når man diskuterer enhver form for AI. Men la oss prøve det uansett!
Hva er fremtiden for datasyn som et anti-phishing-våpen?
Selv om det neppe vil ha samme dramatiske innvirkning som AI-drevne chatbots, gjør CV-anti-phishing allerede jevn fremgang på en konsept kjent som teknologiadopsjonskurven.
For ikke så lenge siden var teknologien domenet til større bedrifter som hadde nettverksinfrastruktur og båndbredde til å enten kjøre den som en skybasert løsning eller som en lokal tjeneste.
Dette er ikke lenger tilfelle.
Mer praktiske abonnementstjenester åpnes nå for bedrifter av alle størrelser. Like viktig i skydatabehandlingens tidsalder er muligheten til å beskytte enhver enhet fra hvor som helst. Dette er nå et alternativ med mange av tjenestene.
Men hvis du ønsker å legge dette til hjemmedatamaskinen din, er dette ennå ikke et realistisk alternativ. «Ennå» er det kritiske ordet her. Den eksponentielle økningen i raffinement og tilgjengelighet til AI-modeller vil nesten helt sikkert bringe denne funksjonaliteten til hjemmebrukeren.
Det eneste virkelige spørsmålet er når.
Datasyn: Å se er beskyttende
AI har vært mye i nyhetene i det siste, og plattformer som ChatGPT, Bing Chat og Google Bard stjeler rampelyset. Dette er forstyrrende teknologier som, når støvet endelig legger seg, vil radikalt ha endret hvordan vi får tilgang til informasjon og hva vi kan gjøre med den.
Selv om disse utvilsomt er overskriftsfangerne, lager mindre forstyrrende teknologier som CV stille og rolige bølger i bakgrunnen. Og alt som bidrar til å forstyrre den økende sykdommen til phishing-angrep må være en god ting.