29.02.2020
Cybercrime

Nieuwe deep learning AI-tool scant wekelijks 300 miljard Gmail bijlagen

By: Irene Boskma

BlogCybercrime

Gmail van Google heeft vandaag de dag meer dan 1,5 miljard gebruikers wereldwijd. Heel veel mensen maken dagelijks gebruik van hun Gmail-account en dat doen we bovendien in veel verschillende talen. 15 jaar na de start van Gmail is spam nog steeds niet uitgebannen. Vaak wordt malware verstuurd via een document dat als bijlage bij de e-mail komt.

AI-tool om malware te detecteren

De personen en bedrijven die achter malware zitten worden steeds slimmer en spam kan door Gmail, maar ook Microsoft (Outlook) niet helemaal uitgefilterd worden. Maar ook Google maakt Gmail steeds slimmer om zoveel mogelijk spam te kunnen filteren. Een ‘deep learning’ AI-tool (Artificial Intelligence) wordt nu gebruikt om te voorkomen dat malware in je inbox terechtkomt.

Google blokkeert bijna alle spam

Hoewel je misschien vindt dat je alsnog veel spam in je mailbox krijgt, lukt het Google wel om 99,9% eruit te filteren. Google maakt gebruik van machine learning om het beveiligingsproces van Gmail te verbeteren. In 2017 kondigde Google al aan dat modellen voor machine learning 99,9% van alle spam- en phishing berichten je inbox niet bereiken. Dat is natuurlijk een behoorlijke prestatie en anno 2020 lukt het Gmail nog steeds om dat percentage in stand te houden. De machine learning modellen worden continu aangescherpt.

Om malware zoveel mogelijk buiten de deur te houden verwerkt de scanner van Gmail wekelijks 300 miljard bijlagen op zoek naar schadelijke documenten. Van alle documenten die geblokkeerd worden, zegt Google dat 63% ervan dagelijks verandert. Daarom investeert het bedrijf flink in volgende generatie scanners: AI Deep Learning tools.

Zo gebruikt Google deep learning tools

Machine learning kun je zien als een tak van AI die algoritmen gebruikt waarvoor gestructureerde gegevens in het systeem moeten worden ingevoerd om goed te kunnen werken. Om dit voor elkaar te krijgen is er menselijke tussenkomst nodig. Deep learning wordt gezien als een soort menselijk brein, een verzameling van allerlei methodes van machine learning, gebaseerd op zogenaamde neurale netwerken. Deep learning kan heel goed foto’s categoriseren en spreekberichten vertalen. Google gebruikt deep learning hier al voor en gaat het nu inzetten in de strijd tegen malware.

Goede resultaten malware scanning

Sinds eind 2019 werkt Google met een nieuwe deep learning scanner in de strijd tegen malware. Sindsdien is de dagelijkse detectiedekking van Office-documenten die schadelijke bijlagen bevatten, met 10% toegenomen. Dat is op een hoeveelheid van 300 miljard wekelijkse bijlagen, een enorme hoeveelheid. Waar de scanner voornamelijk goed op scoort, is het detecteren van vijandige ‘burst-aanvallen’. Dankzij deep learning is de identificatie van dit soort kwaadaardige documenten met 150% verbeterd.

Het werkt met een TensorFlow-model voor deep learning en een aangepaste documentatie-analyse voor elk ander bestandstype. TensorFlow is een open-source softwarebibliotheek die wordt gebruikt voor dataflow en gedifferentieerde programmering en Google traint zijn model met het TensorFlow Extended (TFX) -platform.

Share this post