Det er svært at forestille sig det i dag, men ved årtusindskiftet var almindelig brevpost med kuverter og frimærker, stadig den mest udbredte skriftlige kommunikationsform. Brevposten toppede i mange lande omkring året 2001, hvor United States Postal Service (USPS) håndterede næsten 104 milliarder stykker brevpost.
Posttjenester over hele verden var overbelastede, da man stadig stod for manuel sortering af millioner af stykker brevpost. Det var ikke kun arbejdskrævende, men også fyldt med potentiale for menneskelige fejl og behovet for et effektivt, automatiseret system var stort.
Med udviklingen af optisk tegngenkendelse (OCR) til at digitalisere trykt tekst kom der et stor gennembrud, og OCR’s blev hurtigt anvendt i posttjenester. Disse tidlige systemer, var primitive efter nutidens standarder, men kunne scanne trykte tegn på kuverter og omdanne dem til digitale data, som maskiner kunne behandle.
OCR-teknologi var oprindeligt begrænset til at genkende klart, trykt tekst, og det var en stor udfordring at tyde de utallige måder som postnumre i håndskrift blev kradset ned med. Gennem forsøg og mange manuelle justeringer blev systemerne gradvist forbedret.
Men det egentlige spring fremad kom med integrationen af maskinlæring. Ved at fodre systemerne med enorme mængder data — billeder af postnumre i enhver tænkelig stil — lærte systemerne på en dynamisk måde, og blev gradvist bedre.
Med pålidelig OCR-teknologi kunne posttjenester nu sortere post med fænomenal hastighed. Breve og pakker blev hurtigt kategoriseret efter deres postnumre, hvilket strømlinede logistikken og reducerede leveringstiderne. Dette sparede ikke kun ressourcer for postvirksomhederne, men forbedrede også kundetilfredsheden med hurtigere og mere præcise leverancer.
I dag har teknologien, der begyndte med enkel mønstergenkendelse til postnumre, udviklet sig til avancerede AI-systemer, der er i stand til at lære at genkende ansigter, fingeraftryk og er fundamentalt set også det samme mekaniske som man bruger til stemmegenkendelse.
Efterhånden som kommunikation overgik til elektronisk form, opstod en ny, men delvist relateret, problematik. Da omkostningerne ved at sende breve blev næsten lig nul, opstod der en irriterende forretningsmodel med at sende mails med uønskede reklamer og regulær svindel. AI bruges til at frasortere uønskede e-mails, ved at analysere og kategoriserer mellem legitime beskeder og spam.
I træningsfasen fodres AI-systemet med store mængder data, herunder både spam og ikke-spam (også kendt som “ham”). Gennem denne træning lærer systemet at identificere kriterier, der kendetegner spam. Disse kriterier kan omfatte brug af specifikke ord eller fraser, frekvensen af visse ord, afsenderens e-mail-adresse, om e-mailen indeholder vedhæftede filer, og hvordan links i e-mailen opfører sig.
Når træningsfasen er færdig, benyttes spamfiltret til at overvåge indgående e-mails. En af de stærkeste aspekter ved AI i spamfiltre er evnen til kontinuerlig læring. Efterhånden som spamfiltret udsættes for nye typer af spam, tilpasser systemet sig ved løbende at opdatere sine kriterier baseret på den nyeste data. Dette sikrer, at filtret forbliver effektivt over tid, selv om afsendernes metoder bliver mere og mere sofistikerede. Anvendelsen af AI i spamfiltre forbedrer nøjagtigheden i identifikationen af spam, hvilket reducerer antallet af legitime e-mails, der fejlagtigt bliver fanget af spamfiltrene. For det andet kan AI håndtere store mængder data og træffe beslutninger i realtid. Trods disse fordele er AI-baserede spamfiltre ikke ufejlbarlige, for der er en hårfin grænse til såkaldt overfitting, hvor et filter frasorterer legitime mails. Afsendere af spam-mails designer deres angreb specifikt til at undgå kendte spam-filtre, hvilket der derfor kræver konstant tilpasning og opdatering, for at kunne fungere i den evige kamp mod svindlere.