Hvor anvendes kunstig intelligens?

Kunstig intelligens har udviklet sig fra at være interessant i snævre akademiske cirkler til at være talk of the town på alle niveauer i samfundet, og i dag anvendes teknologierne indenfor en række områder og industrier. I sundhedsvæsenet hjælper AI med at diagnosticere sygdomme, personalisere behandlinger og forbedre patientovervågning. Inden for bilindustrien er AI afgørende for udviklingen af selvkørende biler, hvor den hjælper med at fortolke sensorinformation og træffe beslutninger i realtid. I finanssektoren anvendes AI til at analysere store mængder data for at forudsige markedstendenser, administrere risici og automatisere handel. Inden for detailhandel bruger virksomheder AI til at tilpasse kundeoplevelser, optimere lagerholdning og forbedre e-handelsplatforme.

De første kommercielle anvendelser af AI

Det er svært at forestille sig det i dag, men ved årtusindskiftet var almindelig brevpost med kuverter og frimærker, stadig den mest udbredte skriftlige kommunikationsform. Brevposten toppede i mange lande omkring året 2001, hvor United States Postal Service (USPS) håndterede næsten 104 milliarder stykker brevpost.

Posttjenester over hele verden var overbelastede, da man stadig stod for manuel sortering af millioner af stykker brevpost. Det var ikke kun arbejdskrævende, men også fyldt med potentiale for menneskelige fejl og behovet for et effektivt, automatiseret system var stort.

Med udviklingen af optisk tegngenkendelse (OCR) til at digitalisere trykt tekst kom der et stor gennembrud, og OCR’s blev hurtigt anvendt i posttjenester. Disse tidlige systemer, var primitive efter nutidens standarder, men kunne scanne trykte tegn på kuverter og omdanne dem til digitale data, som maskiner kunne behandle.

OCR-teknologi var oprindeligt begrænset til at genkende klart, trykt tekst, og det var en stor udfordring at tyde de utallige måder som postnumre i håndskrift blev kradset ned med. Gennem forsøg og mange manuelle justeringer blev systemerne gradvist forbedret.

Men det egentlige spring fremad kom med integrationen af maskinlæring. Ved at fodre systemerne med enorme mængder data — billeder af postnumre i enhver tænkelig stil — lærte systemerne på en dynamisk måde, og blev gradvist bedre.

Med pålidelig OCR-teknologi kunne posttjenester nu sortere post med fænomenal hastighed. Breve og pakker blev hurtigt kategoriseret efter deres postnumre, hvilket strømlinede logistikken og reducerede leveringstiderne. Dette sparede ikke kun ressourcer for postvirksomhederne, men forbedrede også kundetilfredsheden med hurtigere og mere præcise leverancer.

I dag har teknologien, der begyndte med enkel mønstergenkendelse til postnumre, udviklet sig til avancerede AI-systemer, der er i stand til at lære at genkende ansigter, fingeraftryk og er fundamentalt set også det samme mekaniske som man bruger til stemmegenkendelse.

Efterhånden som kommunikation overgik til elektronisk form, opstod en ny, men delvist relateret, problematik. Da omkostningerne ved at sende breve blev næsten lig nul, opstod der en irriterende forretningsmodel med at sende mails med uønskede reklamer og regulær svindel. AI bruges til at frasortere uønskede e-mails, ved at analysere og kategoriserer mellem legitime beskeder og spam.

I træningsfasen fodres AI-systemet med store mængder data, herunder både spam og ikke-spam (også kendt som “ham”). Gennem denne træning lærer systemet at identificere kriterier, der kendetegner spam. Disse kriterier kan omfatte brug af specifikke ord eller fraser, frekvensen af visse ord, afsenderens e-mail-adresse, om e-mailen indeholder vedhæftede filer, og hvordan links i e-mailen opfører sig.

Når træningsfasen er færdig, benyttes spamfiltret til at overvåge indgående e-mails. En af de stærkeste aspekter ved AI i spamfiltre er evnen til kontinuerlig læring. Efterhånden som spamfiltret udsættes for nye typer af spam, tilpasser systemet sig ved løbende at opdatere sine kriterier baseret på den nyeste data. Dette sikrer, at filtret forbliver effektivt over tid, selv om afsendernes metoder bliver mere og mere sofistikerede.

Anvendelsen af AI i spamfiltre forbedrer nøjagtigheden i identifikationen af spam, hvilket reducerer antallet af legitime e-mails, der fejlagtigt bliver fanget af spamfiltrene. For det andet kan AI håndtere store mængder data og træffe beslutninger i realtid,

Trods disse fordele står AI-baserede spamfiltre over for visse udfordringer. For er der en hårfin grænse til såkaldt overfitting, hvor et filter frasorterer legitime mails. Afsendere af spam-mails designer deres angreb specifikt til at undgå kendte spam-filtre, hvilket kræver konstant tilpasning og opdatering af AI-modellerne.

Billedgenkendelse

At kunne genkende et ansigt, er en af de tidligste kognitive egenskaber vi får som børn. Det er en fundamental overlevelsesmekanisme at kunne genkende at andet menneske, og alle der har holdt en baby i armene, har oplevet den magiske sociale interaktion der opstår når et lille barn kigger en direkte i øjnene.

På trods af at ansigtsgenkendelse, er en evne der falder os helt naturligt, blev denne egenskab set som næsten umuligt at genskabe ved brug af kunstig intelligens. Udviklingen indenfor deep learning og ikke mindst den kraftige eksplosion i mængden af tilgængelige data på internettet, kom der et stort gennembrug. En efter overset forudsætning for ethvert system der benytter sig af deep learning er adgang til annoteret data – dvs. data hvor mennesker har kategoriseret og beskrevet, hvad data indeholder. Til træning af billedgenkendelsesmodeller bruges en bred vifte af databaser, som hver især indeholder store samlinger af billeder med tilhørende etiketter eller annotationer, der beskriver billedets indhold. Disse databaser er afgørende for at udvikle og finjustere de algoritmer, der driver billedgenkendelse i forskellige anvendelser.

Måske den mest berømte database inden for computervision hedder Imagenet. ImageNet indeholder over 14 millioner billeder kategoriseret i over 20.000 kategorier, og har været fundamentet for mange gennembrud i dyb læring og billedgenkendelse. En anden meget anvendt database hedder COCO (Common Objects in Context). Denne database er særligt værdsat for sine komplekse scener med almindelige objekter i deres naturlige kontekst. Den indeholder over 330.000 billeder med annotationer, der omfatter objektdetektion, segmentering og billedtekstning.

Ansigtsgenkendelse har revolutioneret måden, hvorpå vi interagerer med vores mobile enheder. Fra oplåsning af telefoner til godkendelse af transaktioner og apps.  Ansigtsgenkendelse bruges i stigende grad på lufthavne og grænseovergange til at strømline sikkerheds- og immigrationstjek. Det hjælper med at fremskynde identifikationsprocesser og reducerer ventetider, samtidig med at det forbedrer sikkerheden ved at nøjagtigt matche individer med deres rejsedokumenter.

Der har dog også været stigende kritik at ansigtsgenkendelse. En bekymring er, at regeringer kan bruge ansigtsgenkendelse til omfattende overvågning, hvilket potentielt underminerer borgerlige friheder. I nogle lande bruges teknologien allerede til at overvåge befolkningen, hvilket rejser alvorlige spørgsmål om statslig kontrol og overvågningssamfundet. I mange tilfælde er brugerne ikke klar over, at deres ansigter bliver scannet, og de har ikke givet eksplicit samtykke til at deres biometriske data bliver indsamlet og analyseret. Dette rejser etiske spørgsmål omkring brugen af personlige data. Forskning har vist, at ansigtsgenkendelsesalgoritmer kan indeholde bias, som kan føre til diskrimination. Nogle systemer har vist sig at være mindre nøjagtige, når de identificerer kvinder, ældre og folk med mørkere hudfarver. Dette kan føre til uretfærdig behandling af visse grupper og forstærke eksisterende sociale uligheder.

Maskinoversættelse

I begyndelsen af det 21. århundrede begyndte udviklingen af neurale netværk og dyb læringsteknologi at ændre landskabet for sprogoversættelse. Disse teknologier tillod maskiner at lære fra store datasæt bestående af paralleltekster – dvs. dokumenter, der er oversat fra et sprog til et andet af mennesker.

Paralleltekster giver de nødvendige eksempler på, hvordan sætninger oversættes mellem sprog, og de er afgørende for at lære maskinoversættelsessystemer at forstå og genskabe sproglige strukturer og betydninger. Et eksempel er Europarl Corpus, der består af transskriptioner af Europa-Parlamentets forhandlinger, som er oversat til de officielle EU-sprog. Europarl er særligt nyttigt for træning af oversættelsessystemer mellem europæiske sprog.

Databasen United Nations Parallel Corpus indeholder officielle FN-dokumenter, som er oversat til de seks officielle FN-sprog: engelsk, fransk, spansk, russisk, kinesisk og arabisk. Et tredje eksempel er  OpenSubtitles der er en stor samling af undertekster fra film og tv-shows, som er oversat til mange forskellige sprog. Denne kilde er særlig nyttig for at træne mere uformelle, samtale-baserede oversættelsesmodeller.

Et centralt element i disse AI-systemer er transformer-modeller, der gør det muligt for AI at evaluere hele sætninger på en gang, hvilket markant forbedrer dens evne til at forstå og oversætte kontekst korrekt. Denne kapacitet har været afgørende for at opnå mere naturlige og præcise oversættelser, især i komplekse tekstpassager.

AI’s evne til selv-læring betyder også, at oversættelsessystemerne konstant forbedrer sig. Hver gang et system støder på en fejl eller modtager brugerfeedback, justerer det sine algoritmer for bedre at håndtere lignende udfordringer i fremtiden. Denne form for adaptiv læring er vital for at holde trit med de skiftende sprog og dialekter rundt om i verden.

En af de mest spændende anvendelser af AI i oversættelse er realtidsoversættelse af tale, som har revolutioneret internationale forretningsmøder, kundesupport og turisme. Med AI-drevne enheder kan brugere tale med mennesker fra hele verden i deres eget sprog, hvilket skaber en mere flydende og forståelig kommunikation.

Kvaliteten af maskinoversættelse varierer afhængigt af flere faktorer. Nogle sprog oversættes mere nøjagtigt end andre på grund af forskelle i grammatik, syntaks og tilgængelighed af træningsdata. For eksempel er oversættelser mellem tæt beslægtede sprog som spansk og italiensk ofte mere præcise end oversættelser mellem meget forskellige sprog som engelsk og kinesisk.

Maskinoversættelsessystemer er mest nøjagtige, når de arbejder inden for et specifikt domæne, hvor de kan trænes på domænespecifikke data. For eksempel vil et system trænet på juridiske dokumenter være mere præcist inden for juridisk terminologi, men kan underpræstere i mere generelle eller uformelle kontekster.

Kvaliteten af de data, som systemet er trænet på, spiller en afgørende rolle. Jo mere omfattende og højkvalitets træningsdata, desto bedre bliver systemets evne til at generere præcise oversættelser. Dette omfatter både mængden af data og dens relevans for de tekster, der skal oversættes.

Metaforer, humor og kulturelle referencer, kan være svære at overføre præcist fra et sprog til et andet – dette gælder både tekster der er oversat af mennesker og for maskiner. Oversættelsessystemer laver undertiden også grammatiske fejl eller misforstår kontekst. I mange praktiske scenarier er maskinoversættelser dog tilstrækkelige god til at give resultater, der er forståelige, selv om de ikke altid er perfekte.

Naturlig sprogbehandling. Natural Language Processing (NLP) er et studieområde inden for datalogi og kunstig intelligens, der beskæftiger sig med interaktionen mellem computere og mennesker, der bruger naturligt sprog. Målet med NLP er at gøre computere i stand til at forstå, fortolke og generere menneskeligt sprog præcist og meningsfuldt. Det involverer en kombination af datalogi, lingvistik og kognitive psykologiske teknikker og opgaver som tekstklassificering, tekstgenerering, maskinoversættelse, sentimentanalyse og genkendelse af navngivne enheder.

De seneste fremskridt inden for NLP, der til dels er drevet af deep learning-teknikker, har ført til betydelige forbedringer i NLP-systemernes nøjagtighed og ydeevne, hvilket gør dem stadig bedre i stand til at forstå og behandle menneskeligt sprog.

ChatGPT er en NLP-model designet til at generere tekst. I “ChatGPT” står GPT for “Generative Pre-trained Transformer”. Det er en type af kunstig intelligens, der er designet til at generere tekst baseret på de data, den har fået under sin træning. Ordet Generative refererer til systemets evne til at skabe indhold, “Pre-trained” indikerer, at den er forudtrænet på en stor mængde tekst før den specifikke træning, og “Transformer” er den specifikke type af model, der anvendes, kendt for sin effektivitet i at behandle sprog.

AI i sundhedsvæsnet

I sundhedssektoren har kunstig intelligens (AI) revolutioneret måden, vi tænker om diagnose, behandling og patientpleje. AI-algoritmer bruges til at analysere medicinske billeder med imponerende nøjagtighed, hvilket hjælper med at identificere sygdomme såsom kræft tidligt. Denne teknologi anvendes også til at tilpasse behandlinger til individuelle patienter ved at analysere enorme mængder data fra patientjournaler samt personlige oplysninger som genetik og livsstil.

På forskningsfronten accelererer AI udviklingen af nye lægemidler ved at forudsige molekylære strukturer og optimere screeningsprocesser, hvilket kan skære betydeligt i både tids- og økonomiske omkostninger. Mens denne teknologi fortsætter med at udvikle sig, står sundhedssektoren over for udfordringer relateret til datasikkerhed, privatliv og etisk brug af AI, hvilket nødvendiggør en omhyggelig vurdering for at sikre, at patienternes rettigheder respekteres og at plejen forbedres på en ansvarlig måde. Integrationen af AI lover ikke kun mere præcise diagnoser og effektive behandlinger, men også forbedrede patientresultater på tværs af sundhedsvæsenet.