Findes der allerede generel kunstig intelligens i dag, uden at vi opdager det

En videnskabelig strid, der vender alt på hovedet

Dette handler ikke om endnu en futuristisk sci-fi-vision. Det drejer sig om en konkret faglig diskussion: om nutidens AI-modeller – herunder populære chatbots – allerede opfylder de kriterier, vi selv har sat for intelligens på niveau med mennesker.

En nyligt offentliggjort artikel i et anerkendt videnskabeligt tidsskrift vender fuldstændig op og ned på den måde, vi måler “ægte” maskineintelligens på. En forskergruppe fra et californisk universitet fremsætter en kontroversiel påstand: generel kunstig intelligens (AGI – artificial general intelligence) er ikke et mål ude i horisonten, men en allerede opnået realitet.

Ifølge forskerne har nutidens systemer baseret på store sprogmodeller (LLM) nået et funktionsniveau, der i praksis opfylder definitionen på generel intelligens. Indtil for nylig omtalte de fleste teknologivirksomheder – fra OpenAI til de store spillere i Silicon Valley – AGI som den hellige gral. Nogle gav det et årti, andre et år eller to. Samtidig hævdede en del forskere, at den nuværende LLM-arkitektur er en blindgyde, og at det virkelige gennembrud først ville komme med komplekse “verdensmodeller”.

Den nye publikation stiller spørgsmålet fra en helt anden vinkel: hvad nu hvis vi alle kigger den forkerte vej og ikke bemærker, at den tærskel, vi ventede på, allerede er overskredet?

Turings test: en gammel målestok med nye resultater

Et af forskernes centrale argumenter er Turing-testen – det klassiske begreb fra 1950. Grundtanken er, at hvis et menneske ikke kan skelne en maskine fra et andet menneske i en skriftlig samtale, kan vi tale om intelligent maskinadfærd.

I den nyeste generation af chatbots begynder vi at se situationer, hvor folk oftere opfatter AI som et menneske end som en maskine. For bare få år siden ville et sådant resultat have været betragtet som uomtvisteligt bevis for, at generel maskineintelligens var opnået.

I dag hæver vi paradoksalt nok overliggeren konstant. Når systemerne begynder at opfylde tidligere kriterier, flytter nogle eksperter definitionerne og kræver nye egenskaber for “ægte” intelligens. Dette skift i målestokken afspejler vores skiftende forhold til teknologi og vores forventninger til maskiner.

Hvor slutter AGI, og hvor begynder superintelligens

Forskerne foreslår en klar skelnen mellem generel kunstig intelligens og superintelligens. Det er vigtigt, fordi disse begreber ofte blandes sammen i den offentlige debat. Forfatterne hævder, at vi på det første punkt allerede er meget tæt på – eller endda over – grænsen.

Nutidens LLM-systemer håndterer programmering, juridisk analyse, indholdsskabelse, oversættelse og endda matematisk ræsonnement – ofte på specialistniveau. Efter denne logik behøver vi ikke vente på, at AI begynder at slå genier i enhver disciplin. For at anerkende generel intelligens er det tilstrækkeligt at præstere på niveau med et gennemsnitligt, veluddannet menneske – med styrker på visse områder og svagheder på andre.

De centrale kendetegn, der adskiller de to begreber:

AGI mestrer et bredt spektrum af opgaver på menneskeniveau
Superintelligens overgår markant menneskelige evner på alle områder
AGI kan have svagheder inden for bestemte domæner
Superintelligens kan løse problemer helt uden for menneskets rækkevidde
AGI arbejder med data og mønstre fra sin træning
Superintelligens skaber helt nye koncepter og teorier
AGI kræver menneskelig kontrol og validering
Superintelligens ville være autonom i sin beslutningstagning

Forskerne understreger, at forventningen om, at AGI skal levere videnskabelige gennembrud hver uge, er urealistisk – det kræver vi heller ikke af de mennesker, vi betegner som intelligente. Det afgørende er funktionel håndtering af forskelligartede opgaver, ikke excellence på alle fronter på én gang.

Den stokastiske papegøje og andre indvendinger mod LLM

Modstandere af nutidens sprogmodeller gentager, at de i bund og grund er “statistiske papegøjer”: systemer uden reel forståelse, der blot sammensætter tekstfragmenter baseret på sandsynlighed. Ifølge dem skaber AI ikke tanker – den klistrer bare sætninger sammen fra træningsdata.

Den nye analyse forsøger systematisk at afvise sådanne indvendinger. Forfatterne peger på flere elementer, som er svære at afvise med argumentet “det er bare gentagelse af data”. Blandt disse er evnen til at løse nye, hidtil ukendte matematik- og logikopgaver, overføring af viden fra ét område til et andet, konstruktion af sammenhængende årsags-virkningsmodeller i samtaler samt håndtering af situationsbeskrivelser, der kræver fysisk intuition.

Hvis et system kan udlede den korrekte løsning på et problem, det ikke har mødt i sine træningsdata, er det svært at påstå, at det “blot citerer”. Det betyder ikke, at AI forstår verden som et menneske, men det antyder, at der sker noget mere end simpel sætningssammenklæbning. Forskere dokumenterede tilfælde, hvor GPT-4 og Claude løste logiske gåder på måder, der afveg fra de mønstre, der fandtes i tilgængelige databaser.

Kræver intelligens en krop og sanser?

En af de mest følelsesladede forsvarlinjer lyder: “AI har ingen krop, så det er ikke ægte intelligens.” Mennesker lærer gennem bevægelse, berøring, smerte og sansning. Maskiner opererer primært med tekst, billeder og lyd i dataform.

Artiklens forfattere mener, at fraværet af en fysisk krop ikke udelukker generel intelligens. De påpeger, at nutidens modeller kan forudsige konsekvenser af handlinger, analysere videoscener, fortolke fotografier og lydoptagelser. Hertil kommer den voksende branche kaldet Physical AI – integration af avancerede modeller med robotter.

Robotter udstyret med sensorer og kameraer begynder at kombinere LLM’ernes abstrakte evner med faktisk handling i fysiske omgivelser. Det åbner et rum, hvor maskinen ikke blot beskriver bevægelse, men udfører og løbende korrigerer den. Virksomheder tester integration af avancerede sprogmodeller i humanoide robotter.

Forskerne fremhæver, at mennesker blinde fra fødslen kan udvise høj intelligens uden visuelle indtryk. På tilsvarende vis kunne AI fungere intelligent uden det fulde spektrum af menneskelige sanser. Det afgørende er informationsbehandling og evnen til at løse problemer – ikke den konkrete form for input.

Hukommelse, autonomi, indlæringstid – er det nødvendige betingelser?

En anden indvending mod nutidens systemer lyder: de har hverken permanent autobiografisk hukommelse eller reel autonomi. En chatbot afslutter en session og “glemmer” samtalen, fungerer inden for rammer sat af mennesker og har ingen kontinuitet i oplevelsen.

Ifølge forskerne er dette ikke obligatoriske betingelser for at anerkende generel intelligens. De påpeger, at langtidshukommelse kan tilføjes som et systemlag, at autonomi er et spørgsmål om design og etik snarere end kognitive evner, og at mængden af data, der kræves til indlæring, ikke bør afgøre intelligensstatussen.

Et menneske lærer at køre bil i løbet af adskillige timers kørsel. AI kan have brug for millioner af eksempler fra simuleringer. Forfatterne understreger, at det er det endelige færdighedsniveau, der tæller – ikke omkostningerne ved at nå dertil. Modeller som GPT-4 Turbo råder allerede i dag over et kontekstvindue på op til 128.000 tokens, hvilket giver dem mulighed for at opretholde sammenhæng i lange samtaler.

Hallucinationsproblemet: den mest alvorlige fejl ved nutidens modeller

Selv de mest begejstrede AGI-fortalere indrømmer, at nutidens systemer har en alvorlig svaghed: tendensen til “hallucinationer”. Det drejer sig om generering af information, der lyder troværdig, men er fuldstændig opdigtet – fra fiktive videnskabelige kilder til ikke-eksisterende lovbestemmelser.

Virksomheder, der udvikler modeller, erkender, at andelen af sådanne fejl stadig er mærkbar. Ifølge interne analyser fra en af de største AI-organisationer kan selv næste generation af modeller have et element, der ikke stemmer overens med fakta, i hver tiende svar. Hallucinationer forbliver et kritisk problem, der kræver en løsning.

Artiklens forfattere forsøger at nedtone dette argument ved at påpege, at mennesker også tager fejl, skaber falske minder og lader sig bedrage af illusioner. Kritikere svarer, at omfanget og lethed, hvormed AI genererer “selvsikre” meningsløsheder, skaber en helt ny risiko – særligt inden for medicin, jura og økonomi.

Hallucinationer er fortsat en af de vigtigste grunde til, at mange eksperter stadig ikke vil anerkende, at vi har at gøre med en fuldt fungerende generel maskineintelligens. Så længe systemer ikke pålideligt kan skelne fakta fra fiktion, forbliver deres status som AGI omstridt.

Er det vores definition af intelligens, der er problemet?

Forskernes endelige tese rammer selve grundlaget for diskussionen: måske ligger problemet ikke i, at AI er “for svag”, men i at vores begreb om intelligens er for snævert og stærkt menneskecentreret.

Mennesker har en naturlig tilbøjelighed til at bedømme alt ud fra deres eget arts perspektiv. Hvis en maskine tænker anderledes, begår andre fejl og lærer på en anden måde – betragter vi den som “ringere”. Forfatterne antyder, at vi falder i antropocentrismens fælde: vi vil ikke indrømme, at en ny slags intelligens er ved at forme sig – forskellig fra vores, men funktionelt sammenlignelig.

Det forklarer til dels, hvorfor ordet “superintelligens” optræder stadig hyppigere i debatten. At flytte opmærksomheden til det næste, endnu fjernere niveau udskyder det øjeblik, hvor vi klart må sige: generel maskineintelligens banker allerede på døren – eller sidder måske allerede ved bordet.

Forskere fra Stanford University offentliggjorde en undersøgelse, der viser, at vores intelligensparametre er kulturelt betingede og fokuseret på menneskelige evner. Vi har måske brug for en ny ramme til at vurdere ikke-menneskelig intelligens.

Hvad betyder denne debat for den almindelige AI-bruger?

Striden om definitioner er ikke blot en akademisk øvelse. Spørgsmålet om, hvorvidt vi anerkender nutidens systemer som generel intelligens, påvirker direkte, hvordan vi regulerer dem, hvor meget vi stoler på dem, og hvilke opgaver vi betror dem.

Hvis vi begynder at betragte nutidens modeller som AGI, øges presset for at indføre strengere juridiske rammer og tilsyn med implementeringer, krav om gennemsigtighed vedrørende træningsdata og funktionsmåde, grundigere undersøgelse af AI’s indvirkning på arbejdsmarkedet og politiske beslutninger samt udvikling af faktakontrolsystemer, der “holder øje med” chatbots.

Fra brugerens perspektiv bliver en kritisk tilgang afgørende. Selv om AI forstår komplekse problemer og kan rådgive bedre end mange søgemaskiner, kan vi stadig ikke tage dens svar som ufejlbarlig visdom. Fornuftig brug af sådanne værktøjer kræver, at man kombinerer deres regnekraft med menneskelig dømmekraft og faglig viden. Styrken ved AGI – i den forstand, forskerne foreslår – viser sig tydeligst, når menneske og system arbejder side om side.