Generativ AI ChatGPT kontra dessa oändliga typapor, ingen tävling säger AI-etik och AI-lag

Generativ AI som ChatGPT går head-to-head med de oändliga aporna, men ska vi fortsätta ... [+] använder den felaktiga jämförelsen?

getty

De där galna aporna.

Det finns ett ganska känt tankeexperiment som du kanske har hört talas om som involverar apor. Den helt och hållet spännande konsten används ofta av dem som vill göra en särskilt finslipad poäng.

Så här går handlingen till.

Föreställ dig att en apa skriver på en skrivmaskin. Om apan fortsätter att skriva under en oändlig tid, och antar att apan skriver nycklar rent slumpmässigt, är oddsen att hela Shakespeares verk oundvikligen kommer att skrivas.

Kontentan är tydligen att det av en slump enbart är möjligt att ibland få ett begripligt svar. Vi tenderar alla att vara överens om att Shakespeares verk är en enorm utställning av begripligt skrivande och resonemang. Alltså, vad som helst eller något sätt att framställa Shakespeares prisade ord skulle tyckas vara otroligt imponerande, men samtidigt skulle vi häftigt besvikna att det inte var av intelligens i sig och istället av enbart slumpmässig tur.

Vissa försöker numera jämföra denna apladdade metafor med det senaste inom artificiell intelligens (AI).

Du vet förmodligen att den hetaste formen av AI nuförtiden är Generativ AI, vilket exemplifieras via en brett och mycket populär AI-app känd som ChatGPT gjord av OpenAI. Jag kommer att förklara mer om generativ AI och ChatGPT om ett ögonblick. För just nu, vet bara att detta är en text-till-text eller text-till-uppsats AI-app som kan producera en uppsats för dig baserat på en inmatad uppmaning som du väljer.

Den påstådda kopplingen relaterad till den legendariska maskinskrivande apan är att de imponerande, producerade essäer som produceras av generativ AI som verkar vara helt flytande inte är mer häpnadsväckande än prestationerna av den skrivande primaten. Om du accepterar premissen att en apa som slumpmässigt skriver kan generera Shakespeares verk, och om du är villig att medge att ChatGPT och annan generativ AI skenbart är samma, måste du dra slutsatsen att generativ AI inte alls är särskilt anmärkningsvärt. Det är bara slumpmässighet som lurar oss.

Tja, det här kan tyckas vara ett övertygande fall, men vi måste packa upp det. En uppmärksam uppackning kommer att visa att jämförelsen mellan de två är missvisande och uppenbart fel.

Sluta göra jämförelsen. För de som insisterar på att fortsätta att göra en jämförelse, vänligen gör det åtminstone på ett försiktigt och utomordentligt sätt.

De som helt enkelt kastar runt jämförelsen gör generativ AI en otjänst. Och det mer avgörande problemet är att detta är vilseledande för allmänheten och samhället i stort. Jag antar att vi också kan tillägga att de gör de hårt arbetande aporna en björntjänst också, eller kanske undergräver värdet av satsen om oändliga typapor. Var rättvis. Var snäll. Var sanningsenlig.

Innan vi går in på en djupdykning av detta, finns det ett insiderskämt som utnyttjar begreppet skrivande apa. Du kanske gillar det.

Den cyniska biten humor spåras ofta till personlig korrespondens under Internets första storhetstid. Det var när Internet var på väg från att vara ett dystert seriöst onlinevärld och in i det orubbliga territoriet av att vara bullrigt, bullrigt och oregerligt när antalet personer som använde Internet ökade bevisligen.

Den humoristiska anekdoten säger att om apor som skriver på skrivmaskiner i slutändan skulle producera eller ska vi säga reproducera hela Shakespeares verk, så har vi nu bevis på att tack vare Internets tillkomst måste detta definitivt inte var sann.

Skrattar du?

Vissa tolkar detta som en upprörande rolig kommentar.

Skämtet är en nedskärning av hur Internet med alla dess skummande och sprutande inlägg nästintill stiger till nivån för att producera Shakespeare. Det är en skarpt skärande kommentar som lyfter fram att internet förmodligen inte har förhöjd diskurs utan istället förnedrat diskurs. Många antog att Internet skulle vara en välsignelse för intelligent interaktion, vilket möjliggör tankeväckande diskussioner över hela världen. Det verkar som att vi inte nödvändigtvis har bevittnat detta på så stor grund som vi hoppats på.

Naturligtvis skulle vi vara försumliga när vi tar skämtet som ett sant förebud om vad Internet har åstadkommit. Det finns många fantastiska avslöjanden och anmärkningsvärda värden förknippade med Internet. Skämtet är en utsmyckning eller överdrift. Icke desto mindre är poängen väl tagen att vi måste vara uppmärksamma på lömskt innehåll, samtidigt som vi strävar efter att hitta och lyfta samhälleligt inspirerande verk via internetanvändningen. För min bevakning om hur AI både kan hjälpa och ändå i en dubbla användningsområden mode underskred samhällelig diskurs via negativa inlägg på Internet, se min diskussion på länken här.

I dagens kolumn kommer jag att ta upp de betydande skillnaderna mellan generativ AI och den klassiska berättelsen om skrivaporna. Jag ska förklara var jämförelsen misslyckas. Du kommer utan tvekan att få veta mer om typing monkeys theorem, tillsammans med att förstå mer konkret hur generativ AI fungerar. Jag kommer då och då att hänvisa till ChatGPT eftersom det är 600-pundsgorillan av generativ AI (pun intended), men kom ihåg att det finns massor av andra generativa AI-appar och de är generellt baserade på samma övergripande principer.

Under tiden kanske du undrar vad generativ AI egentligen är.

Låt oss först täcka grunderna för generativ AI och sedan kan vi ta en närmare titt på jämförelser av typing monkeys theorem.

In i allt detta kommer en mängd AI-etik och AI-rättsliga överväganden.

Var medveten om att det pågår ansträngningar för att införliva etiska AI-principer i utvecklingen och användningen av AI-appar. En växande kontingent av berörda och dåvarande AI-etiker försöker se till att ansträngningarna att ta fram och införa AI tar hänsyn till en syn på att göra AI For Good och avvärja AI för dåligt. Likaså finns det föreslagna nya AI-lagar som samlas runt som potentiella lösningar för att hindra AI-strävanden från att gå amok på mänskliga rättigheter och liknande. För min pågående och omfattande bevakning av AI-etik och AI-lag, se länken här och länken här, bara för att nämna några.

Utvecklingen och spridningen av etiska AI-föreskrifter eftersträvas för att förhoppningsvis förhindra att samhället hamnar i en myriad av AI-inducerande fällor. För min bevakning av FN:s AI-etiska principer som utformats och stöds av nästan 200 länder via Unescos insatser, se länken här. På liknande sätt undersöks nya AI-lagar för att försöka hålla AI på en jämn köl. En av de senaste tagen består av en uppsättning föreslagna AI Bill of Rights som amerikanska Vita huset nyligen släppte för att identifiera mänskliga rättigheter i en tidsålder av AI, se länken här. Det krävs en by för att hålla AI- och AI-utvecklare på rätt väg och avskräcka målmedvetna eller oavsiktliga hemliga ansträngningar som kan undergrava samhället.

Jag kommer att väva in AI-etik och AI-lagrelaterade överväganden i den här diskussionen.

Grunderna för generativ AI

Den mest kända instansen av generativ AI representeras av en AI-app som heter ChatGPT. ChatGPT dök upp i allmänhetens medvetande redan i november när det släpptes av AI-forskningsföretaget OpenAI. Ända sedan ChatGPT har fått stora rubriker och förvånansvärt överträffat sina tilldelade femton minuter av berömmelse.

Jag antar att du förmodligen har hört talas om ChatGPT eller kanske till och med känner någon som har använt det.

ChatGPT anses vara en generativ AI-applikation eftersom den tar som indata en del text från en användare och sedan genererar eller producerar en produktion som består av en uppsats. AI är en text-till-text-generator, även om jag beskriver AI som en text-till-uppsats-generator eftersom det lättare klargör vad den vanligtvis används till. Du kan använda generativ AI för att komponera långa kompositioner eller så kan du få den att ge ganska korta pittige kommentarer. Allt är på ditt bud.

Allt du behöver göra är att ange en prompt så genererar AI-appen en uppsats åt dig som försöker svara på din prompt. Den komponerade texten kommer att verka som om uppsatsen skrevs av den mänskliga handen och sinnet. Om du skulle skriva in en uppmaning som sa "Berätta om Abraham Lincoln" kommer den generativa AI:n att förse dig med en uppsats om Lincoln. Det finns andra lägen för generativ AI, som text-till-art och text-to-video. Jag kommer här att fokusera på text-till-text-variationen.

Din första tanke kan vara att denna generativa förmåga inte verkar vara en så stor sak när det gäller att producera uppsatser. Du kan enkelt göra en onlinesökning på Internet och lätt hitta massor av uppsatser om president Lincoln. Kickaren i fallet med generativ AI är att den genererade uppsatsen är relativt unik och ger en originalkomposition snarare än en kopia. Om du skulle försöka hitta den AI-producerade uppsatsen på nätet någonstans, skulle du knappast upptäcka den.

Generativ AI är förutbildad och använder sig av en komplex matematisk och beräkningsformulering som har satts upp genom att undersöka mönster i skrivna ord och berättelser över webben. Som ett resultat av att undersöka tusentals och miljontals skriftliga stycken kan AI:n spy ut nya essäer och berättelser som är en sammanblandning av vad som hittades. Genom att lägga till olika probabilistiska funktioner blir den resulterande texten ganska unik i jämförelse med vad som har använts i träningsuppsättningen.

Det finns många farhågor kring generativ AI.

En avgörande nackdel är att uppsatserna som produceras av en generativ baserad AI-app kan ha olika falskheter inbäddade, inklusive uppenbart osanna fakta, fakta som är missvisande framställda och uppenbara fakta som är helt påhittade. Dessa påhittade aspekter kallas ofta för en form av AI hallucinationer, en slagord som jag ogillar men som jag beklagligt verkar få populär dragkraft ändå (för min detaljerade förklaring om varför detta är usel och olämplig terminologi, se min bevakning på länken här).

Ett annat problem är att människor lätt kan ta åt sig äran för en generativ AI-producerad uppsats, trots att de inte har skrivit uppsatsen själva. Du kanske har hört att lärare och skolor är ganska oroade över uppkomsten av generativa AI-appar. Studenter kan potentiellt använda generativ AI för att skriva sina tilldelade uppsatser. Om en elev hävdar att en uppsats skrivits av egen hand, är det liten chans att läraren ska kunna urskilja om den istället förfalskades av generativ AI. För min analys av denna förvirrande aspekt för elever och lärare, se min bevakning på länken här och länken här.

Det har förekommit några galna överdimensionerade påståenden på sociala medier om Generativ AI hävdar att den senaste versionen av AI faktiskt är det kännande AI (nej, de har fel!). De inom AI-etik och AI-lag är särskilt oroliga över denna spirande trend med utsträckta anspråk. Du kan artigt säga att vissa människor överdriver vad dagens AI faktiskt kan göra. De antar att AI har kapacitet som vi ännu inte har kunnat uppnå. Det är olyckligt. Ännu värre, de kan tillåta sig själva och andra att hamna i svåra situationer på grund av ett antagande om att AI kommer att vara kännande eller människoliknande när det gäller att kunna vidta åtgärder.

Antropomorfier inte AI.

Om du gör det kommer du att fångas i en klibbig och hård tillitsfälla av att förvänta dig att AI ska göra saker den inte kan utföra. Med det sagt är det senaste inom generativ AI relativt imponerande för vad det kan göra. Var dock medveten om att det finns betydande begränsningar som du ständigt bör ha i åtanke när du använder en generativ AI-app.

En sista förvarning för nu.

Vad du än ser eller läser i ett generativt AI-svar som verkar för att förmedlas som rent sakliga (datum, platser, personer etc.), se till att förbli skeptisk och var villig att dubbelkolla vad du ser.

Ja, datum kan hittas på, platser kan hittas, och element som vi vanligtvis förväntar oss att vara ovanliga är alla föremål för misstankar. Tro inte på vad du läser och håll ett skeptiskt öga när du undersöker generativa AI-uppsatser eller resultat. Om en generativ AI-app berättar att Abraham Lincoln flög runt landet i sitt privatjet, skulle du utan tvekan veta att detta är malarky. Tyvärr kanske vissa människor inte inser att jetplan inte fanns på hans tid, eller så kanske de vet men misslyckas med att lägga märke till att uppsatsen gör detta fräcka och skandalöst falska påstående.

En stark dos av hälsosam skepsis och ett ihållande tankesätt av misstro kommer att vara din bästa tillgång när du använder generativ AI.

Vi är redo att gå in i nästa steg av denna förklaring.

Vad händer med dessa aporna som skriver

Nu när du har en aning om vad generativ AI är, kan vi utforska jämförelsen med skrivaporna. På sätt och vis kommer jag att steg för steg ta isär aptypsättningssatsen. Jag gör det för att belysa grunderna. Vi kan sedan använda de avslöjade elementen för att göra en jämförelse med generativ AI.

Typing monkeys-satsen eller hypotesen innehåller en kärnuppsättning av element:

a) Vem eller vad. Den identifierade varelsen eller skådespelaren som skriver
b) Antal och livslängd. Hur många av dem det finns och deras livslängdsstatus
c) Utmatade symboler. Framställning av bokstäver och kända symboler via en rudimentär anordning
d) Tid. Tidslängden för att utföra uppgiften
e) Intelligens. Vilken kunnighet ger de till utförandet av uppgiften
f) Målinriktad produktion. Den riktade produktionen av det vi vill att de ska producera

Låt oss först undersöka de skrivande aporna.

Ni kanske minns att jag nämnde vid inledningen av denna diskussion att vi skulle föreställa oss att en apa skrev på en skrivmaskin. Jag hänvisade till de grundläggande begreppen som innebär att bara en apa gör det. Vi kan justera den aspekten.

Här är sätt som situationen ofta skildras på:

En ensam apa av en vardaglig jordisk tillvaro
Tusen sådana apor
En miljon sådana apor
Ett oändligt antal sådana apor
En ensam apa som är odödlig
Något antal odödliga apor
Annat

Lägg märke till att i stället för att bara ha en apa, kan vi omarbeta tankeexperimentet och ha en mängd apor som förmodligen arbetar samtidigt. Dessutom är en annan justerbar aspekt om aporna är dödliga eller odödliga. Jag ska fördjupa mig i det här ett tag.

Vi måste också inkludera tidsfaktorn som en avgörande ingrediens.

Vanligtvis är tidsfaktorn en av dessa två överväganden:

Begränsad tidsperiod
Oändlig tid

Ett annat något outtalat underliggande element är att apor används i det här fallet eftersom vi anser dem vara relativt otänksamma. De vet inte hur de ska läsa eller skriva. De kan inte visa intelligens på samma sätt som vi associerar intelligens med mänskliga kapaciteter.

Detta är något förolämpande när du tänker lite på det. Jag tror att vi alla rimligen kan vara överens om att apor är otroligt smarta, åtminstone för vad de kan åstadkomma inom sina tankegränser. Jag skulle våga påstå att vi tillskriver apor större tankeförmåga än vi gör till många andra djur. Det finns massor av flitiga forskningsexperiment som har gjorts för att visa hur mentalt skarpa apor kan vara.

I vilket fall som helst, för metaforens syften, är antagandet att apor inte kan tro att de av sig själva skulle kunna föreställa sig Shakespeares verk. Medan den klassiska filmen Apes Planet försökte varna oss för att detta kan vara ett felaktigt antagande, vi går i alla fall med det i dagens värld.

Om vi ersatte aporna med användningen av myror, försvinner metaforen något. Vi uppfattar inte myror som att de kan skriva på skrivmaskiner. Vi skulle kunna försöka ersätta användningen av hundar eller katter eftersom de nästan kunde skriva på en skrivmaskin, men i slutändan är användningen av apor bäst eftersom de kan skriva på ett sätt som påminner om att människor skriver. De har lämpliga lemmar och kroppsstruktur för att utföra uppgiften. De ses också mentalt som kapabla att skriva, även om vi antar att de inte vet vad de skriver.

Dessutom har det gjorts många forskningsexperiment som involverar apor och deras igenkänning av symboler. Inkluderade i dessa olika studier har varit inställningar som fick aporna att skriva på skrivmaskiner eller liknande enheter. Om det görs på rätt sätt kan detta vara meningsfullt i jakten på användbara insikter om intelligens och uppkomsten av intelligenta beteenden.

Tyvärr är forskningen som innebär att skriva på skrivmaskiner ibland inte gjord på en särskilt seriös anda. Ibland har det använt tillvägagångssätt inte varit något annat än en svag blink-blink nick till den berömda eller ökända apskrivsatsen, snarare än att bona fide grundläggande forskningsaktiviteter. Jag tycker inte att sådana upptåg är roliga eller korrekta. Uppfattningen har varit att apor fysiskt fick skrivmaskiner och uppmuntrades att skriva baserat på deras infall eller ibland för godsaker som mat. Om inte detta görs på ett bona fide robust experimentellt sätt är det inget annat än en fasad.

En liten twist som är mer behaglig består av att sätta upp datorbaserade simuleringar som utger sig för att utföra vad apor kan göra under dessa omständigheter. Datorn används för att simulera dessa aspekter. Inga egentliga apor är inblandade. Vissa har till och med gått så långt som att göra lite sk medborgarvetenskap genom att dela ut simuleringen till alla som är beredda att låta sin bärbara dator eller dator användas för dessa ansträngningar. Fall inte för falska bedrägerier som lömskt hävdar att de gör detta för vetenskapen när verkligheten är att de försöker infektera din dator med ett datavirus. Var försiktig.

Åter till saken.

En aspekt som också är avgörande för omständigheten är att skrivmaskiner används i denna typapa hypotetiska.

Varför skrivmaskiner?

För det är så vi kan få fram bokstäver, som sedan kan formas till ord, som sedan kan formas till berättelser. Samma eller liknande föreställning om att producera massor av bokstäver kräver inte nödvändigtvis att vi skriver dem. Det finns faktiskt varianter av denna metafor som går tillbaka till Aristoteles dagar och det fanns alltså inga skrivmaskiner då.

Vi skulle kunna ändra metaforen och hänvisa till moderna tangentbord och datorer. Vi kan säga att aporna slår iväg på en bärbar dator eller kanske till och med på en smartphone. Det fina med att hänvisa till skrivmaskiner är att vi associerar skrivmaskiner som icke-datoriserade och därför hjälper de inte till själva skrivprocessen. Detta är avgörande för det inblandade konstverket.

Slutligen presenteras vi vanligtvis för aspekten att Shakespeares verk ska produceras. Vi skulle lätt kunna ersätta Shakespeare med vilken annan välkänd författare som helst. Det kan vara så att vi vill veta om aporna kan producera hela verk av Charles Dickens, Jane Austen, Ernest Hemingway, och så vidare. Det spelar ingen större roll. Kärnan är att skrivandet måste vara något som vi alla känner till och som vi erkänner att det är enastående skrivande.

Vi kan lätt ersätta alla skrifter som vi vill sätta som mål.

Bekvämligheten med att hänvisa till Shakespeare är att hans verk tolkas som den översta eller höjdpunkten av mänskligt skrivande. Vi kunde istället hitta en uppsats skriven av en förstaklassare och använda den som mål. Tro det eller ej, samma föreskrifter gäller fortfarande. Folk skulle förmodligen inte tycka att det var inspirerande att aporna kunde återge ett barns skrift. För att hålla saker engagerande måste skrivandet vara av högsta kvalitet.

En variant av den riktade produktionen skulle vara att referera till ett specifikt verk av Shakespeare snarare än hela hans verk. Som du snart kommer att se gör det liten skillnad för sakens kärna. Jag skulle gissa att många brukar nämna Hamlet som en del av apskrivsatsen, kanske eftersom detta råkar vara hans längsta spel, som uppgår till rapporterade 29,551 130,000 ord i storlek (sammansatt av cirka XNUMX XNUMX bokstäver eller så).

Alla hans pjäser skulle räcka.

Hela upplägget beror på de olika sannolikhetslagarna. Du kanske har lärt dig om nyanserna av sannolikheter i dessa ansträngande klasser om statistik och matematik som du tog i skolan.

Låt oss använda ordet "Hamlet" för att se vad som krävs för att slumpmässigt producera de sex bokstäverna i den specifika sekvensen av Hamlet.

Det enklaste sättet att aritmetiskt beräkna detta består i att anta att vi har ett enkelt runda tal av antalet tillgängliga nycklar på en skrivmaskin. Anta att vi har en skrivmaskin som har 50 distinkta och lika användbara nycklar. Varje tangent representerar en speciell symbol, såsom symbolerna i det vanliga engelska alfabetet. Antag att nycklarna är ordnade i slumpmässig ordning och att vi inte har riggat situationen genom att placera Hamlet separata nycklar i ett speciellt arrangemang för att få till att skriva de specifika nycklarna mer än någon annan tangent.

Varje tangent trycks ned helt oberoende av vilken tangent som har tryckts ned innan den. Därför, av de 50 tangenterna, anses chansen att någon tangent trycks in som 1 av 50 chanser. Detsamma gäller för alla nycklar och under hela skrivinsatsen. Beräkningen för en enstaka tangent som trycks ner är en chans på 1 av 50, eller det är 1/50.

Chansen att skriva bokstaven "H" är då 1/50, och chansen att skriva bokstaven "a" är 1/50, och chansen att skriva bokstaven "m" är 1/50, och så vidare.

Detta är:

Sannolikheten för att "H" ska skrivas är 1/50.
Sannolikheten för att "a" ska skrivas är 1/50.
Sannolikheten att "m" skrivs är 1/50.
Sannolikheten för att "l" ska skrivas är 1/50.
Sannolikheten för att "e" ska skrivas är 1/50.
Sannolikheten att "t" skrivs är 1/50.

En standardregel eller sannolikhetslag säger att om två eller flera händelser är helt statistiskt oberoende av varandra, kan vi beräkna chanserna att båda inträffar genom att helt enkelt multiplicera deras sannolikheter med varandra respektive. Vi kan göra det angående dessa sex bokstäver.

Vi har denna beräkning: "H" (1/50) x "a" (1/50) x "m" (1/50) x "l" (1/50) x "e" (1/50) x "t" (1/50)

Det vill säga: (1/50) x (1/50) x (1/50) x (1/50) x (1/50) x (1/50)

Det lilla talet kommer till 1 / 15,625,000,000 XNUMX XNUMX XNUMX.

Chansen att skriva det sexbokstaviga ordet "Hamlet" är då ungefär en på 15 miljarder, allt annat lika.

Det är skrämmande odds. Och detta är bara för att skriva ett visst ord på sex bokstäver. Försök att tillämpa samma beräkning på de 29,551 XNUMX orden i hela Hamlet-spelet. Om du bestämmer dig för att beräkna detta, inse också att mellanrummen mellan orden måste tas med i beräkningen.

Ju längre den målinriktade produktionen är, desto större är chansen att vi kan generera dessa exakta uppsättningar av bokstäver och ord. Oddsen blir mindre och mindre. Chansen är så liten att vi nästan skulle slänga in handduken och säga att det verkar som att det "aldrig" skulle hända (var försiktig när du använder ordet "aldrig" eftersom det är ett formidabelt påstående).

Ta till exempel en dödlig apa.

Enligt olika ansedda onlineindikationer är den vanliga livslängden för en apa i det vilda omkring 40 år eller så. Om du vill diskutera den livslängden kan vi bara använda siffran 100 och fortsätta med en ganska osannolik övre gräns. En apa som skriver på en skrivmaskin oavbrutet i säg hundra år, inte inklusive tid att vila, tid att äta eller liknande, och antar att detta är allt apan gjorde från födelseögonblicket till sitt sista andetag, vann fortfarande Det hjälper inte att höja oddsen att skriva Hamlet allt sagt (apan skulle trycka på cirka 100 3,155,673,600 XNUMX XNUMX tangenter om han skrev en nyckel varje sekund nonstop under XNUMX år).

Vi kan rimligen säga att det är oerhört osannolikt att en dödlig apa skulle kunna sluta med att skriva av en slump pjäsen Hamlet.

Du kan öka antalet dödliga apor, men det gör lite för att vika upp de överväldigande oddsen mot att skriva Hamlet. Vissa hävdar att det finns tusen apor. Ett annat tillvägagångssätt säger att det finns en miljon apor. Om vi antar att de alla levde till 100 år och var och en skrev en slumpmässig nyckel på sin egen respektive skrivmaskin i en oavbruten takt av en tangent per sekund, gör detta fortfarande inte en statistiskt anmärkningsvärd buckla när det gäller att skriva ut pjäsen Hamlet.

Begrunda allt detta.

Något tungan i ögat, var exakt skulle du hysa en miljon apor för den här uppgiften? Föreställ dig också att skrivmaskinerna måste hålla i hundra år av kontinuerlig användning (kan du hitta en miljon fungerande skrivmaskiner som ingen vill ha och är villig att donera till detta dåvarande projekt?). Verkar som att du skulle behöva ha många extra skrivmaskiner klara omedelbart. Och så vidare. Logistiken är svindlande.

Allt detta verkar då dystert att de dödliga aporna sannolikt inte kommer att föröka sig Hamlet.

Men anta att vi gör dem odödliga. Ja, vi ger dem en trolldryck som låter dem leva för evigt. Vi behöver inte ens mer än en odödlig apa. Bara en duger. Det kanske gör metaforen mer spännande att hävda att vi har tusen eller en miljon odödliga apor.

Om vi har en apa som kan leva för evigt, kan vi föreslå att detta är en oändlig apa. Den kan under oändlig tid dunka iväg på skrivmaskinens tangenter. Den apan kommer bara att fortsätta och gå. Följaktligen, även om chanserna att skriva pjäsen Hamlet var extremt små, är aspekten som apan oändligt kommer att fortsätta att försöka tyda på att pjäsen någon gång Hamlet kommer nästan säkert att ha skrivits ut.

Tumregeln är så att säga att ett händelseförlopp som har en chans att hända som inte är lika med noll, om än utomordentligt låga i chanser, skulle vi rimligtvis hålla med om kommer nästan att inträffa om vi har oändlig tid att spela med, allt annat lika. De inom matematik- och statistikfälten är benägna att beskriva samma övervägande genom att använda strängar eller till och med binära tal på 0 och 1. Om du har en ändlig uppsättning symboler, och det finns en oändlig sträng av dem, varvid varje symbol har har valts likformigt slumpmässigt, det finns en ändlig sträng där som du nästan säkert skulle kunna förutse skulle inträffa.

Det finns en stor hake med allt detta.

Vi lever i en värld av ändlig. Ingen av oss verkar ha oändlig tid tillgänglig. För er som säger att ni gör det, beröm. Min hatt går av för dig.

Om du påtvingar de skrivande aporna den ändliga världen, kommer du att hitta dig själv att träffa en ganska hård vägg. Analyser av typing monkey theoremet kommer i stort sett att ge sannolikheten för att pjäsen ska uppnås Hamlet är tillräckligt nära noll i ändlig tid för att det inte är troligt att det för någon motiverad operativ grund helt enkelt kommer att hända. Den vanliga bilden är att om du använde lika många apor som det finns atomer i det kända universum, och de fortsatte att skriva i många ziljoner gånger av universums tidsspann, så tittar du fortfarande på ofattbart små, outgrundliga odds att se spela Hamlet.

Typing monkey-teoremet är ganska tjat och rankas ofta som bland de sju bästa tankeexperimenten i vår tid. Du är välkommen att göra en extra granskning av satsen eftersom det finns massor av analyser tillgängliga online. Det är ett levande och roligt sätt att få ett grepp om sannolikhet och statistik. Istället för att uteslutande ta itu med torra siffror får du föreställa dig de där roliga, rullande aporna och alla de där gammaldags klickiga skrivmaskinerna.

Vi är nu redo att föra in generativ AI i apornas och skrivmaskinernas gåta.

Generativ AI blir irriterad av maskinskrivande aporna

Premissen som vi kommer att undersöka noggrant är det omtvistade påståendet att generativ AI som ChatGPT inte skiljer sig från skrivaporna. Det sägs att om ChatGPT eller någon generativ AI kan producera Hamlet eller liknande kända verk, detta är helt och hållet ett slumpmässigt resultat som med sannolikhet har uppstått på samma sätt som apor kan komma fram till att skriva upp denna länge uppskattade och djupt vördade Shakespeare-pjäs.

Förlåt, det är felaktigt tänkande i detta tungt vägande ämne.

Låt oss se varför.

Låt oss först granska och utöka vad generativ AI består av.

Minns att jag tidigare antytt att generativ AI är programvara som innebär användning av algoritmer för att dataträna på texten som finns på Internet och via andra liknande källor. En stor mängd mönstermatchning har matematiskt och beräkningsmässigt identifierat mönster bland de miljoner och åter miljoner berättelser och essäer som vi människor har skrivit.

Orden har ingen speciell betydelse för sig själva. Se dem som föremål. Inom datorn representeras de som siffror som vi betecknar som tokens. De används som ett bekvämt sätt att associera andra ord eller tokens med varandra, vilket gör det i en djupgående och intrikat statistisk webbliknande struktur.

Vissa inom AI-området är oroliga för att detta inte är något annat än vad som kallas en stokastisk papegoja.

Du förstår, snarare än att försöka koppla någon sken av "mening" till orden, istället är detta bara en omfattande indexering av ord som verkar användas runt eller bredvid andra ord. Däremot antar vi att människor kan "förstå" ordens natur och betydelse.

Tänk på din dagliga tillgång till närvaron av ord-till-ord-korrespondenser. På samma sätt som när du använder en vanlig automatisk kompletteringsfunktion i ditt ordbehandlingsprogram, beräknar datorn matematiskt att ett visst ord vanligtvis följs av något annat särskilt ord, som i sin tur följs av ett annat särskilt ord, och så vidare. Därför kan du ofta börja skriva en mening och ordbehandlingspaketet kommer att visa dig en gissning om vad de ytterligare orden i meningen kommer att vara.

Det är en gissning eftersom dessa statistiskt sett kan vara de vanliga orden i meningen, men du kanske har något annat i åtanke att säga, så förutsägelsen är borta från det du ville skriva. Det finns förmodligen tillräckligt med andra exempel på meningar som använder de ord som algoritmen kan uppskatta att du sannolikt vill avsluta meningen med de förutsagda orden. Detta är inte järnklädd. Dessutom finns det ingen "mening" förknippad med denna beräkningsgissning.

Vissa AI-forskare hävdar att för att uppnå sann AI, ofta myntad som Artificiell allmän intelligens (AGI), vi kommer att behöva på något sätt kodifiera in i datorer en ännu upptäckt eller uppfunnen form av "förståelse" (se min kolumn för många inlägg om AGI och jakten på AGI). De oroar sig för att manin över generativ AI inte är mer än en återvändsgränd. Vi kommer att fortsätta att försöka driva på den generativa AI:n genom att skala upp storleken på beräkningsnätverken och lägga mer och mer datorkraft på saken. Allt detta kommer att vara till ingen nytta när det gäller att komma till AGI, hävdar de.

En extra betänklighet är att kanske denna strävan efter en förmodad återvändsgränd distraherar oss från det korrekta eller korrekta tillvägagångssättet. Vi kommer att lägga enorm energi och ansträngning på ett missriktat sluttillstånd. Visst, generativ AI kan vara fantastisk när det gäller mimiktricket, men det kan vara så att detta har lite eller ingenting att göra med AGI. Vi kan lura oss själva att slösa bort värdefullt fokus. Vi kan försena eller kanske till och med misslyckas med att någonsin komma till AGI på grund av denna lockande distraktion.

Hur som helst, i syfte att skriva aporna, låt oss gå tillbaka till den övergripande fracas.

Vi måste överväga dessa anmärkningsvärda faktorer:

1) Sentient kontra inte sentient
2) Tänka kontra inte "tänka"
3) Begränsade tankeprocesser kontra datorbaserade algoritmer och mönstermatchning
4) Otränad eller oförmögen att träna kontra beräkningsdata tränad

Låt oss ta itu med var och en av dessa faktorer.

Sentient kontra inte Sentient

Jag tror att vi kan erkänna att apor är kännande varelser. Oavsett hur smarta eller bristande smarta du kanske vill hävda att de är; de är onekligen kännande. Det är ett faktum. Ingen kan rimligen hävda något annat.

Dagens artificiella intelligens är inte kännande. Period, punkt.

Dessutom hävdar jag att vi inte är i närheten av AI-känsla. Andra kanske inte håller med. Men vem som helst med rimligt lugn skulle hålla med om att dagens AI inte är kännande. För min analys av den avgrundsfelaktiga märkningen av AI-känsla av Googles ingenjör förra året, se min diskussion på länken här.

Så, en avgörande skillnad mellan de ivrigt skrivande aporna och dagens generativa AI är att aporna är kännande varelser medan AI inte är det. Ovanpå detta är det ofta en hal backe att börja jämföra dagens AI med något vettigt. Det finns en tendens att antropomorfisera AI. Jag uppmanar strängt att för att försöka förhindra att denna lätta mentala fälla drabbar oss, undviker vi alla jämförelser mellan AI och kännande varelser såvida vi inte är överbord och tydligt identifierar och avgränsar den skillnaden.

Få om några gör den avgränsningen när man jämför typapor och generativ AI. De antar att du antingen redan kommer att inse att det finns den här skillnaden, eller så bryr de sig inte om att det finns någon skillnad, eller så har de inte tänkt på det osv.

Tänka kontra inte "tänka"

Jag skulle påstå att apor kan tänka. De är tänkande varelser. Vi kan lätt diskutera hur mycket de kan tänka. Du måste nästan säkert hålla med om att apor kan tänka.

Dagens AI av alla slag, inklusive generativ AI, stiger inte till vad jag anser vara mänsklig kapacitet tänka.

Jag ska upprepa min nyssnämnda refräng relaterad till sentience. Det är missvisande och jag hävdar fel att gå runt och säga att dagens AI kan tänka. Tyvärr gör människor detta hela tiden, inklusive AI-forskare och AI-utvecklare. Jag anser att detta återigen är olyckligt och olämpligt antropomorfiserande. Du ger ett sken av kapacitet eller förmågor till AI som inte finns där och som kommer att felinformera samhället i stort i frågan. Sluta göra det här.

Generativ AI är en komplex webbliknande struktur av matematiska och beräkningsegenskaper. Det är beundransvärt. Det är jävla smock av vad detta åstadkommer. Jag tror inte att någon rimlig tolkning av "tänkande" som vi uppfattar det, i all sin glans, anstår denna AI.

Begränsade tankeprocesser kontra datorbaserade algoritmer och mönstermatchning

Apor är begränsade i sina tankeprocesser.

Du kanske tycker att det är av intresse att det finns många jämförelser i den vetenskapliga litteraturen av aphjärnor kontra människors hjärnor. Tänk till exempel på denna forskningsstudie: ”Människans hjärna är ungefär tre gånger så stor som hjärnan hos vår närmaste levande släkting, schimpansen. Dessutom innehåller en del av hjärnan som kallas hjärnbarken – som spelar en nyckelroll i minne, uppmärksamhet, medvetenhet och tanke – dubbelt så många celler hos människor som samma region hos schimpanser. Nätverk av hjärnceller i hjärnbarken beter sig också olika hos de två arterna” (i en artikel publicerad i Elife, september 2016, med titeln "Skillnader och likheter mellan mänskliga och schimpanser neurala stamfader under utveckling av hjärnbarken").

Vi inser alla att apor inte är i paritet med mänskligt tänkande. Dessa underbara varelser kan vara förtjusande och göra en överraskande mängd tänkande, ingen tvekan om det. De stiger helt enkelt inte till nivåerna av mänskligt tänkande. Jag kommer att ångra att jag sa detta, när aporna väl tar över mänskligheten.

Jag uttryckte redan för ett ögonblick sedan att dagens AI inte tycker. Jag betonade att det AI gör inte bör märkas som "tänkande" eftersom det är vilseledande och förvirrande.

Det är här den generativa AI:n överglänser aporna, när det gäller att använda datorbearbetning baserad på mänskligt framtagna algoritmer och baserad på mänskligt producerade skrifter. Det finns liten eller ingen chans att den tänkande apan skulle kunna absorbera och mönstermatcha den stora användningen av skrivna symboler som människor har kommit på. Apor har inte den typen av tankeförmåga.

Jag tvekar att föreslå en sådan jämförelse med tanke på mina andra uttryckta betänkligheter. Men jag anger tydligt vad antagandena är och hur man korrekt och lämpligt genomför denna analys.

Otränad eller oförmögen att träna kontra beräkningsdatatränad

I likhet med vad jag nyss sa, kommer du inte att kunna träna en tänkande apa på den enorma användningen av skrivna symboler för mänskligheten. Du kan göra detta på en extremt begränsad basis, och studier har visat att apor till synes kan tänka på skrivna symboler. Detta är mycket mindre än att kunna memorera och upprepa omfattande mönster av ord, meningar och hela berättelser.

Generativ AI är en datorbaserad statistisk mimik som kan datatränas beräkningsmässigt. Om vi fortsätter att mata in mer data, såsom ytterligare texter som vi samlar in eller hittar, är antagandet och förhoppningen att mönstren som hittas kommer att bli djupare och djupare. Dessutom kommer användning av snabbare och snabbare datorchips och bearbetning också att öka denna mönstermatchning och svarskapacitet.

Tittar På Bottom-Line

Om generativ AI skulle producera pjäsen Hamlet, vad skulle det betyda?

Först måste vi överväga om historien eller pjäsen matades in i den generativa AI:n vid tidpunkten för dataträningen. Om så är fallet, finns det inget särskilt anmärkningsvärt eller anmärkningsvärt med den generativa AI som senare sprutar tillbaka samma ord som den tidigare skannat.

En AI-forskare kan vara lite bestört eftersom mönstermatchningen antagligen gick överbord, efter att i huvudsak ha memorerat orden. Vi brukar hänvisa till detta inom maskininlärningsområdet som överanpassning till de uppgifter som användes under träningen. Vanligtvis vill du inte att de exakta orden ska mönstras, du vill att ett generaliserat mönster ska bildas.

Jag har diskuterat i mina kolumner oron över att vi ibland kan se integritetsintrång och avslöjande av konfidentiell data i fall där generativ AI gjorde en exakt matchning snarare än en generaliserad matchning av matad data, se min bevakning på länken här.

För det andra, anta att pjäsen Hamlet matades inte in i den generativa AI. Nästa övervägande då skulle vara om något av Shakespeares verk hade skannats under dataträning.

Om så är fallet är det tänkbart att pjäsen Hamlet skulle kunna produceras utifrån de mönster som förknippas med Shakespeares andra verk, särskilt om det finns andra referenser eller omnämnanden av Hamlet någon annanstans i dataträningsuppsättningen. Alla dessa skulle potentiellt kunna användas av mönstermatchningen för att bilda en stil Hamlet. Visserligen att kunna generera Hamlet ord för ord skulle vara en utsträckt räckvidd, ett avsevärt ögonöppnande och överraskande resultat.

För det tredje, om generativ AI producerade hela Hamlet och hade aldrig i förväg matats med något som helst om Shakespeare, ja, det skulle vara häpnadsväckande. Det skulle dock inte nödvändigtvis vara detsamma som den rent slumpmässiga karaktären av att hacka iväg på nycklar på en skrivmaskin. Vi måste inse att Shakespeares ord är ord, så de är en del av helheten av formuleringar som finns i det stora utbudet av textberättelser och berättelser som matas in i den generativa AI. Du förbättrar oddsen genom att börja med ordens hörnsten och associationerna mellan orden. Ändå är chansen ganska liten att något liknande händer.

Slutsats

När det kommer till att producera ord och essäer, blir generativ AI gangbuster eftersom den är baserad på mänskligt utarbetade ord och essäer (naturligtvis måste vi ta itu med felen, falskheterna och AI-hallucinationerna). AI:n "förstår" inte orden som sänds ut. Det finns ingen där, där.

Du behöver inte vänta en oändlig tid för att se flytande uppsatser och fullt läsbara resultat. De händer dagligen och med en knapptryckning. De är inte röriga, åtminstone inte för det mesta, på grund av att de är framtagna av mönster baserat på vad människor har skrivit. Mönstermatchningen bör finjusteras ytterligare och så småningom tillräckligt bra för att banta ner mycket av de udda formuleringarna, se min förklaring om hur detta kan fungera, visad på länken här. Denna inställning kommer ständigt att förfinas, och vi kommer alla att bli mer och mer förtjusta i vad generativ AI producerar.

Orden är inte helt slumpmässigt valda. Orden är inte rent slumpmässigt stavade. Det finns några probabilistiska aspekter som när man genererar den utskrivna uppsatsen om vilka ord man ska välja. Men detta är fortfarande baserat på mänskliga skrifter och därmed inte antagligen rent slumpmässigt. Det är baserat på ett slumpmässigt val bland en handfull eller ett antal formuleringsalternativ som annars alla statistiskt skulle kunna vara möjliga att vara nästa valda ord eller uppsättning ord.

Var passar aporna in i detta?

Dessa typapor är säkert attraktiva som en grund för jämförelse med generativ AI. Apor som producerar Hamlet kontra generativ AI-producerande Hamlet. Det är en spännande tävling. Man kan säga att det egentligen inte är någon tävling alls. Den AI som skapades av mänskligheten och är baserad på mänsklighetens skrifter har en orättvis fördel i det avseendet.

På tal om att skriva apor, i ett avsnitt av The Simpsons, Mr. Burns bestämmer sig för att anlita apor för att gå vidare och skriva iväg på skrivmaskiner som en del av kontorets skrivapool. Han är den sortens jävla chef som med glädje skulle dra till att använda apor i sitt nödvändiga kontorsarbete framför användningen av människor om han kunde göra det.

Fans av programmet kanske kommer ihåg vad som hände.

Mr Burns tar tag i en av de maskinskrivna sidorna och läser med ivrig förväntan vad apan har skrivit. Han läser sidan högt och säger ”Det var den bästa tiden, det var den blurst of times” (dvs. det finns ett ord som är trassligt, ”blurst” eller något som låter så). Han blir helt rasande och helt besviken på de "dumma aporna" över vad de kan producera.

Vi vet att om en apa skrev den delen av Charles Dickens "A Tale Of Two Cities" borde vi vara extatiska och hoppa av glädje. Inte så för Mr. Burns.

Som en sista kommentar till denna diskussion kanske vi borde åberopa hela meningen som Charles Dickens skrev: "Det var den bästa av tider, det var den värsta av tider, det var visdomens tid, det var dårskapens tid, det var trons epok, det var otrohetens epok, det var ljusets tid, det var mörkrets tid, det var hoppets vår, det var förtvivlans vinter.”

Vi är inte riktigt säkra på vart vi är på väg med AI. Vissa säger att det kommer att bli det bästa sedan skivat bröd. Andra varnar för att den AI vi gör kommer att utgöra en existentiell risk för mänsklighetens överlevnad. Det är verkligen antingen den bästa av tider eller den sämsta av tider.

Bli inte förvånad över att se generativ AI som producerar just dessa ord. Bli förvånad om du råkar se apor i en djurpark som kanske skriver på skrivmaskiner och lyckas skriva samma insiktsfulla ord.

Vänligen meddela mig om du ser det hända.

Jag är beredd att vänta länge på att detta ska inträffa, men förmodligen inte i oändlighet.

Källa: https://www.forbes.com/sites/lanceeliot/2023/03/05/generative-ai-chatgpt-versus-those-infinite-typing-monkeys-no-contest-says-ai-ethics-and- ai-lag/