ChatGPT V4 överträffar baren, SATs och kan identifiera exploateringar i ETH-kontrakt

GPT-4, den senaste versionen av Artificial Intelligence (AI) chatbot, ChatGPT, kan klara gymnasietester och juristexamen med poäng i 90:e percentilen och har nya bearbetningsmöjligheter som inte var möjliga med den tidigare versionen.

Siffrorna från GPT-4:s testresultat delades den 14 mars av dess skapare OpenAI och avslöjar att den också kan konvertera bild-, ljud- och videoingångar till text förutom att hantera "mycket mer nyanserade instruktioner" mer kreativt och tillförlitligt.

"Den klarar ett simulerat barprov med en poäng runt de 10 % av testtagarna", tillade OpenAI. "Däremot var GPT-3.5-poängen runt de lägsta 10 %."

Siffrorna visar att GPT-4 uppnådde en poäng på 163 i den 88:e percentilen på LSAT-provet - testet som collegestudenter måste klara i USA för att bli antagna till juristutbildningen.

*Provresultat av GPT-4 och GPT-3.5 på en rad senaste amerikanska prov. Källa:* *OpenAI*

GPT4:s poäng skulle sätta den i en bra position för att bli antagen till en topp 20-juridikskola och är bara några få poäng från de rapporterade poängen som krävs för acceptans till prestigefyllda skolor som Harvard, Stanford, Princeton eller Yale.

Den tidigare versionen av ChatGPT fick bara 149 poäng på LSAT:s och placerade den bland de nedersta 40 %.

GPT-4 fick också 298 av 400 poäng i Uniform Bar Exam – ett test som genomförts av nyligen utexaminerade juridikstudenter som tillåter dem att praktisera som advokat i vilken amerikansk jurisdiktion som helst.

*UBE-poäng behövde antas för att utöva juridik i varje amerikansk jurisdiktion. Källa:* *Nationell konferens för advokatsamfund*

Den gamla versionen av ChatGPT kämpade i det här testet och slutade på de 10 % lägre med en poäng på 213 av 400.

När det gäller SAT Evidence-Based Reading & Writing och SAT Math-prov som tagits av amerikanska gymnasieelever för att mäta deras collegeberedskap, fick GPT-4 poäng i 93:e respektive 89:e percentilen.

GPT-4 utmärkte sig också i de "hårda" vetenskaperna, med långt över genomsnittliga percentilpoäng i AP Biology (85-100%), Kemi (71-88%) och Fysik 2 (66-84%).

*Provresultat för GPT-4 och GPT-3.5 på en rad senaste amerikanska prov.* *Källa: OpenAI.*

Men dess AP Calculus-poäng var ganska genomsnittlig, rankad i 43:e till 59:e percentilen.

Ett annat område där GPT-4 saknades var i tentorna i engelska litteraturen, som publicerade poäng i den 8:e till 44:e percentilen över två separata test.

OpenAI sa att GPT-4 och GPT-3.5 tog dessa test från övningsproven 2022-2023 och att "ingen specifik utbildning" togs av språkbearbetningsverktygen:

"Vi gjorde ingen specifik utbildning för de här proven. En minoritet av problemen i proven sågs av modellen under utbildningen, men vi anser att resultaten är representativa.”

Resultaten väckte rädsla även i Twitter-gemenskapen.

Relaterat: Hur kommer ChatGPT att påverka Web3-utrymmet? Branschen svarar

Nick Almond, grundaren av FactoryDAO berättade hans 14,300 14 Twitter-följare den 4 mars att GPTXNUMX kommer att "skrämma människor" och att det kommer att "kollapsa" det globala utbildningssystemet.

Bedömningsteori var en stor del av mitt liv under flera år. Jag tjatade om att den här dagen skulle komma för många år sedan. Jag lät bokstavligen som invånarens vev på den tiden.
Men... egentligen betyder detta att allt annat än övervakningsbedömning är över från och med nu.
— drnick ️² (@DrNickA) Mars 14, 2023

Tidigare Coinbase-direktör, Conor Grogan, sa att han infogade ett live Ethereum smart kontrakt i GPT-4 och pekade omedelbart på flera "säkerhetssårbarheter" och beskrev hur koden kan utnyttjas:

Jag dumpade ett live Ethereum-kontrakt i GPT-4.
På ett ögonblick lyfte den fram ett antal säkerhetsbrister och pekade ut ytor där kontraktet kunde utnyttjas. Det verifierade sedan ett specifikt sätt jag kunde utnyttja kontraktet pic.twitter.com/its5puakUW
— Conor (@jconorrogan) Mars 14, 2023

Tidigare smarta kontraktsrevisioner på ChatGPT fann att dess första version också kunde upptäcka kodbuggar i rimlig grad.

Rowan Cheung, grundaren av AI-nyhetsbrevet "The Rundown" delade en video av GPT som transkriberar en handritad falsk webbplats på ett papper till kod.

Jag såg just GPT-4 förvandla en handritad skiss till en funktionell webbplats.
Det här är galet. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) Mars 14, 2023