En titt på den nya Al Generative Art

Al Generativ konst är en typ av konst, i de flesta fall visuell, som bygger på samarbete mellan en människa och ett autonomt system. Ett "autonomt system" definieras som ett Artificiell intelligens programvara, algoritm eller modell som kan utföra komplexa operationer utan behov av programmeringsingripande.

Från de bisarra sammanställningarna av bilder skapade av Dall-E Mini till NFT marknaden kommer bilder som genereras av AI-algoritmer allt mer in i den vanliga fantasin. Faktum är att två viktiga projekt i ämnet som förtjänar att analyseras är: midjourney och DALL-E2.

Nyheten har förstås också tagit sig till Twitter. Bland annat kommenterar Charles Hoskinson, som skrev:

AI genererade konst. Jag kunde göra den här bilden på bara några minuter. Jag kan inte föreställa mig hur anmärkningsvärd denna teknik kommer att vara om 3 år pic.twitter.com/jOToCZj7ki
- Charles Hoskinson (@IOHK_Charles) Februari 1, 2023

Al Generativ konst: tidiga experiment och funktioner

Efter att ha förstått vad generativ konst är, är det viktigt att betona en av dess grundprinciper: slumpmässighet. Vilket är en grundläggande egenskap hos generativ konst.

Beroende på typen av programvara kan det autonoma systemet faktiskt bearbeta resultat som alltid är olika och unika varje gång genereringskommandot körs, eller så kan det returnera ett varierande antal resultat som svar på användarinmatning.

De första experimenten inom Generativ konst går tillbaka till 1960-talet med experimenten av Harold Cohen och hans Aaron program. Cohen använde först fristående programvara för att skapa abstrakta konstverk inspirerade av popkonsttryck. Cohens verk visas nu på Tate Gallery i London.

En annan egenskap hos generativ konst, men en som är mindre och mindre ett privilegium, är upprepningen av mönster eller abstrakta element som tillhandahålls av programmeraren och implementeras i mjukvarukoden.

Dessutom har utvecklingen av allt mer komplexa neurala nätverk som verkar på text-bild-association möjliggjort utvecklingen av generativa modeller som kan skapa allt mer realistiska och korrekta bilder. Det mest kända exemplet på denna kategori av generativ konst är Platta.

Dall-E är ett multimodalt neuralt nätverk baserat på GPT-3 djupinlärningsmodell från OpenAI, samma företag som också nyligen utvecklats ChatGPT, chatboten lanserades i november 2022 och optimerades med "övervakad" och förstärkningsinlärningstekniker.

När vi återvänder till Dall-E ser vi att detta system kan generera bilder från en textbeskrivning, som kallas en "prompt," baserat på en datauppsättning av text-bildpar.

Den första versionen av Dall-E, som presenterades för allmänheten i januari 2021 och förblev privilegiet för ett litet antal yrkesverksamma inom området, representerade en verklig revolution när det gäller denna typ av generativ modell, som överträffade innovationerna i GPT- 3 själv.

Viktigt är också det faktum att noggrannheten i resultaten som bearbetats av Dall-E visade sig vara det perfekta utrymmet för en annan OpenAI-lösning: KLÄMMA (Kontrastiv språk-bild förträning).

Ett bildklassificerings- och rankningsneuralt nätverk utbildat på basis av text-bild-associationer, såsom bildtexter som finns på Internet. Tack vare CLIP:s ingripande, som minskar antalet resultat som föreslås användaren per prompt till 32, visade sig Dall-E returnera tillfredsställande bilder i de flesta fall.

Midjourney: design, mänsklig infrastruktur och artificiell intelligens

Som väntat, midjourney är ett viktigt projekt som är en del av det framväxande Al Generative Art-konceptet. Närmare bestämt är Midjourney ett oberoende forskningslaboratorium som utforskar nya sätt att tänka och utökar den mänskliga artens fantasifulla krafter.

Att använda det är enkelt: först måste ett konto skapas på Discord, en plattform som är värd för olika gemenskaper, där Midjourney är en av dem. Inom applikationen finns de olika chattrum där man aktivt kan delta eller inte i diskussioner.

Det är viktigt att påpeka att för att försöka använda artificiell intelligens för första gången måste man gå till "nybörjare" kanaler, var 25 gratis renderingar finns tillgängliga.

En rendering motsvarar genereringen av fyra olika varianter som genereras från samma textinmatning.

Således hänvisar de 25 renderingarna till 25 bearbetningsjobb som utförs av Midjourney-boten. Följaktligen kräver generering av bilden interaktion med Midjourney-boten via ett textmeddelande som kallas en "prompt", där det kommer att finnas nyckelord som beskriver bilden som användaren har i åtanke.

Du kan lägga till hur många detaljer du vill, det viktiga är att dela upp sökorden med ett kommatecken. När renderingen är klar returnerar datorn fyra olika bilder baserat på beskrivningarna att välja mellan.

Dessutom, när programmet har slutfört renderingen, kan du kommunicera dina preferenser baserat på bilderna och, om du vill, få ytterligare fyra versioner genererade igen.

DALL-E 2: det nya AI-systemet för konstverk

Förutom Midjourney är DALL-E 2 också det nya AI-systemet som kan skapa realistiska bilder och konstverk utifrån en naturlig språkbeskrivning. Inte nog med det, DALL-E 2 kan också kombinera koncept, attribut och stilar.

Styrkan med det nya AI-systemet ligger också i att kunna expandera bilder utöver det som finns i originalduken, skapande nya expansiva kompositioner. Dessutom kan den göra realistiska ändringar i befintliga bilder från en naturlig språktext och kan lägga till och ta bort element med hänsyn till skuggor, reflektioner och texturer.

DALL-E 2:s möjligheter inkluderar också att ta en bild och skapa flera varianter av den inspirerade av originalet. DALL-E 2 har lärt sig förhållandet mellan bilder och texten som används för att beskriva dem.

Den använder en process som kallas "diffusion," som börjar med ett mönster av slumpmässiga prickar och gradvis ändrar det mönstret mot en bild när det känner igen specifika aspekter av den bilden.

Så, efter att OpenAI introducerade DALL-E i januari 2021, genererar nu det senaste systemet, DALL-E 2, mer realistiska och exakta bilder med fyra gånger så hög upplösning.

DALL-E 2 startade som ett forskningsprojekt och finns nu tillgängligt som ett betaversion. Säkerhetsbegränsningar som systemet har utvecklat och fortsätter att förbättra inkluderar: begränsning av systemets förmåga att generera våldsamma bilder, hatbilder eller vuxna bilder, och lärande-baserad stegvis implementering.

Källa: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/