En nyhet från Åtta.45 Tryckeri
Text-till-bildteknik: AI emulerar otroliga bilder
DESIGN & FORM: Det främsta konstnärliga verktyget någonsin, eller ett förebud om kommande undergång för många i den kreativa sektorn? DALL-E 2 från OpenAI har introducerats för allmänheten och dess text-till-bildgenerering är imponerande.
Nu finns en ny version av OpenAI:s text-till-bild-tjänst; DALL-E 2 (Namnet är en sammanfattning av Pixar-karaktären WALL-E och den spanska konstnären Salvador Dalí). Bilden nedan visar gränssnittet för mjukvaran.
Enkelt förklarat så skapar DALL-E 2 bilder utifrån text. Denna digitala ”artificiella intelligens” har tränats på text-bildpar från internet och använder 3,5 miljarder parametrar för att generera bilder. Programvaran använder en teknik kallad diffusion för att skala upp motiven.
Man skriver in text på det man önskar, eventuellt laddar man upp en bild som används som förebild. Genom att kombinera information av olika texturer, ytor och färger kan lågupplösta skisser räknas upp till högre upplösning.
DALL-E emulerar ämnen, stilar, tekniker, vinklar, bakgrunder, platser, handlingar, attribut och koncept i en 3-dimensionell rymd. Dessutom kan den göra det på ett sätt som är visuellt tilltalande för människor. Beskriv i text vad du vill ha för bild, och efter några sekunder presenteras ett gäng olika varianter.
Användningsområdet för en sådan här tjänst är först och främst konceptuellt. Marknadsavdelningar över hela världen kan snabbt få hjälp av DALL-E när idétorkan sätter in. Vem vill inte få ett visuellt utkast sekunder efter att diskuterat en idé till en kampanj? Brainstorming kommer verkligen att nå nya nivåer med detta verktyg.
Den etiska problematiken med programvaran är dock uppenbar. Dagens klimat i sociala medier kan tyvärr eldas på ytterligare med illustrativa bilder till fejk-news. För att motverka detta har teamet på OpenAI sett till att DALL-E inte avbildar ansikten eller skapar bilder med våld, droger eller av sexuell natur.
Men det finns fler aktörer inom bildgenererande AI:s och somliga har inte samma etiska filter. I augusti lanserade Stability AI sin plattform Stable Diffusion.
Vid lanseringen av Stable Diffusion sa de sig vilja demokratisera bildgenerering och ge forskare och allmänheten möjlighet att utforska gränserna inom diffusionsteknologi.
Stable Diffusion har som sagt ingen etisk filtrering och skapar med lätthet bilder av kända personer eller annat explicit innehåll.
Utveckling går oerhört fort just nu inom text-till-bildtekniken. Stable Diffusion och DALL-E är bara några i en lång rad som snart erbjuds online.
Vad är då nästa steg i utvecklingen? Är detta främsta konstnärliga verktyget någonsin, eller ett förebud om kommande undergång för många i den kreativa sektorn? Ett kan vi vara säkra på: det är en spännande tid vi lever i!
Följ oss på Linkedin för fler artiklar som denna.