En nyhet från Åtta.45 Tryckeri

Text-till-bildteknik: AI emulerar otroliga bilder

Publicerad 22/09/2022

DESIGN & FORM: Det främsta konstnärliga verktyget någonsin, eller ett förebud om kommande undergång för många i den kreativa sektorn? DALL-E 2 från OpenAI har introducerats för allmänheten och dess text-till-bildgenerering är imponerande.

Nu finns en ny version av OpenAI:s text-till-bild-tjänst; DALL-E 2 (Namnet är en sammanfattning av Pixar-karaktären WALL-E och den spanska konstnären Salvador Dalí). Bilden nedan visar gränssnittet för mjukvaran.

Åtta45 Print Media OpenAI DALL-E

Enkelt förklarat så skapar DALL-E 2 bilder utifrån text. Denna digitala ”artificiella intelligens” har tränats på text-bildpar från internet och använder 3,5 miljarder parametrar för att generera bilder. Programvaran använder en teknik kallad diffusion för att skala upp motiven.

Åtta45 Print Media OpenAI DALL-E

Man skriver in text på det man önskar, eventuellt laddar man upp en bild som används som förebild. Genom att kombinera information av olika texturer, ytor och färger kan lågupplösta skisser räknas upp till högre upplösning.

Åtta45 Print Media OpenAI DALL-E

DALL-E emulerar ämnen, stilar, tekniker, vinklar, bakgrunder, platser, handlingar, attribut och koncept i en 3-dimensionell rymd. Dessutom kan den göra det på ett sätt som är visuellt tilltalande för människor. Beskriv i text vad du vill ha för bild, och efter några sekunder presenteras ett gäng olika varianter.

Åtta45 Print Media OpenAI DALL-E

Användningsområdet för en sådan här tjänst är först och främst konceptuellt. Marknadsavdelningar över hela världen kan snabbt få hjälp av DALL-E när idétorkan sätter in. Vem vill inte få ett visuellt utkast sekunder efter att diskuterat en idé till en kampanj? Brainstorming kommer verkligen att nå nya nivåer med detta verktyg.

Åtta45 Print Media OpenAI DALL-E

Den etiska problematiken med programvaran är dock uppenbar. Dagens klimat i sociala medier kan tyvärr eldas på ytterligare med illustrativa bilder till fejk-news. För att motverka detta har teamet på OpenAI sett till att DALL-E inte avbildar ansikten eller skapar bilder med våld, droger eller av sexuell natur.

Åtta45 Print Media OpenAI DALL-E

Men det finns fler aktörer inom bildgenererande AI:s och somliga har inte samma etiska filter. I augusti lanserade Stability AI sin plattform Stable Diffusion.

Åtta45 Print Media OpenAI DALL-E

Vid lanseringen av Stable Diffusion sa de sig vilja demokratisera bildgenerering och ge forskare och allmänheten möjlighet att utforska gränserna inom diffusionsteknologi.

Åtta45 Print Media OpenAI DALL-E

Stable Diffusion har som sagt ingen etisk filtrering och skapar med lätthet bilder av kända personer eller annat explicit innehåll.

Åtta45 Print Media OpenAI DALL-E

Utveckling går oerhört fort just nu inom text-till-bildtekniken. Stable Diffusion och DALL-E är bara några i en lång rad som snart erbjuds online.

Åtta45 Print Media OpenAI DALL-E

Åtta45 Print Media OpenAI DALL-E

Vad är då nästa steg i utvecklingen? Är detta främsta konstnärliga verktyget någonsin, eller ett förebud om kommande undergång för många i den kreativa sektorn? Ett kan vi vara säkra på: det är en spännande tid vi lever i!

Följ oss på Linkedin för fler artiklar som denna.

Åtta45 tryckeri logo

Artikel upplagd av:

Lennart Hannu

lelle.hannu@atta45.se