Sleutel wegneemetes
- DALL·E is 'n nuwe neurale netwerk wat beelde kan teken op grond van teks.
- Die netwerk is een van 'n groeiende aantal KI-projekte wat mense se kreatiewe uitset kan naboots.
- Kenners sê beelde wat deur KI geteken is nie oorspronklike skeppings nie.
Beweeg oor, Picasso. 'n Nuwe neurale netwerk kan beelde teken op grond van teks.
DALL·E, 'n samevatting van die name van die kunstenaar Salvador Dalí en Pixar se WALL·E, kan enige teks neem en 'n beeld daaruit skep. Die stelsel gebruik 'n neurale netwerk wat op biljoene prente en teksvoorbeelde opgelei is. Dit is een van 'n groeiende aantal KI-projekte wat mense se kreatiewe uitset kan naboots, maar nie herhaal nie.
"Omdat natuurlike taal voortdurend ontwikkel en baie afhanklik is van kontekstuele nuanse, is dit 'n baie belangrike prestasie om 'n masjien te leer om taal goed genoeg te verstaan om 'n prentjie te teken," Tamara Schwartz, professor in kuberveiligheid aan die York College of Pennsylvania, het in 'n e-posonderhoud gesê. "Stel jou 'n polisiesketskunstenaar voor, dis 'n seldsame talent, wat die vermoë het om 'n prentjie te skep gebaseer op 'n getuiebeskrywing."
Gebruik groot data om prente te vervaardig
DALL-E is geskep deur die KI-navorsingsmaatskappy OpenAI en werk deur groot hoeveelhede data van die internet af te versamel. Die data word dan deur 'n natuurlike taalmodel verwerk en opgelei om beelde uit teks te produseer. DALL-E werk soortgelyk aan die onlangs vrygestelde GPT-3, 'n taalmodel wat deur OpenAI geskep is wat gevra kan word om oorspronklike teksgedeeltes te genereer. GPT-3 is opgelei met 'n halftriljoen woorde internetteks en kan verbasend lewensgetroue teks produseer.
Om 'n masjien te leer om taal goed genoeg te verstaan om 'n prentjie te teken, is 'n baie belangrike prestasie.
Michael Yurushkin, stigter en CTO van BroutonLab, 'n datawetenskapmaatskappy, het in 'n e-posonderhoud gesê DALL-E is "een van die mensdom se min suksesvolle pogings om ons kreatiwiteit en verbeelding na te boots." Hy het bygevoeg, "Dit is makliker om te besef hoe KI iets voorspel deur deur relevante data te gaan, maar om te verstaan hoe dit tekeninge kan genereer uit dinge waarvan hy nog nooit voorheen 'gehoor' het nie."
Schwartz is versigtig om daarop te let dat die KI nie inligting skep nie, maar eerder taaldata neem en dit in beelde omskep.
"Die aanvanklike kreatiwiteit kom van die mens wat die taak saamgestel het," het Schwartz gesê. “Daar is’n mate van ‘kreatiwiteit’ aan die kant van die KI, want dit eksperimenteer met verskeie kombinasies van data en kies dan uit’n aantal potensiële uitsette.'n Mens ondersoek egter die uitsette en leer die KI hoe om uit die baie kombinasies te kies."
Robotspeurwerk?
'n Masjien kan baie vinniger met hierdie data- en voorwerpkombinasie eksperimenteer as 'n menslike kunstenaar. Schwartz het opgemerk dat DALL-E eendag met 'n speurder kan saamwerk wat 'n misdaadtoneel probeer rekonstrueer deur 'n skets, gebaseer op ooggetuie-getuienis.
"Soos getuies hul verklarings verskaf, kan die rekenaar daardie gesproke, natuurlike taalinligting neem en 'n tekening van die toneel of baie tekeninge van die toneel skep," het sy gesê. "Hierdie visualiserings kan dan geïntegreer word om 'n meer presiese beeld van verlore bewyse te skep. Hierdie visualisering kan verryk word deur vorige beelde van die ligging voor die misdaad te integreer."
Verskeie ander KI-gedrewe programme kan kuns produseer. Ai-Da gebruik byvoorbeeld 'n robotarmstelsel en gesigsherkenningstegnologie gepaard met kunsmatige intelligensie om kuns te skep. Die stelsel kan 'n beeld ontleed wat voor die masjien geplaas word, wat in 'n algoritme ingevoer word om die robot se armbewegings te produseer.
Menslike kunstenaars moet egter nie bekommerd wees dat robot-oorheersers hulle sal vervang nie, het Ahmed Elgammal, die direkteur van die Kuns- en Kunsmatige Intelligensie-laboratorium by Rutgers Universiteit, verlede jaar in The New York Times aangevoer.
"Terwyl die definisie van kuns voortdurend ontwikkel, is dit in sy kern 'n vorm van kommunikasie tussen mense," het hy geskryf. "Sonder 'n menslike kunstenaar agter die masjien kan KI min meer doen as om met vorm te speel, of dit nou beteken om pixels op 'n skerm te manipuleer of notas op 'n musikale grootboek. Hierdie aktiwiteite kan boeiend en perseptueel intrigerend wees, maar dit het geen betekenis sonder interaksie tussen kunstenaar en gehoor."
Nadat ek na DALL-E se werk gekyk het, verstaan ek Elgammal se punt dat die KI-geskepte beelde nie kuns is nie. Aan die ander kant is hulle beter as enige kuns wat ek kan skep. So, regtig, wat is die verskil?