Негізгі ұсыныстар
- DALL·E - мәтінге негізделген кескіндерді сала алатын жаңа нейрондық желі.
- Желі – адамның шығармашылық өніміне еліктейтін AI жобаларының саны өсіп келе жатқан бірі.
- Сарапшылар AI салған кескіндердің түпнұсқа емес екенін айтады.
Жылжы, Пикассо. Жаңа нейрондық желі мәтінге негізделген кескіндерді сала алады.
DALL·E, суретші Сальвадор Дали мен Пиксардың WALL·E есімдерінің портмантосы кез келген мәтінді алып, одан сурет жасай алады. Жүйе миллиардтаған суреттер мен мәтіндік мысалдар бойынша оқытылған нейрондық желіні пайдаланады. Бұл адамның шығармашылық өнімін қайталай алмайтын, бірақ қайталамайтын AI жобаларының саны өсіп келе жатқандардың бірі.
"Табиғи тіл үнемі дамып отырады және контекстік нюансқа өте тәуелді болғандықтан, машинаны сурет салу үшін тілді жақсы түсінуге үйрету - бұл өте маңызды жетістік ", Тамара Шварц, Пенсильваниядағы Йорк колледжінің киберқауіпсіздік профессоры., - деді электрондық поштаға берген сұхбатында. "Елестетіп көріңізші, полиция суретшісін елестетіп көріңізші, бұл сирек дарын, куәгердің сипаттамасына негізделген суретті жасай алатын қабілеті бар."
Суреттерді жасау үшін үлкен деректерді пайдалану
DALL-E AI зерттеу компаниясы OpenAI жасаған және интернеттен деректердің үлкен көлемін жинақтау арқылы жұмыс істейді. Содан кейін деректер табиғи тіл үлгісімен өңделеді және мәтіннен кескіндер жасауға үйретіледі. DALL-E жақында шыққан GPT-3 үлгісіне ұқсас жұмыс істейді, OpenAI жасаған тіл үлгісі, ол түпнұсқа мәтін үзінділерін жасауға шақырылуы мүмкін. GPT-3 жарты триллион сөздік интернет мәтінін қолданып оқытылды және таңғаларлықтай шынайы мәтін жасай алады.
Машинаны сурет салу үшін тілді жақсы түсінуге үйрету - бұл өте маңызды жетістік.
Майкл Юрушкин, BroutonLab деректану компаниясының негізін қалаушы және техникалық директоры электрондық поштаға берген сұхбатында DALL-E «адамзаттың біздің шығармашылық пен қиялға еліктейтін бірнеше сәтті жұмысының бірі» екенін айтты. Ол былай деп қосты: "Сәйкес деректерді тексеру арқылы AI бір нәрсені қалай болжайтынын түсіну оңайырақ, бірақ оның бұрын ешқашан "естимеген" нәрселерден сызбалар жасай алатынын түсіну қиынырақ."
Шварц AI ақпарат жасамайтынын, керісінше тіл деректерін алып, оны кескіндерге айналдыратынын ескертеді.
«Бастапқы шығармашылық тапсырманы құрастырған адамнан келеді», - деді Шварц. «AI бөлігінде «шығармашылық» бар, өйткені ол деректердің әртүрлі комбинацияларымен тәжірибе жасайды, содан кейін бірқатар ықтимал нәтижелерден таңдайды. Дегенмен, адам нәтижелерді зерттеп, AI-ға көптеген комбинациялардан таңдауды үйретеді."
Робот-детектив жұмысы?
Машина бұл деректермен және нысан комбинациясымен суретшіге қарағанда әлдеқайда жылдам тәжірибе жасай алады. Шварц DALL-E бір күні куәгерлердің айғақтарына негізделген эскиз арқылы қылмыс болған жерді қалпына келтіруге тырысатын детективпен серіктес бола алатынын атап өтті.
"Куәгерлер өз мәлімдемелерін берген кезде, компьютер сол ауызша, табиғи тілдегі ақпаратты алып, оқиға болған жердің сызбасын немесе көптеген сызбаларды жасай алады", - деді ол. "Одан кейін бұл визуализациялар жоғалған айғақтардың дәлірек бейнесін жасау үшін біріктірілуі мүмкін. Бұл визуализация қылмысқа дейінгі орынның бұрынғы кескіндерін біріктіру арқылы байытылуы мүмкін."
AI басқаратын бірнеше басқа бағдарламалар өнер көрсете алады. Мысалы, Ai-Da өнер жасау үшін роботты қол жүйесі мен жасанды интеллектпен жұптастырылған бет-әлпетті тану технологиясын пайдаланады. Жүйе роботтың қол қимылдарын жасау үшін алгоритмді беретін машинаның алдына қойылған кескінді талдай алады.
Алайда адам суретшілері олардың орнын роботтандырылған қожайындар алады деп уайымдамауы керек, - деді өткен жылы The New York Times газетінде Ратгерс университетінің өнер және жасанды интеллект зертханасының директоры Ахмед Элгаммал.
«Өнердің анықтамасы үнемі дамып келе жатқанымен, оның негізінде ол адамдар арасындағы қарым-қатынастың бір түрі болып табылады», - деп жазды ол. "Аппараттың артында адам суретшісі болмаса, AI пішінмен ойнаудан басқа ештеңе істей алмайды, мейлі ол экрандағы пикселдерді немесе музыкалық кітаптағы ноталарды басқаруды білдіреді. Бұл әрекеттер қызықты және қабылдауға қызықты болуы мүмкін, бірақ олардың арасындағы өзара әрекеттесусіз олардың мағынасы жоқ. суретші және көрермен."
DALL-E жұмысын қарап шыққаннан кейін мен Элгаммалдың AI жасаған кескіндер өнер емес деген ойын түсіндім. Екінші жағынан, олар мен жасай алатын кез келген өнерден жақсы. Шынымен де, айырмашылығы неде?