新浪科技讯 1月6日上午消息,据报(bào)道,旧金山人工(gōng)智(zhì)能研(yán)究公司OpenAI已经(jīng)开发了一种新系统,能根据短文本来生成图像。
OpenAI在官(guān)方(fāng)博客中表(biǎo)示,这个新系统名为DALL-E,名称来源于艺术家萨尔瓦多·达利(Salvador Dali)和皮(pí)克(kè)斯的机器人英雄瓦力(WALL-E)的结(jié)合。新系统(tǒng)展示(shì)了“为一系列广(guǎng)泛的(de)概念”创(chuàng)造图像的能力(lì),创作的作品包括牛(niú)油果形状的(de)扶手椅等。
通(tōng)过神(shén)经网络去(qù)生成图像,这种(zhǒng)技术并不新颖。此前(qián),生(shēng)成(chéng)对抗网(wǎng)络(luò)(GAN)已被广泛用于创建真实的人、宠物(wù)、租赁房产和食物的(de)照片(piàn)。
不(bú)过(guò),DALL-E的独特之处在于可(kě)以根据(jù)输(shū)入的文(wén)本(běn)来创作图像。该系统基于文字生成系统GPT-3的一(yī)个版本(běn),该系统(tǒng)此前被用(yòng)于撰写诗歌和新闻文(wén)章等。利(lì)用配对好的文本和图像(xiàng)数据集进行训练,DALL-E可以(yǐ)根据新的文字提示生成图像(xiàng),此外(wài)还展示了创造多种风格图片的能(néng)力。
OpenAI还(hái)发布了图像(xiàng)识别(bié)系统Clip。Clip通用性比当前针对单个任(rèn)务的系统更好(hǎo),可以用网上公开的文(wén)字图像配(pèi)对数据(jù)集(jí)来训练。
DALL-E还需要继(jì)续优化。OpenAI指出(chū),DALL-E目前(qián)的(de)可靠性还(hái)存在问题(tí),对类似“glass”等有多个含义的名词常常会(huì)混淆,文字中不同的语法也可能会造成不同的结果。
此外(wài)还有更(gèng)深层(céng)次的问题需要解决。OpenAI表示(shì):“我们注(zhù)意到(dào),涉及生(shēng)成模型的工作可能会(huì)产生重大而广(guǎng)泛的社会(huì)影响(xiǎng)。”未来可能的举措包括研(yán)究对就业岗位的影(yǐng)响,生成结果(guǒ)的偏见,以及(jí)技术的长期道德(dé)挑战。
长期以来(lái),公众(zhòng)一直担心人(rén)工智能生成的媒体内容被滥(làn)用,例如神经网络被用(yòng)来(lái)制造虚(xū)假(jiǎ)的音视频和图像(xiàng),用于不道(dào)德的目(mù)的,例如(rú)政治上的假(jiǎ)信息(xī)和欺诈活动等。