新浪科技讯 1月(yuè)6日上午消息(xī),据(jù)报道,旧金山人工智能(néng)研究公(gōng)司OpenAI已经开发了一(yī)种新系统,能根据短文本来生成(chéng)图(tú)像。
OpenAI在官方(fāng)博客中(zhōng)表示,这个新系(xì)统名为DALL-E,名称来源(yuán)于艺术家萨尔瓦多·达利(Salvador Dali)和皮克斯的机器人英雄(xióng)瓦力(WALL-E)的结合(hé)。新系统展(zhǎn)示了“为一系列广泛(fàn)的(de)概念”创造图像的能力,创作的作品包括牛油果形(xíng)状的扶手(shǒu)椅等。
通过神(shén)经(jīng)网络去(qù)生成图像(xiàng),这种技术并不新(xīn)颖。此前,生成(chéng)对(duì)抗(kàng)网络(GAN)已被广泛用于创建真实的人、宠物、租(zū)赁房产和食物的照片。
不过,DALL-E的独特之处(chù)在于可(kě)以根据输入(rù)的文本来创作图像(xiàng)。该系统(tǒng)基于文字生成系统(tǒng)GPT-3的一个版本,该系统此前(qián)被用(yòng)于撰(zhuàn)写诗歌和(hé)新闻文章等。利用配对好(hǎo)的文(wén)本和图(tú)像数据(jù)集进行训练,DALL-E可以(yǐ)根据新的文(wén)字(zì)提示生成(chéng)图像,此外还展示了创造多种(zhǒng)风格(gé)图片的能力。
OpenAI还(hái)发(fā)布了(le)图像(xiàng)识别系(xì)统Clip。Clip通用(yòng)性比当前针对单(dān)个(gè)任务的系统更好,可以用网上公(gōng)开的文字图像配对数据集来(lái)训练。
DALL-E还需要(yào)继续优化。OpenAI指出(chū),DALL-E目前(qián)的可靠性还存在问(wèn)题,对类(lèi)似“glass”等(děng)有多个含义的名词常常会混淆,文(wén)字中不同的语(yǔ)法(fǎ)也可(kě)能会造成(chéng)不同的结果。
此外还有更深层次的问题需(xū)要解决。OpenAI表示:“我们注(zhù)意到(dào),涉及(jí)生成模型的工作可能会产生重大(dà)而广泛(fàn)的社会影(yǐng)响。”未来(lái)可能的举措包括研究对就业岗位的影响,生成结果的偏见,以及技术的(de)长期道德挑战。
长期以来,公众一直担心(xīn)人工智能生(shēng)成(chéng)的媒体内容被滥用,例如神经网络被(bèi)用来制造(zào)虚假的音视频和图像,用于不道(dào)德的目的,例如政治(zhì)上的假信(xìn)息(xī)和欺诈(zhà)活动等(děng)。