至少从柏拉(lā)图这样的探(tàn)究者时代开始,什么东西会让人感到(dào)好笑,这一问(wèn)题一直让(ràng)哲学家和(hé)科学家感到困惑。希腊(là)人(rén)认为,以他人为代价(jià)的优越感是幽默的(de)来(lái)源。德(dé)国心(xīn)理学家西格蒙德-弗洛伊(yī)德(Sigmund Freud)认(rèn)为(wéi)幽(yōu)默是一种(zhǒng)发(fā)泄(xiè)压抑能量的手(shǒu)段。为了让人们发笑,美国喜剧演员(yuán)罗(luó)宾-威廉姆斯挖掘了他对荒诞(dàn)事物的(de)愤怒。
对(duì)于"有什么好(hǎo)笑的?"这(zhè)个问题的答(dá)案,似乎没(méi)有人能够达成(chéng)一(yī)致。因此,想象(xiàng)一下试图训练一个机器人笑(xiào)的场景(jǐng)。但(dàn)通过创建一(yī)个从共享笑声系统(tǒng)中获(huò)取(qǔ)信号的人工智能,日(rì)本京都大学的一个研究小组(zǔ)正试图做(zuò)到这一点。研究人员在《机器人学和人工智能前沿》杂志上(shàng)描述了他(tā)们为日本机器人"Erica"创造笑这一(yī)表(biǎo)情的新技术。
这并不(bú)是说机器(qì)人不能理解,甚(shèn)至不能对一个(gè)糟糕的笑话(huà)发出笑声。相反,困难在于为人工智(zhì)能系统开发(fā)人类幽默的微妙之处(chù),以增强机器人和(hé)人类之间的普通对话(huà)。
研究(jiū)人员与(yǔ)Erica之间的(de)对话实例(lì)。资料来源(yuán):Inoue等人
"我们认为对话式人工智能的重要功能之一是转移(yí)情感,"主(zhǔ)要作者井上浩二(èr)博(bó)士解释说,他是(shì)京都大学信息(xī)学研(yán)究生院智(zhì)能科(kē)学(xué)和(hé)技术系的助理教授。"当然,对话是(shì)多模态的,不(bú)仅仅(jǐn)是(shì)正(zhèng)确的回应。因此(cǐ),我们决(jué)定,机器人(rén)能够与用户(hù)产生共(gòng)鸣的一种方式是分享他们的笑(xiào)声,而这是基于文本的聊天机(jī)器人无法做到的。"
在分享笑(xiào)声的模式中,人类最初会笑,而人(rén)工智能(néng)系统则以笑(xiào)声作为移情反应。这种(zhǒng)方法(fǎ)需要设(shè)计三(sān)个子(zǐ)系(xì)统(tǒng)--一个用于检测笑声,第二个(gè)用(yòng)于决定是否(fǒu)笑,第三(sān)个用于(yú)选择适当(dāng)的(de)笑声类型。
科学(xué)家们通过注释80多(duō)段来自速配的对话来收集(jí)训练数据(jù),速配(pèi)是(shì)一种社会场景,大群人在短暂的(de)时(shí)间内一对(duì)一地互动。在这种情况(kuàng)下,涉及京都大(dà)学学生的(de)"相亲(qīn)马拉松(sōng)"活动让Erica加入其中,由几个业余(yú)女演员远程操作。
"我(wǒ)们在这项工作中最大的挑战是(shì)确定共享笑声的实际(jì)案例,这并(bìng)不(bú)容易,因为如你所知,大多数笑声实际上根本没有(yǒu)共(gòng)享,"Inoue说。"我们必须仔细分类,到底(dǐ)哪些笑(xiào)声可以用于我们的分(fèn)析,而不是仅仅(jǐn)假设任何笑声(shēng)都(dōu)可以被(bèi)回应。"
笑声的(de)类型(xíng)也很重要,因(yīn)为在某些情况(kuàng)下,礼貌的笑声可能比响亮的嗤笑(xiào)声更合(hé)适。实(shí)验(yàn)仅限于社交性的笑声与欢快的笑声。
研究小组(zǔ)最终通过在一(yī)个人和Erica之间用她的(de)新分享式笑声系(xì)统创(chuàng)造四段两到三分钟的简短对话来测试Erica新学会的幽默感。在第一个场景(jǐng)中,她只发出了(le)社交性(xìng)的笑声,随后(hòu)在第二(èr)和第三个(gè)交流中只(zhī)发出了欢笑声(shēng),在最(zuì)后一个对话中两种笑(xiào)声(shēng)结合起来。该(gāi)小组还(hái)创建了另外两组类似的对话作为基线模型。在第一组中,Erica从未(wèi)笑过(guò)。在第二个中,Erica每次检测(cè)到(dào)人(rén)类的笑声时都会发出社交(jiāo)性的笑声,而不使用其他两个子系统来过滤背(bèi)景和反应。
研究人(rén)员共召集了130多人听取了三种不同条件下的每个场景--共享笑(xiào)声(shēng)系统、无笑声、所有(yǒu)笑声--并(bìng)根(gēn)据(jù)移情、自(zì)然、人类相似性和理解来评估互动。共享(xiǎng)笑声系统的(de)表现(xiàn)优于任何(hé)一种基线。
"这(zhè)篇(piān)论文最重(chóng)要的结(jié)果是(shì),我们已经(jīng)展示了(le)我们如(rú)何将所有这三(sān)项任务结合到一个机器(qì)人中。我(wǒ)们相信,这种(zhǒng)类型(xíng)的组合系统对于正确的(de)笑的行为是必要的,而不仅仅是检(jiǎn)测到笑并对其做出反(fǎn)应,"Inoue说。
在(zài)Erica准备(bèi)好参加脱口秀表演之前(qián),还(hái)有很多其他的(de)笑声方(fāng)式(shì)需(xū)要建(jiàn)模(mó)和训(xùn)练(liàn)。"还有许多其他的笑的功(gōng)能和类(lèi)型需(xū)要考虑,这不是一(yī)项容易的任务。我们甚至还没有尝试对不共享的笑声进行建模,尽管它们是最常见的(de),"Inoue指出。
当然(rán),笑(xiào)声只(zhī)是与机器人进行类似人类自然(rán)对话的一个方面。
"机器人(rén)实(shí)际上应该有一(yī)个独特的性格,我(wǒ)们认(rèn)为他们可以通过(guò)他(tā)们的对话行为来显示这一点,例如(rú)笑、眼睛注视、手势和说话风格,"Inoue补充(chōng)说(shuō)。"我们认为(wéi)这根(gēn)本(běn)不(bú)是(shì)一个简单的问题(tí),很可(kě)能需要10到20年以上的时间(jiān),我们才能最终(zhōng)与机器人像与朋友一(yī)样进行(háng)休闲(xián)聊(liáo)天。"