让计算机科学告诉你,为什么这个文章标题不好笑

科学
让计算机科学告诉你,为什么这个文章标题不好笑
麻省理工科技评论 2019-02-01

2019-02-01

通过研究这些句子之间的差异,研究人员可以了解标题是怎样从有趣变得无趣,以及幽默的源头究竟在哪儿。
科学
通过研究这些句子之间的差异,研究人员可以了解标题是怎样从有趣变得无趣,以及幽默的源头究竟在哪儿。

幽默似乎是我们人类与生俱来的一部分。在各种社交场合,我们的微笑、大笑乃至傻笑,都有着重要作用。这引起了社会学家和人类学家的兴趣。但是在笑之前,必须要有个玩笑做引子。所以,幽默也是认知心理学家的感兴趣的对象。

这立即引起了计算机学家们的兴趣。他们已经开始探索是否可以计算出幽默,如果可以的话,又该如何计算呢?

对于任何尝试回答上述问题的科学家来说,都会立刻面临这样一个问题,那就是他们缺乏适合的数据库资料来进行计算研究。例如,如果有这样一个数据库,它收集了含义相似的一些句子,有的让人忍俊不禁,而有的却非常严肃。这使研究人员得以梳理出不同表述方式之间的差异,并且得知句子间如何相互转化。但遗憾的是,我们始终缺乏这样的数据库。

(来源:arXiv)

不过,还是有团队做出了不错的尝试。来自瑞士洛桑联邦理工大学(EPFL)的罗伯特·韦斯特(Robert West)教授和来自美国微软研究院的埃里克·霍尔维茨(Eric Horvitz)研究员的研究就是其中之一。他们众包了一个数据库,将那些令人捧腹的讽刺性新闻标题,改写成并不幽默的同义句输入数据库中。

通过研究这些句子之间的差异,研究人员可以了解标题是怎样从有趣变得无趣,以及幽默的源头究竟在哪儿。他们说:“通过鉴别出那些奠定句子严肃或是幽默基调的词汇,我们能够在更精细的维度上,理解为什么讽刺性文本比之前别的文本更为有趣。”此举将以独特方式洞悉幽默的本质。

研究人员通过创建一个名为 Unfun.me 的在线游戏,从而得以创建这个数据库。游戏玩家会看到一个来自洋葱幽默新闻网的讽刺性新闻标题,然后要求将其变成严肃的新闻标题,并且改动的词越少越好。这样做是为了愚弄其他玩家,让他们以为这个标题是真的。

例如,在2001年,洋葱幽默新闻网刊登了一则标题为“上帝被诊断为患有躁郁症”的讽刺性新闻。如果把“上帝”一词换成真人的名字,比如“鲍勃·迪伦(Bob Dylan)被诊断为患有躁郁症”,标题就会变得严肃。这样的标题完全可以出现在一个严肃的新闻网站上。然后,游戏会要求玩家,按照有趣程度对修改后的标题进行排名。

根据数据库中,标题的哪一部分最常被改变以使其变得乏味,韦斯特教授和霍尔维茨研究员展开了研究。与此同时,他们也关注到了变化的本质。

他们得到的结果很有意思。标题通常由以下几个部分构成:名词短语、动词短语、形容词短语以及介词。事实证明,在将标题从有趣变为乏味的过程中,名词短语最常被替换,特别是出现在句末的一个或是几个单词。

例如,我们要是用“工人”取代“流行歌星”,讽刺性标题“亚洲经济的不景气使得70万流行歌星下岗”,就成了“亚洲经济的不景气使得70万工人下岗”,一下就严肃了很多。

这使研究人员得出了一个重要的结论。他们说:“我们的分析表明,幽默倾向于出现在新闻标题的末尾。”他们将句末的这些词语称为“画龙点睛之笔”。

通过研究这些改变背后的本质,研究人员有了更多新的发现。为了更好地理解这些发现,他们将目光投向了维克多‧拉斯金(Victor Raskin)在1985年发表的有关幽默的著名理论。该理论表明,要想使得标题变得有趣或是严肃,必须遵照一些特定的准则。韦斯特教授和霍尔维茨研究员说:“在有些方面,有趣的和严肃的版本必须相互对立”。比如,其中一个必须是可能的,而另一个是无法实现的;又或者一个是正常的,而另一个却离经叛道;还可能一个是非常现实的,而另一个却天马行空。

在上面的例子中,裁70万名工人是可能的或者说实际的,但是裁掉70万名流行歌星却是不可能的,也是不实际的。在另一个例子中,上帝是完美的,不可能患躁郁症,而作为人类的鲍勃·迪伦,却完全可以。“我们的研究结果证验证了拉斯金的幽默理论,”研究人员说。

另外,研究人员还表示:在研究语言中粗鲁、性别歧视及委婉表达等情况的时候,要求人们用一个单词替换原句中某些词汇的方法也同样适用。

还有一个有趣的问题是:这项研究成果是否可以反向利用,即在把一个乏味的句子变得趣味十足方面管用吗?

这可要难得多。该团队指出:即使是在洋葱幽默新闻网,16个最终印刷使用的标题也是从600个想出来的标题中精心挑选出来的。显然,“删除”幽默比“添加”幽默要容易得多。

试想,如果幽默真的可以被计算出来的话,那么只要遵循本文结论,就可以“添加幽默”了。有了这种通过计算就能添加幽默的方式,可能很快互联网上到处都会是AI这个讽刺喜剧大师创造出来的幽默标题了。

麻省理工科技评论

From Tech to Deeptech