首页 » 排名链接 » AI生成的创意或许比人类更出色——来自沃顿商学院教授的论文结论(创意想法生成人类创造力)

AI生成的创意或许比人类更出色——来自沃顿商学院教授的论文结论(创意想法生成人类创造力)

少女玫瑰心 2024-11-04 11:43:00 0

扫一扫用手机浏览

文章目录 [+]

“GPT-4 在替代用途测试中击败了 91% 的人类,在托伦斯创造性思维测试中击败了 99% 的人类。

“我们得到的人工智能不再是全是逻辑的,而是能够编造信息、参与情感讨论,并且具有极强的创造力。

论文翻译见下:

AI生成的创意或许比人类更出色——来自沃顿商学院教授的论文结论(创意想法生成人类创造力) 排名链接
(图片来自网络侵删)

人工智能产生的想法通常被认为比人类提出的想法更有创意、更实用。

AI本该只有逻辑能力,没有想象力,但现在的AI却能编造信息,参与(看似)情感化的讨论,并展现出强大的创造力。
这一现象让许多人深感不安。

创造力是什么?这在目前并没有统一的定义。
不过,研究人员还是开发出了一系列针对人类的创造力测试,尽管这些测试或多或少都存在一些缺陷和争议,但在以往的应用中,这并不算太大的问题。

然而这些方法在面对人工智能,特别是GPT-4这样的先进人工智能时,却出现了问题。

如今,GPT-4在替代用途测试(Alternative Uses Test)中超过了91%的人类,在托伦斯创造思维测试(Torrance Tests of Creative Thinking)中超过了99%的人类,这表明AI在创新思维和问题解决方面的能力已经超过了大部分人类。

这对AI的发展和应用无疑是一个重要的里程碑。
但另一方面,我们也正在失去能够挑战AI创造力的测试工具。

虽然这些心理测试很有趣,但将人类的测试应用到AI上可能会有风险——因为AI可能已经接触过类似测试和题目的答案,那么它所做的只是在重复答案(尽管研究者已经采取措施尽量减少这种风险)。

并且,心理测试也不一定能证明AI能够提出现实可行的创意。

然而,在过去的几周里,我们从三篇新的实验性论文中了解到,AI确实能够在现实环境中展现出创造力。

我想简要讨论这些论文,然后根据他们的结果给出一些关于如何使用AI进行创意生成的实用建议。

01

AI在实践中的创造力

这三篇论文都直接在控制实验中比较了AI的“创造力”(AI-powered creativity)和人类的“创造性努力”(human creative effort)。

第一篇重要的论文,来自沃顿商学院的研究者举办了一个创意生成比赛:让GPT-4与知名创业课程的学生们竞争。
随后,研究者会让人类评委来评估AI和学生们的创意质量。

结果发现,GPT-4生成的创意比学生们的更多、更便宜、更好。
更令人印象深刻的是,从商业角度来看,外部评委对AI生成的创意的购买意愿也更高!
在评委评选出的40个最佳创意中,有35个来自GPT-4。

第二篇论文又进行了一项大众化的比赛,研究者邀请人们提出与再次利用、回收或共享产品相关的循环经济方面的商业创意,并让评委将这些创意与GPT-4生成的创意进行比较。

结果发现,AI和人类生成的创意的整体质量水平相似,但AI在可行性和影响力上被评价为更好,而人类生成的创意更具新颖性。

而在最后一篇论文里,研究者开始关注创意写作。
研究比较了单独写短篇故事的人和使用AI创作故事的人。

同样,AI被证明是有帮助的:有AI帮助的人创作的故事,比单独由人类写的故事更具新颖性和趣味性。
但有两个值得注意的地方:首先,越有创造力的人,AI所能带来的效益越少;其次,AI生成的想法都过于相似。

通过这些研究,我们暂时可以得出几个清晰的结论:

AI能够在实际生活中提出具有创新性的想法,同时也可以帮助人们产生更好的想法。
AI生成的想法通常优于大多数人,但是非常有创造力的人仍然可以超越AI(至少目前如此),并且可能在利用AI生成的想法中受益较少。
当前AI产生的想法过于相似,不够多样。

这些也表明着,人类在创新中仍然有很大的作用,但是如果有人认为自己不具有较高的创造力,但又排斥AI,那么这将会是非常愚蠢的行为。

那么,我们应该如何使用AI来帮助自己生成想法、提供创意呢?

02

更好地利用AI提供创意

人们一般会过于关注与AI交流的措辞,认为必须使用精确的措辞才能指导AI完成任务,但在创意生成方面,情况并非如此:

在其中一篇论文中,作者测试了三种类型的提示:基本的陈述问题的提示,更高级的给AI一个更像人类解决者的角色的提示(比如“你是一个位于欧洲的技术和创意专业人士”),以及一个非常高级的让AI从特定著名专家的角度出发的提示。

虽然最后回答之间存在一些差异,但没有一种方法明显占优。
因此,我们不会过于担心提示的确切措辞。
也就是说,简单的提示似乎就能让AI很好地完成工作。

例如,在关于创新竞赛的论文中,参与者就提供了一个简单的系统提示作为上下文:你是一个寻求生成新产品想法的创意企业家;产品将针对美国的大学生;它应该是一种实物商品,而不是服务或软件;我想要的产品的零售价格应该低于50美元。

这些想法只是一些零碎的想法。
产品也不一定要已经存在,将所有的想法用分号或者逗号进行分隔即可,发现很多想法都是可用的。

然后,他们还提供了第二种用户提示:请以十个单独的段落生成十个想法;想法应以40-80字的段落表达,他们重复了这个过程多次,一样发现生成的大量想法是有用的。

他们还将这个简单提示与使用过少量学习的提示进行了比较。

注:少量学习,指在AI生成想法之前,给它提供你想看到的结果类型的例子,而“零学习”指不提供任何例子。

虽然AI使用少量学习方法生成了更多、更好的想法,但与其他提示所实现的答案相比,差异并不具有统计学意义。

当然,我通常还是会建议使用少量学习技术,因为它们在看起来似乎有所帮助,一些研究也发现它们有价值,而且它们易于实施。

为了形成对照,我让Claude 2生成15个适合Y Combinator(著名的创业孵化公司)的原创创业想法(这是一个零学习的方法)。

然后,我尝试了一种少量学习的方法,给AI提供了一个包含400个Y Combinator近期支持孵化的创业公司的列表,每个公司都有一句话的描述,然后提示:这是Y Combinator支持的最新的400个创业想法;找出趋势,然后结合这些概念生成15个原创的想法。
你可以看到两种方法的区别,以及我为什么更喜欢少量学习的方法。

(机器翻译,语义不准见谅)

除了这些建议,我还有一些自己的想法。

首先,不要只是让AI生成想法,也要框定条件,与大多数人的预期相反,AI在最受约束的时候生成想法的效果最好(人类也是如此!
)。

例如,你可以让AI在特定的框架或条件下思考问题,比如:“如果你是一个AI专家(或者超级英雄,或者宇航员),你会用什么方法来做?请给出10种可能的方法,并详细描述每一种方法”这样的问题设置,可以帮助AI更具针对性地思考问题,从而产生更多独特和创新的想法。

当然,你还可以使用其他方法,利用AI可以产生看似合理但有趣的内容,然后将这些AI生成的内容作为创造力的种子。

例如,你可以让AI创造一些虚构的访谈记录:比如制造一个产品设计师和牙医之间的对话,讨论牙医遇到的问题;或者让AI描述一些不存在的产品:比如让AI详细描述一个具有创新功能的虚构新型水泵的界面。
这是一种需要通过实验和不断学习才能掌握的艺术。

03

AI作为创造力引擎

目前,我们仍然不清楚AI实际上能有多少原创能力。

我经常看到人们激烈地表示LLM不能产生任何新的想法,但在我看来,这并不正确,至少在现实意义上,而不是哲学意义上。

在现实世界中,大多数新的想法并不是凭空产生的;它们是基于现有概念的组合,这就是为什么创新学者长期以来一直强调在产生想法中重组的重要性。

而LLM在这方面做得非常好,它们在意想不到的概念之间充当连接机器,它们通过生成对人类来说可能看似无关但代表一些更深层次联系的标记来进行训练,再加上AI输出的随机性,这实际上已经赋予了AI强大的创造力。

从现实来看,我们的想法受到限制比以往任何时候都少。
即使是那些不认为自己有创造力的人现在也能接触到一台能产生创意想法的机器,这些想法超过了大多数人(尽管不是最有创造力的人)。

然而在过去,提出一个好的想法只有少数人有能力做到。
这是人类创造力领域里的一个惊人变化,这种变化可能成为未来创新发展更为关键的因素。

原文作者:Ethan Mollick

Ethan Mollick是宾夕法尼亚大学沃顿商学院的管理学副教授,也是拉尔夫·J·罗伯茨杰出教职员工奖获得者。
他曾撰写《独角兽的影子:打击阻碍创业公司、创始人和投资者的危险神话》一书,并在顶级管理学期刊上发表多篇论文,且屡次获奖。

参考资料:

https://www.oneusefulthing.org/p/automating-creativity

https://x.com/xiaohuggg/status/1691013894784143360?s=46&t=9q8J-kwVXN0_zRgfyeVUHg

编译:西瓜 先问大模型 排版:黄蕾卉

图片源于Q仔互联网冲浪所得,若有侵权,后台联系,Q仔滑跪删除~

标签:

相关文章

线上购物有烦恼(消费者线上退货疫情商家)

不过,新京报近期发现,“发货慢、退货难”是消费者这段时间在商场线上购物平台上遇到的主要问题,让消费者颇为“烦恼”。问题一:线下无法...

排名链接 2025-02-09 阅读1375 评论0