没有AI我会难受至极:大学生的智能工具依赖与适应

在ChatGPT和生成式AI席卷全球的时代,大学生已成为这一技术浪潮中的“深度使用者”。AI时代,人变了吗?

本期《硅谷101》播客,硅谷101创始人兼播客主理人泓君邀请了四位不同阶段的学生嘉宾:侯泰羽 Kolento,纽约大学本科应用心理学 ,东非卢旺达 AI 创业者;陈浩楠 Henry, 哥伦比亚大学商学院会计硕士,AI产品爱好者;王冉 Ran,NYU神经工程博士后,脑机接口项目创始人;左曜诚 Charles,NYU 经济与哲学专业,NYU华人创业社群主席,分享他们从课堂学习,科研探索,到情感慰藉等各种场景里与AI生活的体验。







如果把这次讨论当成一次用户调研,有一些很有意思的结论:

他们发现MBA学生相比于年轻更小的学生,不知道怎么更好地写Prompt,用工具只知道ChatGpt;

每天要花五六个小时与AI对话,时时刻刻问AI成了一种习惯,甚至会把各个模型的所有token都用完;

对Google这类传统搜索的使用比重下降了80%,更关注于搜索质量是否精准高效;

在关于学生到底该不该使用AI上,每个老师的要求都不相同,但是使用过AI工具的学生数学更差,也有学生使用完AI再也写不出自己曾经写出的A级论文了。

以下是部分访谈精选


01

智能工具的利用与依赖:

大学生日常AI使用体验

泓君:你们日常的学习生活中,会用到ChatGPT或者类似的大模型产品?会在哪些环节用到?

侯泰羽:平常我使用这些大模型、模型层产品的频率非常高,可能贯穿了我学习生活的90%。我觉得可以分成几个阶段来讲。

第一点是在学习过程中,因为其实我去上课的频率变得没有那么高了,可能更多的靠自学。因为我发现,通过我跟大模型产品进行对话,包括把一些教科书上传上去,极大程度上增强了我自学能力。比如说可以定制一些对某些教材的解读,包括针对我上课记得一些学习笔记,或者说期末复习的计划,还可以给我出一些很详细的复习提纲,或者说帮助我做一个导师的形象,来给予我一些指导。

第二是在考试阶段,GPT会帮助论文做一些润色;我也会关注更能够帮助我在学术严谨上增加准确性的工具,比如说像Quillbot,它是一个插件,它也是一个网页端的产品,它可以帮助我们在学术严谨的前提下去进行一些paraphrasing。

我也比较常用GPT Zero。GPT Zero应该是一个学生开发的软件,它可以帮你检测你的论文,或者你的文件是不是具有极高的AI撰写程度。

泓君:GPT Zero真的能侦探出AI痕迹有多重吗?你觉得它测得准吗?


来源:GPTZero

侯泰羽:我觉得测得非常准,因为它能告诉你百分比是多少,甚至是哪一段,它觉得你是AI写的。那我就可能相对的针对那些改一改,进行一些修改。

泓君:那你觉得它对你整个效率的提升,会有多少的比例?

侯泰羽:我感觉已经是很大的倍数了,可能两三倍,甚至三四倍效率的提升。因为之前可能我要花大量的时间从目录里再去找不同的信息,然后再去阅读。现在AI首先会给我一个非常强的一个摘要,AI也可以帮助我找到一些延伸阅读的材料。这个是对我效率提升最大的点。

泓君:我们没有这些AI工具的时候,你写一篇论文,看一个书单的时候,你的完整体验是:我要慢慢地去把所有的这20本书跟教材的东西,都学到我自己的脑子里面,把它消化理解。最后在你遇到任何一个问题的时候,你的人脑就是一个搜索引擎库,然后你可以在回答某一个问题的时候,自己去找到这些教材的某一块。有了AI工具以后,我觉得我们在学习的过程中是走了一个捷径。你会怎么去看这两种方式呢?

侯泰羽:有了AI之后,其实我原本输入的就不是20本文本,我可以输入200本,你对于单个文章的深度,可能会有降低,但是你横截面的多样性会有增加。我觉得是有利有弊。

泓君:如果现在把所有的AI工具都给你拿掉,你会觉得不适应吗?

侯泰羽:我觉得难受至极……

我平时非常依赖于跟AI进行非常多轮的对话,它不只仅仅局限在学习上。因为我平时我养成了一个习惯,有点像“不懂就问”。比如说随时随地,因为手机上也有GPT,然后你的电脑上有GPT。

在学习生活中,比如说我们上课什么地方不懂,老师讲得不明白,GPT能给你讲得非常明白,它也帮你举例子,可以给你很通俗的、跟别的东西进行类比,能够极大程度上提升我们的学习效率,包括对各种知识点之间的融会贯通,创造很有意义的链接。



来源:blinklist.com



左曜诚:其实我觉得对比泰羽来说,我可能并不会像他这么高强度的使用。我其实在写论文的过程中,不会用到那么多的AI工具。在我的写论文的过程中,我用这些AI工具,主要是为了去帮我写完之后的做检查。

泓君:检查语言类的还是内容类的问题?

左曜诚:这两个方面都会有,我可能会请Claude帮我检查内容,Grammarly帮我检查语言类、语法类的问题。

泓君:所以如果离开了这些工具,你会觉得很不适应吗?

左曜诚:我觉得我可能不会那么的不适应,当然它肯定会让我的效率降低,但是我不会像泰羽这么的不适应。

泓君:浩楠你跟他们稍微不一样,因为他们还在大学阶段,所以在读书的一开始就有一些AI工具类的产品,在念大学的一到两年后GPT就出来了,他们就慢慢开始适应了这个产品,所以我觉得他们的思维,可能是更加 AI native的。你可能是正好是整个大学都没有这样的工具跟产品的,这些年是在国内念的书,然后来美国念的这个研究生,突然面临了一个整个的环境的变化。

陈浩楠:因为我当时是大四的时候,GPT 3.5刚出来,当时的模型能力也没有很强。像我是会计专业的,写一些会计专业的论文内容,其实写不出来的。然后这两年,不管是Claude,还是GPT,发展都非常迅速。

我觉得对我最大的帮助,就是在一些数理方面的课程,比如说像计量经济学这样,它有很多的一些推导。之前我如果是有一个公式我不懂的话,我去回看老师的录播,其实非常麻烦,因为一个录播可能两三个小时,有些地方老师也会讲得太快了。

但我就现在就可以去问GPT,让它一步一步给我推。如果它没推出来,或者我还是不懂的话,我就可以去问Perplexity,让它给我找这个概念相关的视频或者课程,然后我去看一下,包括让GPT去写一些简单的论文。

平常如果有些编程相关的内容,比如说机器学习,或者是深度学习的课程,要写些python的代码,我就会让Claude帮我,或者跟我一块写。


来源:techzine.eu



泓君:那你在选修编程的这个课上,会特别要求去使用这些AI产品吗?

陈浩楠:我在这个课上,其实算是从0构建了一个评测LLM去计算财务公式的benchmark。对我来说完全是从零开始,我是把自己的需求跟Claude讲清楚,然后Claude给我把这个代码写出来,然后把这个error code再回给Claude,然后Claude再帮我改。这么大概运行了可能三五天,然后这个小的一个文章就出来了。

泓君:所以你其实这个文章,就是跟Claude AI一起去共创的一个文章,而且它是一定是需要AI的这种能力的?

陈浩楠:对于我来说是的。我相信如果有些同学编程能力很强的话,他可能自己把这个作业写出来了。但因为我还没有那么强,所以我就是相当于跟Claude把意图告诉它,然后它写,然后我再测,然后它再改,这么一个流程。

泓君:你觉得对你的帮助大吗?

陈浩楠:非常大,相当于这个是类似于在帮你去学编程。而且是这种用实践学习。这种方式如果没有Claude的话,我可能根本就做不出来,因为东西实在是太多了。

我教授跟我说,一个比较好的方式是,先按自己的结构先把这个论文写出来,然后再喂给Claude或者GPT去润色。既能降低AI痕迹,又能达到比较好的文章效果。

泓君:那AI在真正帮助做科学研究,比如王冉从事的脑机接口,会有很大的帮助吗?因为你的研究范围可能已经超过了大家前面说的写论文或者是给一个简短的答案。

王冉:其实我一直期待有一个super agent可以帮我做,比如说一个新的领域的文章调研,包括提炼一些问题。目前来说这个AI还做不到这一点。但是在一些流程的环节中,是能够帮到我的,当时我是2023年左右的时候用,那个版本还比较老,它会有一些幻觉的问题。


来源:superannotate.com



现在它能力提高了,不存在这个问题了。但是在当时,我会用另外一个工具叫做connected paper,是一个基于图谱的工具,相当于是谷歌的页面排序那种算法。

比如我想知道在传统的没有AI的时候,记忆是如何产生的,过程中哪些关键的过程是怎么样子。我可能需要一个完整的调研来搞清楚大的框架,才能够知道这里面的细节点。但是AI给我的帮助是,我可以直接问这个问题,我不需要做完整的调研,然后他可以把一些关键的结果直接告诉我,这个过程,对我来说也是大大加速了我对整个领域的了解。

我在现在写文章有一个大家用的比较多的一个online工具,叫做overleaf。它是一个写LaTeX格式的一种在线编辑工具,这里面也融入了AI的功能。我发现我在用这个工具的时候,它的AI的撰写,或者帮我修改句法和词汇替换的过程中,其实也是非常有帮助,就是一个高级版的Grammarly。

泓君:所以它其实也不算是生成式文章,只是说,它可以更好地帮你在英文的润色上做得更好?

王冉:对的,相当于是一个副驾驶copilot。我发现ChatGPT在中文上是非常烂的,它的句法和用词其实并没有我自己写得好。



02

用AI的学生数学更差



泓君:你们也会讨论AI对各种行业的影响。对教育的影响具体是什么,然后你们在课上是怎么去看这些观点的?

陈浩楠:当时我们有看了一个比较经典的一个论文,就是测试了一个发展中国家的中学数学课,让一部分同学用AI去做作业,让一部分同学没法用AI,然后看他们最后在数学考试的结果。他们发现,从头不用AI的那帮同学,考试结果是更好的。

泓君:他们是什么年龄段的?

陈浩楠:大概在12-15岁之间,初中。后来他们将这个实验做了一个调整。之前的AI可能是只给答案,调整为不给答案,只告诉过程,同学们按这个过程一步一步去解,最后发现能减小成绩的差异。

泓君:但是还是没有用AI的那批人,得分比较高?

陈浩楠:是,但是我觉得这个可能局限于数学领域,而且考试的时候是不能用AI的。不像在现实生活里,可能我们做一些作业,也是能用AI工具的。

泓君:所以你觉得在教育领域,我们应该去禁止AI类工具的使用吗?尤其是在初中跟高中阶段。



来源:century.tech

左曜诚:回答刚才您的问题,就是应不应该在初中或者高中阶段让学生大量地使用GPT这样的AI工具。我前段时间有听李飞飞和Jeffrey Hinton的一个视频,李飞飞提到,斯坦福当时在GPT刚出来的时候,有去咨询李飞飞关于学生使用GPT帮他们写文书,然后进入大学的问题。斯坦福的招生部想知道,这个算不算是作弊。

李飞飞对这个问题思考了很久。她去问了她的儿子,她的儿子很小,她问这个应该怎么解决。她儿子给了她一个我觉得很符合我们这一代AI native学生的一个回答:她儿子说斯坦福其实应该考虑录取ChatGPT使用得最好的前2,000名的学生。

我觉得我很同意这个观点。因为对于我来说,AI就是一个工具,可能就像我们平时用Word、用PPT,习以为常,我并不会说特意想拿它来作弊。这是我的个人的一些观点。

泓君:在ChatGPT刚出来的时候,其实我就有看到study.com的一个研究报告,说90%的学生都是知道它的,有89%的学生使用过ChatGPT来帮助他们完成家庭作业。所以你们的同学和身边的人都会使用这些AI工具吗?

陈浩楠:我感觉我身边应该没有人不用,包括工作上的和各种朋友们。因为我有一些课是跟MBA的同学一块上的,我发现这些MBA同学他们也尝试去使用这个工具,但他们其实不太知道怎么去写好一个Prompt。所以他们可能的使用的效率就没有像泰羽、曜诚这种就AI Native的学生使用效率这么高。

泓君:可以举几个例子吗?

陈浩楠:当时我是选修了一个MBA和EMBA的课,叫Generative AI for Business。跟我一起上课的基本都是30岁以上的美国这边公司的高管。我们的最后一个项目是需要拿AI完全去帮你生成一个商业的计划书,包括你这个PPT。

对于他们来说,首先AI等于GPT,他们不知道除了GPT之外,别的AI的工具。另外他们的Prompt是非常的直觉的,就是说“OK,我要写商业计划书,这是我的结构,你帮我生成。”他不会说想着去用一些,比如说Few-shot这样的一些技巧,或者再告诉他角色,比如“你现在是一个麦肯锡的咨询师,你来帮我做这个规划”。他的Prompt会比较简短、比较直接,所以他们的最后的东西也比较——不能说效果不好,只能说不够丰富。

而且他们因为不知道其他的AI工具,没法做一个很好的一个协同。比如说我们做这个PPT的时候,我们可以让GPT先生成一个markdown格式,然后再喂给Gamma,或者别的生成AI PPT的工具。然后我们还有Suno或者Udio去生成这个公司广告歌。这样就会变得很丰富、很有意思。但对于他们来说,这方面还要再补足。


来源:velvetech.com

泓君:最后效果有多大差别?

陈浩楠:我记得我们做展示的时候,播到广告歌,所有人本来都低头看手机,到听我们的广告歌时都抬头了,我觉得效果还挺好。

泓君:你觉得实质的内容上呢?其实我理解所有的广告歌,包括你的展现,它是会让形式更好看的。当然形式好看一定是有用的。但时商业计划书,我们看的就是能不能吸引到钱跟投资。所以在最击中人的核心的idea上,你觉得区别大吗?

陈浩楠:因为大家做的这个idea都不太一样,所以没法说它的区别。但只能说从它的一个逻辑性和完整性来讲的话,如果Prompt写得好的话是会更好。比如说我可以说“你先给我生成一个市场规模的计算结果,然后你的每个步骤、你的引用源是什么。”再加上网络搜索或者别的功能在里边,就能做到更真。



03

再也写不出的顶级论文



泓君:在学校或者你们的学科老师中间,每个人都是接受AI的吗?还是说会有老师非常强烈地反对你们用GPT去写文章?

侯泰羽:我有一门是AI主题的课,这个课名字叫做《AI and its Discontent》,讲了从古至今AI的整个发展历史。最早有到公元前370年,柏拉图写的一些书,最新有提到《Attention is All You Need》,李飞飞的Large Scale 和 ImageNet。这门课的大标题叫《Text and Its Idea》,也就是说我们要通过读这些text(文本)生成我们自己的idea(观点)。

虽然这是关于的AI课,但老师说你们绝对不可以用AI来生成论文。因为他说这会让你丧失掉自己的批判性思考能力。因为在你写作的时候是非常沉浸的,也是非常冷静的,很理性地在思考每一个字该怎么被写出来,以及下一个字该怎么被生成。

这个老师拒绝我们使用AI,是因为他想让我们更加冷静地、理性地去思考每个字该怎么被写出来,以及整个文章该怎么被结构化。如果你用了AI的话,它直接帮助你跳过这个步骤,其实你没有学到什么东西。

所以这是当时我上AI课的是很反直觉的一个事情。不过这位老师还是很鼓励我们通过AI去收集信息。这也是我认为AI对我最大的一个点。

我觉得不管什么工具,从古至今都是在帮助人类降低信息获取的难度,降低信息上的不确定性,让我们获取到更多样的信息。

泓君:写这门课的论文你觉得难受吗?因为你要自己写。

侯泰羽:倒还好。另一个跟AI写作业相关的故事是,我曾经去康奈尔的法学院学过一门国际人权法。当时我们要写一些给联合国的影子报告,还有写一些针对这个案件的分析细节。

因为法律是非常的理性的,是非常具有逻辑性的,包括一点点创造性。我曾经在一两年前年回顾我那篇论文,那篇论文拿了A,但是我觉得我很难再写出来那样水平的论文。因为当时逻辑性是我现在不具有的,但增强了更多的创造性,就是我的发散性思维变得更多了。



来源:discovery.org

其实我们这个时代更多人跟机器交互的窗口更多是通过Prompt,也就是说问对一个好的问题,其实你的好奇心是在增加,但你可能需要在更冷静的情况下,在你离开AI的情况下,获取更多的理性,获取更多的推理能力。

泓君:逻辑性减弱了,创造性增强了,是这个意思吗?

侯泰羽:是的,比如当时我的一些切入点,我现在有更多新的思考。当然也得益于我这些年知识的积累。但同时,因为那篇论文非常需要有逻辑性,就是你需要去引用不同的法律的条款。但我不确定自己能不能找得那么精准,以及能不能把这个文章如此结构化地重现出来。

泓君:现在写论文其实也是需要非常好的结构的。

侯泰羽:另外我还有一门课是每一个国际学生都要上的,叫做International Writing Workshop,这门课也是绝对不可以用AI的。

如果你用AI好像等于白上了,因为你都根本不知道怎么写作。比如说,你要知道怎么去不作弊的情况下,就不犯这个抄袭这种危险的情况下,你去怎么做好引用。每一段该怎么写,你要怎么去很好地说明白一个论点,怎么去说明白一个反论点,怎么去回应作者的这个观点等。

这些是我觉得人类,或者说作为学生来讲,要基本掌握的一些基础技能。

泓君:所以你还是赞成在很多时候我们是不能使用AI工具的?因为一些底层能力的培养,有的时候是需要你从这个工具里面抽离出来的。

侯泰羽:其实我会更愿意去更多地拥抱AI工具。甚至,我觉得应该在生活中的每个细节都用AI工具。

泓君:那这两门课呢?

侯泰羽:因为当时我上workshop时候,GPT好像才3.5,所以没有特别多地使用。但我觉得这两门课,你是很难用AI帮助你的。因为我们除了写论文,你还要现场展示自己为什么这么写的,你要知道里面的所有细节。除非你愿意再花一些功夫重新读一遍这个AI生成的论文,然后你再知道所有细节,那这样等于你也写完了一遍。我觉得这些基础课程是需要你自己不用AI工具的。

但是回到刚才那个点,我觉得因为AI是生成式的,所以里面就会有很多幻觉。所以其实平时在我使用GPT的同时,我会用很多的AI搜索工具,帮助减少或者降低幻觉。比如说国外的Perplexity,比如说国内的秘塔搜索,它们分别在英文和中文的语料上有很强的功底。因为它有一个很好的功能,有点像咱们写论文的时候,可以看行间的引用,比如这段话是从哪篇文章里来的,让信息具有可溯源性。

04

用完AI搜索,传统搜索引擎比重下降80%

泓君:那接下来请大家讲一讲都使用过哪些AI搜索类工具。

侯泰羽:我第一个用的AI搜索的工具是Perplexity,它基于了一种技术叫RAG,但当时我不知道这个技术。我当时用Perplexity是为了我知道它可以去索引,并且它可以有一个叫做embedded link(嵌入式链接),在每一个结果后面我可以知道这个来源是从哪里来的,让我很有安全感。所以当时我就用这来减少GPT或者Claude给我的这种乱说话的幻觉。

但后来我发现,Perplexity其实在中文检索上效果不是特别好,所以我就开始探索一些中国的AI搜索软件。比如说秘塔搜索,可能是我目前看到做得非常好的一款产品。

首先,他们提供的来源的引用数非常高。可能我搜索某一个问题、搜索每一个topic,如果我点开它的研究功能,它分成很多的模块,比如说普通的搜索,或者是深度或者是学术研究的搜索。单个问题能给到五六十或者六七十个来源,然后它能够给你自动地生成一些追问的问题,帮助你去发展性思考这个问题。

其次,Perplexity它只会给你问题,但是秘塔搜索还会直接帮你把那答案写出来。所以其实就是增加了用户的“爽感”。我能够一口气看到非常多很有意思的内容,然后再找到另外一个切入点再继续往下深挖。

我觉得AI搜索和大模型的结合其实是一个非常好的组合拳。你可以用大模型帮助你把一些杂乱的语言做好整理。


来源:techritual



泓君:还有哪些AI搜索产品是做得比较好的?

侯泰羽:我个人非常喜欢一些很奇特的AI搜索软件,比如Flowith,它也是国内的软件,这款软件支持拖拽式操作,搜索完成后,信息会以树状结构延展,直观呈现知识的流动过程。我主要用它来进行知识的可视化整理,尽管它的功能远不止于此。



来源:flowith



还有Exa.ai,这个搜索软件比较特殊,因为它不是给人用的,它是给AI用的。它旁边有个分类栏,它可以让你去分类,输入一个query之后,只出来PDF、网页或者公司信息。所以它也被称之为“AI搜索的中间层”。那国内有一个一样的公司叫博查,他们俩都是AI搜索的中间层。

我个人就是用下来,可能对于我来说就是秘塔搜索,因为它的知识量很高,中文的语料上面是表现非常好。同时其实我更看重的是,它能够找到多么特殊的数据库。比如说秘塔搜索可以搜到很多学术网站上的文章。

泓君:所以还是后面的这个搜索来源跟数据源才是最重要的?因为你如果纯纯依靠大模型内部自己的知识,其实是会有很多幻觉的,这也是为什么大家要用AI搜索。所以你觉得它好用,核心是因为它有好的数据库?

侯泰羽:对,它能够搜到很好的数据库、很好的数据来源。它会把它具体搜索的某一个点的学术文献的引用源的那一句话直接给引出来,就是如果你要去找引用源的话,它会引出来,然后它也会`标清楚从哪引用的。

其实让我想到,因为我们学术课上教给我们一个原则,就是以前没有AI搜索时候,我们怎么判断搜索出来的结果你该不该用,叫做CRAAP原则,它分为5个部分:

C就是时效性,比如你看一个来源,它是不是最新的。

R就是Relevance,相关度,跟你这个query是不是高度相关的。

第一个A是Authority,就是权威性,是不是来自于非常权威的数据库。

另外一个A是Accuracy,是不是很精准地回答这个问题,是不是准确地在分解这个问题。

最后是Purpose,就是你本搜索的目的是什么、你的意图是什么。比如说是需要官网寻址,比如说我要搜“硅谷101”在百度上或者在Google上,我就想直接跳到小宇宙或者跳到喜马拉雅我们的官网里面,不是让它大段的讲这个东西的历史。但如果我在搜“那如何去写好某段什么爬虫或者某段脚本”,那其实我需要是大段告诉我怎么写这个代码。

这能够帮助我在进行查询前进行初步判断,从而选择合适的搜索方法。同时我也把这个原则应用在了我拿到AI搜索结果之后的判断,因为其实Perplexity里面也有挺多幻觉的。

泓君: 你现在用了这些工具以后还会用Google搜索或者百度搜索吗?比例会下降多少?

侯泰羽:下降蛮多的,下降可能得有百分之七八十。

泓君:如果有一天,Google和百度将AI产品放到页面右侧,呈现AI生成的答案,而左侧仍是传统网页链接,那么相比秘塔和Perplexity这样的产品,你觉得它们会有竞争力吗?哪一方对你的吸引力更大?

侯泰羽:本质上,AI搜索只是一个壳工具,一端接入大语言模型的API,另一端接入Google或必应的API。对于用户来说,我们往往对某些产品已经形成了使用习惯和依赖。我更在意的不是答案出现在什么位置,而是它是否足够精准、够不够高效,能否真正回答我的问题。



来源:cyber-duck.co.uk

泓君: 所以其实两个结果都展示对你来说不一定是加分项,你最终看的还是精准性跟效果。大家还有别的常用应用吗?

王冉:我觉得我在工作中,可能用得最多的还是Cursor,就是写代码的工具。之前在VS Code里面的Copilot,它已经做得挺好的了。但是在Cursor的这个时代的话,它是从辅助写代码变成了完全的交给它去写代码的过程。

我开始并不是很相信它的结果的,但是我用了几次之后被它折服了。因为不管是结果的可用性,还是它的准确性,都是非常高的。特别是当我对一个语言完全不懂,比如我想写一个前端的iOS APP,如果我是完全不了解的话,我肯定要从头开始学一门课程。但是如果有Cursor,就可以帮助我从0开始。我大概用两个小时,我告诉它我的需求,告诉它我想做成什么样子的,它完全可以生成一个可用的demo,相当于是快速验证我的想法,这个过程非常的impressive。

泓君:所以这是不是说我这样不会编程的人也可以去写代码?

王冉:用上Cursor这类工具,完全没有问题。如果是更加复杂的功能的话,比如我们想开发一些新的算法,可能涉及一些前沿突破的话,肯定还是需要一些更加艰深的一些工具。但是如果说一些在工业界已经常用的一些功能,是完全没有问题。

泓君:它比Copilot更前沿的地方在于它更加自动化?

王冉:从效果上来看的话,它是相比Copilot不同点在于说,Copilot可能还要自己去敲代码,它会给一些推荐,就是选择推荐的结果。Cursor可以达到的效果是用自然语言提要求,它可以生成一个代码库。它不是一个文件,而是一整个文件与系统,这文件系统都可以实现一个完整的功能,比如说网页的各种调用,它实际上需要有素材,需要有前端的这些代码,它都可以在一个文件夹里完整地生成出来,相当于完整的项目库。



05

AI陪伴:情感疗愈和沉浸互动的分化路径



泓君:浩楠你要不要跟大家讲一下你之前用过的AI陪伴类的工具?

陈浩楠:AI陪伴这个赛道,我觉得可以分为两类产品。

一种是严肃陪伴类的,一般就是跟你聊天,比如说有一个比较好的模型叫派(Pi),它是用Infection AI做的。它就是一个对于情感的理解、表达比较准确的一个AI。它有一个语音的功能,包括其实我很多同学也会用这种ChatGPT去做情感疏导,因为GPT永远是非常公正、非常冷静,同时还能给一些情绪价值和这种实用的建议。严肃类的还有一些心理治疗类的一些AI工具,比如说Wysa,它可能是一半是我跟你对话,一半它能结合一些认知行为疗法的一些东西去帮你进行,比如说告诉你“这时候你应该冥想了,我给你提供一个冥想的一个6分钟的音乐”,或者告诉你“这时候你应该这个正念了,你应该往什么方向去想”。

泓君: 那么非严肃类产品呢?

陈浩楠:非严肃的陪伴产品更偏向于陪聊或者谈恋爱,像星野、Talkie、逗逗这些。可以自己捏,包括Character.AI,还有Replika,都是你可以捏你的角色,你可以进行互动。它可能有些背景故事,然后你通过完成任务,加强亲密值,解锁你们互动的一些内容。


来源:bestaito.com

比较典型的就是Character.AI,然后还有Talkie。比较相似的地方都是跟这种虚拟人物的对话,而这种对话可以包含一些软色情或者谈恋爱的一个内容。

Character.AI不光是对话,可能会有一些场景的描写,帮你更现实更有体验感一点。Talkie可能对于每个角色有它一个背景故事,然后帮助这个角色在背景故事里,相当于你帮一个NPC走完一个任务,这样让用户觉得这个人更真实,有更强的一个沉浸感。然后这个人如果再跟你谈恋爱的话,带给用户那种情绪的反馈要更好一点。

还有一个我自己特别喜欢的一个产品,叫逗逗游戏伙伴,开发者是心影随行。它类似于一个AI桌宠,有一个虚拟卡通小人在边上。你能拿鼠标去摸它的头,去戳它的腰,它会给你一些类似的反馈。同时你能把它当成你的朋友,就跟它说“我今天中午吃了碗面,贼好吃。”它可能第二天就问你“昨天那面好不好吃?”它能记住你的话,跟你做一些互动。同时它还有一些陪玩的一些功能,比如说你在打《原神》网页版的时候,它能根据你的屏幕的地方去给你调一些教程,或者去评论你打得好不好,这样就还挺有意思的。


来源:doudou.fun



泓君:为什么Talkie的出海可以做得很好?

陈浩楠:我认为一个重要的区别在于,Character.AI允许用户自行构建Chatbot,平台上的大多数Chatbot也是用户创建的。这其实会受到用户构建水平的影响,导致体验质量参差不齐。

而Talkie在这一点上则不同,平台内有许多由官方团队精心打造的高质量虚拟角色。此外,Talkie还与一些大IP展开合作,比如国内的rapper糯米,他曾与Talkie联手,在平台上推出了以他为原型的虚拟IP,使用他特有的语气和语言风格与用户互动。这种官方定制和IP联名的方式,显著提升了角色的真实性与代入感,也为用户带来了更一致且沉浸式的体验。

泓君:就是说它在产品的构建上其实给用户的选择更小,但是我帮你构建的这个底层更好、更扎实,比用户自己要构建的好。他是帮用户省了一步。

陈浩楠:对的,但是用户也可以去进行构建,所以没有说用户这方面就使用空间会小,但是它底层确实更扎实。另外一方面,我觉得是对于这个人物的一个塑造上,Talkie更到位。比如说我可能是一个富二代吸血鬼,他的一个长相、家世、国家、家族的一个背景,他比如说现在面临的一些人生的选择,然后用户去跟他进行交互,会觉得这更像一个人,那种游戏感会更强一点。

泓君:那在你真实的玩这些游戏的过程中,黄色跟暴力也是他们吸引用户的一个点吗?

陈浩楠:我觉得软色情算是很大的一个部分。不过这些角色对于我来说,并不是一个完全作为伙伴的存在,因为我现实中有很多好朋友。如果我谈恋爱了,可能还会有女朋友。所以在这方面的需求能通过真人去进行满足,而这些游戏更多是满足真人满足不了的幻想。

泓君:你会沉迷在那些角色里吗?还是你觉得它很难让你产生用户粘性?

陈浩楠:对于我来说,是的。但是我看了很多这方面的用户调研,包括会接受到一些一手的用户访谈,那些具有心理疾病或者比较内向的人,他们对于这些产品的使用是非常深度的。最深的其实就是刚步入青春期,对爱情有一些幻想,但是还没有机会去谈恋爱的一些小男生、小女生们。

泓君:他们的用户群有什么不一样?

陈浩楠:我觉得看商业化成绩的话,肯定是Talkie更好,毕竟这个去年是几千万美元的ARR。用户的画像的话,我觉得Talkie的画像可能没有Character.AI那么二次元,因为Character.AI主要用户还是这种二次元的爱好者,因为它上面能构建一些二次元角色。但是Talkie上面不仅有这些,还有一些虚构的角色,还有包括真人的IP在上面。

泓君:你觉得现在做一个AI陪伴类的工具类产品还有机会吗?


来源:love.qq.com

陈浩楠:我觉得是很有机会、很有市场的。但是我觉得有几个点,就可能用户最看重的。

首先是它交互的一个有趣性。你比如说我是不是只能文字交互,还是说我能跟你有一些鼠标以及图案那些交互,然后我能不能有些视频、语音的交互,这个是用户最看重的一部分。之前是腾讯的《光与夜之恋》就大爆特爆,因为它有一个功能就是能让角色主动给用户打电话,然后这个功能是被我很多身边玩这个游戏的同学都大大称赞,他们觉得这个很有意思。

第二还是要把自己的定位做好。比如说你是想更偏向短期高多巴胺的陪伴,还是说这种长期更偏幸福感的一种陪伴?我觉得这个两个定位是很不一样的。

短期多巴胺的陪伴就更偏向于性欲,长期幸福感的陪伴更偏向于亲情,就是你是要把你的产品做得很浓,还是可能比较淡一点。我觉得这是一个定位上很大的不同的选择。

泓君:你觉得未来他们面临的道德困境,或者说它的灰色区域,会是这些产品一个潜在的风险点吗?

陈浩楠:我其实之前注意到一个案子,是我自己比较关注的。有个男生在使用Character.AI之后,被Character.AI去教唆自杀了。我其实也担心说你怎么在不给你的Chatbot那么大限制的基础上,避免这种事情去发生,包括怎么样避免用户非常沉迷这个东西,影响现实生活。我觉得这是他们要研究的一个重点。


06

AI是人类的平均值吗?

泓君:你们每天大概有多长时间会在AI软件上?

侯泰羽:我没有数,但我觉得大概5到6个小时。

泓君:这个比例相当高了。

陈浩楠:如果是期末周,我每天可能会使用四五个小时甚至五六个小时,因为需要它不断地帮我推导公式、编写程序等任务。

而在平时没有考试的时候,使用时间通常只有一到两个小时,主要是在读论文或者想深入了解某些新鲜资讯时才会用到。至于搜索工具方面,由于我已经不用抖音和快手,所以目前只使用Perplexity来进行搜索。

泓君:你不用Google吗?

陈浩楠:因为我觉得用Google的话,大部分情况是你不知道这个东西是什么样,你想有一个全局的了解。可能因为我现在刚毕业,包括我想从事的领域比较集中,我知道我的问题关键是什么,然后把这个问题的关键问给Perplexity,它能给我一些比较好的一个回答,包括这个引用的一个链接。然后可能会对这个引用的链接再去进行一个自己的页面排序,再接着进行检索。

王冉:我觉得ChatGPT对我粘性比较大的一点是,它能够记住我所有的历史记录。我跟它所有的对话它都能够记住,能够比较深刻地了解我这个人。

之前有一段特别火的一个Prompt叫做“请告诉我一个我不知道的关于我自己的事情”。我试了一下,当然它回答的第一个问题,并没有超越我自己的一些认知。但是我反复地挑战它之后,它确实是提到一些我可能确实没有发现的关于我的一些细节点。

左曜诚:我的三位伙伴他们说的真的都很有深度,尤其是我作为一个学哲学的学生,我其实在这方面挺羞愧的。我并没有真的用ChatGPT讨论过一些比较高深的问题,可能是因为在我的观念里面,它真的只是一个工具,它并不是真的有自己的意识或者有自己的智能。所以说我并不会想跟它像我跟另外一个个人这样对话。但是我觉得听了这三位的启发之后,我会种草,我会很想去和它讨论一些更哲学方面的问题,比如人生存在的意义这些问题。

侯泰羽:我理解你之前把AI当成一种工具,觉得它没有意识。但AI的整个训练的语调库其实是人类文明的一种集合,或者说它是一种平均值。比如说你让它生成一段话,或者让它生成一个图片,它其实都是取里面的一个平均值。

Hito Steyerl写了一本书叫《Mean Images》。当现在这种MidJourney来生成图片的时候,它其实给出来的,是你整个大众审美中的一个平均值。我觉得你可以把它当成类似于你在跟人类文明的平均值的对话,我觉得会挺有意思的。



来源:downloadsource.net

泓君:ChatGPT产出的作品,它到底是人类的平均值,还是超过某一个领域最顶级的人?比如说AlphaGo,它其实就是超越了这个领域里面最顶级的人。我一直在想AI到底要达到哪个程度,才算是能帮助生产力的提高。根据大家刚刚的回答,它就必然要超过平均值。因为大家在专业的领域里面想做工具、想做最好的事情,你就需要不停地去超越,而不是维持在一个平均水准。

侯泰羽:是的,因为现在也有人在讲,AI往后发展最难的一个问题或者最高的一座山就是科学创新。到底能不能帮助像王冉哥在科研界真正实现一些科技成果上,或者说科研想法上的创新。这个其实我挺想听听王冉哥的想法。

王冉:对,其实我一直期待这个东西。GPT-o1出了之后,我就想尝试拿它来试一下,它说它达到了博士的水平。但是作为科研创新来说,可能更加重要的是提出问题的能力。

泓君:写Prompt词算提出问题的能力吗?

王冉:除非AI可以自己去写出一个非常好的研究的Prompt,或者说对于整个的学术和人类科技发展的洞察。我觉得目前来说AI还做不到。但是如果能做到的话,我觉得很多科技创新其实就已经是一个完全新的时代了。科研这件事情就不再是一个体力活。


推荐阅读