Skip to content

借助世界上最大的单体中文NLP大模型,我们做出了一个可以跟人类玩“剧本杀”的AI……

License

Notifications You must be signed in to change notification settings

bigbrother666sh/shezhangbujianle

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

87 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

update

目前大家可以通过扫码添加虚拟人阿瓦达啃大瓜🍉,体验最新的AI soul效果。

很开心过了这么长时间,这个项目还能持续受到大家关注。上海疫情封控开始后,我转而尝试应用该类型技术支持疫情封控下的居委会志愿者;封控结束后,我和一些小伙伴继续致力于尝试应用相关技术在基层政务治理方面,几个月来这几乎耗费了我全部的业余时间(因为白天还要上班搬砖……) ,所以很长一段时间以来我也没时间更新这个repo,也再未开放体验活动。因此,请大家暂时不要添加这个机器人账号了。

🔥🔥🔥 【2024.4.24】

感谢大家的关注,全新的Awada项目已经立项,致力于打造拥有目的意识和类人脑自主决策能力的bot,详见 Awada Github Repo


借助世界上最大的单体中文NLP大模型—— 浪潮 源1.0 ,我们做出了一个可以跟人类玩“剧本杀”的AI……

核心创意与演示

我们为本项目特别改编了一个微型线上剧本杀剧本,本子有五个角色,分别由五名玩家扮演,但我们每场只会召集四个玩家,并在他们不知情的情况下,派出AI扮演剩下的那个角色。

玩家无需下载客户端或者打开网页,直接使用微信就能玩( 感谢神器 Wechaty )。

本着细节拉满的原则,我们也为AI准备了一个微信账号,并精心为她设定了昵称和头像,甚至每场游戏前我们还会紧扣时事的为她准备近三天的朋友圈内容,而游戏后还会继续连发三天朋友圈内容提供延展剧情(非常类似"规则怪谈")。

img img

整体剧情并不复杂,讲的是某高校社团中五个骨干成员因为一件事情牵涉到各自利益而产生的种种勾心斗角。玩家要做的也非常简单,就是想方设法、拉帮结派的说服其他人接受自己的主张……不过我们这次对原作做了比较大的改动,剧作中AI所扮演的角色(蔡晓)受控于某邪恶的科技巨头(“北极鹅”公司), 她要帮助“北极鹅”实行一个庞大的阴谋,而这个阴谋其实笼罩了所有人……坦率的说,从游戏角度,这个角色的难度还挺高,承担着推动剧情的作用,并且游戏机制设定最后所有的疑点矛头都会指向她,如果在现实的剧本杀游戏中,这个角色也应该是由DM扮演,而非普通玩家,当然这也就大大增加了对AI的考验。

下面四幅图展示了AI的实际表现效果(游戏中会要求玩家更改群昵称,而这里为了保护玩家隐私,也为了方便大家理解,我们直接把玩家的微信昵称备注为了角色名)。

谭明VS蔡晓(AI)

剧情中谭明为了实现自己的目的,不择手段的策划了一个诡计,并计划私下与蔡晓达成联盟,然而他不知道的是蔡晓其实在下一盘更大的棋,正想借他的诡计实现自己的阴谋……所以AI对谭明的策略就是可劲儿的忽悠他并想方设法利用他。 实际表现中,AI很好的贯彻了这个思路,甚至发挥想象力的使用了色诱绝技……坦率的讲,这招也极大的超出了我们的预料……

img

孔墨VS蔡晓(AI)

剧情中孔墨的任务是调查真相,这个角色的玩家需要主动出击找其他玩家尽可能多了解情况,但有的时候会碰到比较内向的玩家。这种情况下我们会利用"导演机制"先主动发起一轮对话, 可以看到AI在这种情况下能够很好的在后续轮次中进行线索"暗示",起到推动剧情的作用。

img

李超VS蔡晓(AI)

剧情中的李超跟AI所扮演的蔡晓持有完全相反的立场,所以蔡晓需要说服李超,同时在一些事情上对其进行隐瞒……

img

孙若VS蔡晓(AI)

剧情中孙若是一个比较复杂的角色,他(她,这个角色不限定性别)其实也跟蔡晓一样被改造为了"AI人",但是他(她)自己却并不知道,并且延伸剧情的谜底也在这个人物身上。所以AI与孙若之间的对话需要体现一定的"深度",不能不说,但也不能全说。 最终效果如何,大家自己看吧~

img

蔡晓(AI)在公聊(房间)

最后放一段编导组与AI的毕业群聊画面,大家再整体感受下。:smile:

img

从剧情角度,AI对孙若的最后一句话充满了深意……当然,从技术角度,我更相信这只是巧合,然而这恰是本作好玩的地方之一——AI的不确定性会极大丰富原有剧情。

核心功能——“目的性对话”端到端生成方案

“剧本杀”是一种用户与用户之间博弈的游戏,玩家之间的对话可能更是无穷无尽,这种情况下使得传统的规则式或“词槽式目的域对话”方案均行不通,当然无目标导向的“开放域对话“就更不适合了。

本项目所使用的NLP大模型——浪潮源1.0是一种生成式预训练模型(GPT),其使用的模型结构是Language Model(LM),类似于openAI的GPT-3,但是与GPT-3不同,源1.0更加擅长的是零样本(Zero-Shot)和小样本(Few-Shot)学习,而非目前更多模型所擅长的微调试学习(finetune)。从实际应用效果来看也确实如此,在2~ 3个,甚至1个合适example的示范下,模型可以很好的理解我们希望实现的“对话策略”,仿佛具有“举一反三”的能力,但是如果没有example的话,那么模型的生成则非常不靠谱,甚至会出现答非所问的情况。因此,本项目的关键就在于如何针对用户的提问选择适当的example供给模型。

我们最终采取的方案是:建立example语料库,然后针对每次提问从语料库中选择最贴近的三个example作为模型生成的few-shot输入。

实际实现中,因为AI需要根据剧情对不同角色采用不同而回答策略,所以语料库被分装成4个TXT文件,程序会根据提问者去对应选择语料来源。这个机制的思路很简单,但是执行起来马上遇到的一个问题就是,如何从对应语料中抽取与当前提问最为相似的example?因为在实际游戏中, 玩家可能的提问措辞是无穷 无尽的。在这里我们用到了百度飞桨@PaddlePaddle 发布的预训练模型—— simnet_bow ,它能够自动计算短语相似度,基于百度海量搜索数据预训练,实际应用下来效果非常不错,且运算速度快,显存占用低。这里不得不特别表扬下百度飞桨,尤其是其中的预训练模型开放库paddlehub,里面有不少非常实用的“小模型”,均可“开箱即用”。

解决了抽取合适example的问题之后,接下来就是合并example和用户当前提问文本生成prompt。玩过GPT类大模型的都知道,这类模型生成的本质是续写,Prompt兼有任务类型提示和提供续写开头的作用,机器不像人,同样的意思不同的Prompt写法可能导致差距十万八千里的生成结果, 盘古大模型群里有网友甚至说,他感觉GPT-3的prompt书写本身就相当于一门编程语言了……不过这次浪潮团队的技术支持可谓“暖男级”贴心,针对prompt生成、request提交以及reply查询,团队都给出了详细的、质量极高的范本代码(可以说也是我见过的大模型开源项目中给到的质量最高的示例代码), 好到什么程度呢?这么说吧,好到了我们直接拿来用的程度 😂……事实上,本项目代码库中的__init__.py、inspurai.py、url_config.py这三个文件都直接来自 浪潮的开源代码

至此所有的工程问题已经基本都解决了,剩下的就是语料来源问题,但这其实也是最核心的问题之一。GPT类大模型生成本质是根据词和词的语言学关联关系进行续写,它是不具有人类一样的逻辑能力的,即我们无法明确告知它在何种情况下应该采用何种对话策略,或者该往哪个方向去引导, 在本项目中这一切都得靠example进行“提醒”。打个不恰当的比方,AI相当于天资聪慧的张无忌,但是如果他碰到的不是世外高人,而都是你我这样的凡夫俗子,每天给他演示的就是如何上班摸鱼、上课溜号这些,它是绝无可能练出九阳神功的…… 源1.0模型也是这样,虽然它背了5.02TB的中文数据,差不多相当于500多万本书了,但是它完全不懂城市的套路啊,也没玩过剧本杀,它能做的就是模拟和有样学样……所以这个AI在游戏中的表现就直接取决于我们给它的example如何。

对于这个问题,团队最终采取了一个非常简单粗暴的方案:编导组除主编外每人负责一个角色(刚好四人),自己没事儿就假装在玩这个游戏,想象看会跟AI提什么问题,然后再切换到AI的角度,思考合适的回答……初始语料文件好了之后,大家交换角色进行体验,每次体验后更新各自负责的语料库文件; 之后公测也是一样,每轮之后编导组都会根据当场AI回答得比较差的问题进行语料库的完善和补充……为此我们在程序中增加了一个功能:程序会把本场用户的每次提问,以及对应抽取出的三个example问题的simnet_bow相似度得分,并源1.0最终生成的回答文本,按语料库对应另存为4个文本文件, 以便于编导们针对性更新语料库(本项目目前开源提供的语料库是截止3轮公测后的版本)。

【update】

不过囿于人力等因素限制,本项目现阶段的example语料库还是比较"单薄"的,还存在很大的填充空间。在目前体量的语料库支撑下,公测中大部分对话问题的simnet_bow相似度得分都在0.7~0.8,而实际上0.85以上得分才是意思比较相近的两句话。 ,且simnet_bow计算出的相似度也有一定概率是不准的,即两个短语相似度得分达到0.9以上了,但实际上意思还是差的比较远的。

所以为了能够获得更好的回复效果,就可能需要更加丰富、颗粒度更加细腻的语料,这就需要编导能够预设更多问题,对于持续运营的项目而言,可能建立常态化的语料文件维护机制是必要的。

另外对于要求回复比较固定的问题,比如人物的性别、姓名这些,最好可以以不同的提问措辞冗余准备3~5组问答example。这倒不是说源大模型或者simnet_bow没有"举一反三"的能力,而是我们发现在实践中,one-shot情况下,模型仅能get回答的范围,而无法保证 严格遵守example的答案设定。举个例子,example为:"Q:你的性别 A:女生",用户提问为"你是男生还是女生啊?",在仅提供这一条example的情况下,模型既可能回答"男生",也可能回答"女生",甚至回答"你猜",但不会回答"我是人"这种…… 如果给定三条example的话,并且example 的答案都是"女生",那么模型绝大部分情况下都会生成"女生"……

另外,对于答案要求唯一的对话内容,甚至也可以考虑直接程序写死,或者采用传统的NLU方式提取关键词,匹配词槽的方案。

最后,我们在源升级版dialog模型的应用中还发现,对于zero-shot生成,如果用户问题是"好"、"好的"这类比较无意义的提问,源有一定的概率会给出"帮您安排退款"、"请您下单"……之类的回复(同样的情况在wudao的Eva中也有),这可能是 中文大模型的训练语料来源确实比英文要局限很多的原因所造成的,所以我们建议,可以针对这类无意义提问程序上设定不生成回复,或者进行固定格式的回复。

总之,对于"目的型对话",因为其具体要求远远大于开放域对话,所以虽然可以采用基于大模型的端到端方案作为主体,但也要综合混用其他方案。另外会非常依赖example语料的质量和丰富度,这方面的心得体会请见下文第四部分。

记忆机制

本来这个项目一开始是不打算引入记忆机制的,因为我们看源1.0在合适example的few-shot下生成效果已经很不错了,但在之后的测试中我们发现,会有用户习惯先提问再@AI回答,或者私聊中先发一句问题,然后再另发一句"你对这个问题的看法?";另外我们也发现AI如果不记忆自己之前答案的话, 后续生成的结果会比较缺乏连续性,甚至给出前后矛盾的回答!这些问题迫使我们决定增加"多轮对话记忆机制"。

原理很简单,就是把之前若干轮次用户与AI的对话存在一个列表里面,然后提交生成的时候把这个列表和当前问题文本join一下,当然具体实施的时候,我们需要调整下提交的pre-fix和输出的pre-fix这些…… 实践发现增加记忆机制后,AI因为生成依据变多,明显弥补了其逻辑能力的短板,如下图是我们的一段测试对话,AI表现出了一定"逻辑推理能力":

img

【update】 但在随后的应用中,我们发现:不管我们设定程序记忆几轮对话,貌似 起作用比较大的只有最后一轮,如下图

img

从右到左分别是让程序只记忆最后一轮对话、记忆过去两轮对话以及单边记忆过去四轮对话(只记忆用户提问,不记忆自己的回答),可见三个模式下,程序都能对第一次反转产生很好的应答,但对于第二次反转就无能为力了……

另外我们还发现,对于example语料匹配度比较低的提问,过长的记忆机制反而可能让生成效果下降,最典型的情况是造成"重复回答",即AI会在后续轮次的对话中一直重复之前已经说过的话……

其实仔细想想这也不难理解,因为源1.0的API机制其实是把example加到待输入文本前作为最终提交的输入,而我们设计的记忆机制也是把记忆中的文本加到待输入文本前,这样的话,其实是记忆文本和example语料共同对生成结果施加影响, 对于example语料匹配度比较低的提问,example影响力低,那么相对而言过去轮次对话的影响力就高了……所以对于这个问题,终极的解决方案也是尽可能提高example语料库的质量和丰富度

但是如果我们采用单边记忆模式(只记忆用户提问,不记忆自己的回答),虽然对生成效果没有不良影响,但实际场景中,会有大量用户提问是基于AI上一轮回复内容的情况,这个时候单边记忆由于舍弃了回答文本,就无法保证回答的连续性了……

在后续"蔡晓问答"版本程序中(caixiao.py)我们额外增加了一个校验机制,如果生成结果等同于上一轮回答则会让AI重新生成一次……实际应用中,这个机制确实可以一定程度上降低重复回答的发生。而对于用户明确提问"你刚才说啥了"这类的情况,源1.0 在重复几轮生成后,也会生成一个跟原来语句答案非常类似但不完全一样的回答(比如增加或者减少一个标点符号)。

另外,现在源也发布了升级版模型,我们也第一时间升级了新版的对话模型(dialog),有如下2点心得:

1、新版dialog模型增加了不少常识性知识的预训练,所以开放域对话任务的zero-shot效果得到了大幅提高;

2、但记忆机制的效果跟原模型(base-10b)还是一样的,即不管记忆几轮,主要起作用的还是最后一轮。但如果你问它“上上一轮你说的是啥”这样(甚至更遥远),模型大部分时间也能够正确回答(这点倒是很神奇)。

总结来看,开放域对话可以放大记忆轮次,但目的性对话,记忆轮次太多会影响example的效果,导致生成结果更容易偏离预期。

更理想的方案可能需要对记忆机制进行更加复杂的编码,能够自动提取 关键信息(也许seq2seq模型是个好主意?),只记忆关键信息和上一轮对话内容……当然记忆机制本身是一个比较复杂的话题,尤其对于目的性对话任务,所以欢迎大家在这方面与我共同探讨,并探索更加有效的方案!

导演机制

我们还必须澄清一点,现阶段的任何应用你都不能指望AI单独去完成,它依然需要人类的协助,或者监督、或者提示、或者backup……

在本项目上,我们为AI设定的辅助机制就是——导演。他的作用是在出现AI不适用的情况下对AI进行"手动引导",这些情况有一些是游戏机制本身,有一些是因为目前我们采用的wechaty puppet-xp协议限制( 有关wechaty和puppet协议的关系可以查看 wechaty主页 )。

具体而言这些情况包括:

用户注册问题

首先由于目前puppet-xp拿不到用户的群昵称,所以程序无从得知哪个用户对应哪个角色,我们为此设定了一个游戏规则,即用户需要先添加其他用户好友,然后发一句"这是xxx"(角色名),我们会要求用户对所有其他玩家都这样做,这样就不会暴露AI,并且这也确实有必要,因为真人也不能每次都翻看群昵称 来确定发消息的玩家到底扮演的是谁。 但是我们不能保证每个用户都会遵守,所以就需要导演来手动帮助AI完成这个识别。

主动消息发送

项目测试中,我们也发现会出现冷场问题,比如一时间大家都不说话,或者某两个用户聊的火热,而忽略了其他玩家……从玩家角度来说,这是蛮主观的问题,可能我就是不知道该说什么,按程序"一问一答"的设计,这个时候AI也只能等。所以我们设定了主动消息或者说闲聊机制,具体来说就是预设一些问题, 导演账号向AI账号发送特定指令就会触发。

应急消息发送

目前puppet-xp仅能识别文本消息(当然浪潮源1.0目前也只支持text in text out,然而其实多模态的方案目前也不少),我们为此规定玩家必须发文本,这其实已经很限制了。结果测试中我们发现puppet-xp还不支持引用消息,而这在项目实际场景中出现的频率还不低!为此我们不得不针对一些常见问题 预设了回答文本, 当出现无法识别消息的情况,就由导演发送指令指挥AI发送…… 有同学可能会问,你们不能直接用AI登录的微信客户端发送么?答案是——其实也可以,只是这样显得比较"不智能",当然从玩家体验角度,可能这样也不错。只是这里面有一个小细节,你必须通过AI所登录的Windows客户端发送,而不通过同时登录的移动端发送,因为puppet-xp会错误的把多终端同步的信息 当成是对方发来的信息,这样的话,就会引发AI"回复自己的消息"。

话说,我们在预设消息中把AI设定为"神经比较大条"的性格,会不经意间"说漏嘴"一些剧情,所以实际应用下来,应急消息往往会产生比较戏剧性的效果。从作品本身而言,这个机制可能会是一个很好玩的东西,所以对于应急消息我们没有写在程序中,而是通过外部jason文件进行维护,大家可以随时增加。

另外,针对上一轮不好的生成结果有可能影响后续轮次生成的情况,我们也设计了"记忆遗忘机制",导演可以随时让程序遗忘其对某个用户或者群聊的记忆,这也是应急机制的一部分。

流程引导

在用户视角中导演更像是"主持人"的角色,他负责拉群、分配角色等等,而对于AI也是这样,游戏什么时候开始、什么时候结束,这些也是导演通过指令告知程序的。而我们也设计了AI角色在游戏开始和结束时特殊的剧情。

说到这,其实我还是很希望puppet-xp能够再完善一些,可以支持群操作(拉群、解散群、加群)以及朋友圈操作(发送朋友圈、朋友圈留言等),这些都会更加丰富我们的玩法,比如AI可以在游戏中突然给玩家的最近一条朋友圈留言,而留言包含了一些线索,这一定很带劲!

有关导演机制详情,各位可以查看script文件夹下的《导演手册》。

其他一些细节

本项目其他一些细节主要是用户输入文本的预处理。比如,有些用户喜欢输入大段的空格或者频繁换行代替逗号或者句号,这就很容易造成simnet_bow报错,所以我们需要先用re把这些都替换为逗号;另外,上面说到的有些用户习惯先把问题提出再另外发一条只@人的消息,按我们最初的处理方案, 使用正则把@+昵称全部删除,就会产生"空文本",simnet_bow还会报错,最后我们的方案是只去掉@,当然这可能会造成一句话中人名重复,但好在源1.0模型貌似对此的抗干扰能力还不错……

在测试的后期,我们还发现输入文本中如果包含#和&会导致源1.0API报错(issue详见 这里 ), 浪潮团队建议我们进行转义替换,但我们觉得替换为"号"和"和"字可能会更贴近用户的真实意图……

类似的例子还有很多,比如puppet-xp无法识别除微信自带的第一页以外的emoji等等,考虑到出现频率不高,我们也就忽略了,所以稍微懂点技术的朋友,恳请你们测试的时候 千万不要抱着"极限测试"的思想 ,关注AI生成本身就好:smile:

话说100个人就有100种微信使用风格,这也算是本项目使用微信作为UI界面带来的额外挑战吧。

回到作品本身,先有创意还是先有技术?

本项目的初衷是结合NLP大模型和wechaty做一个好玩的东西,这是一个模糊的定义,但我作为项目发起人从一开始就清楚,这至少是一个创意和技术各占50%的事儿……

然而实践中,到底是先有技术还是先有创意却很纠结,如果我们先去做创意的话,那么很可能设计很多不可实现的东西,后期就得改创意;反过来如果从技术出发来考虑,那么做出来的东西一定不好玩,好的技术必然是"对用户不可见的"。最终对于这个问题,我的答案是唯有一起考虑!而这就要求项目主创 必然是懂技术的,所以各位能够在本项目中看到一个有趣的现象——写剧本的人跟写代码的人是同一个!我担心的是,可能随着AI的深化普及,可能python会成为每一个创作者的必备技能,好比现在没有作家不会用word,没有自媒体人不会用视频剪辑软件一样。

而引入AI后,带来的另一个有趣的问题是,本作还是一个"剧本杀"么?

不得不承认,本作最后的呈现与之前我们设想的不一样,或者说很不一样。NLP大模型的生成能力,使得AI可以和用户共同"演绎"出很多新的剧情, 比如下面这段,"谭明"找AI复盘,结果AI告诉他其实他和张家怡(游戏情节人物)是gay!

img

针对这种情况,我们索性也直接在游戏规则中加入了一条:"如果其他人提到了你所不知道的剧情,请相信那只是没有出现在你的剧本中,而非不存在",并且我们也不提供复盘文本,而是鼓励他们互相(自然也包括AI)对信息进行复盘。 在这个复盘过程中,玩家也早晚会发现某个玩家其实是AI(剧情中AI所扮演的角色是一个被植入了AI程序的女大学生,但大部分玩家都会认为这个角色是我们的工作人员假扮的,而他们最后会发现这个账号真的只是一个AI!), 为此,我们准备了相应的延展剧情,在"剧本杀"游戏后1~3天以朋友圈的形式进行发送,这非常类似于 "规则怪谈",而互相私聊复盘的机制以及"共同恐惧"的剧情效果也让本作兼具 陌生人社交 的属性……可以说本作最好玩的部分恰恰是在"剧本杀"游戏结束后才刚开始。

这一切都让本作成为一部 "活着的故事",是一部由玩家和AI在不知不觉中共同创造的故事,我将之称为 "交互式叙事"。(其实这就是我一开始最想实现的形式,但我不知道怎么实现,最后选择了剧本杀模式,但没想到最后我得到的还是我最初所设想的。)

而这种叙事有时也会产生非常感人的随机剧情。

img

本项目中作为每次生成example的语料文件可以说直接决定了AI的表现,因此我们也一并将语料文件进行开源,因为在这种“开发范式”下,这些语料本质上就是代码的一部分。

而本项目中的人类编辑跟AI的关系也更像是"教练员与运动员"的关系,编导组会在每轮测试后根据AI当场表现针对性更新语料,从而提高AI后续的表现。这种人类教练员与AI运动员之间的"迭代合作"模式也是值得探讨的。(相对而言,目前虚拟人普遍的“中之人”做法相当于人类和提线木偶的关系。)

总之,本项目所积累的种种工程方案或可作为一种全新的“目的性对话”解决方案,不仅仅可以应用于娱乐创作,还可以泛化于教育、客服、销售、政务、心理咨询、情感陪护等各领域。

致敬

除综合使用了浪潮源1.0大模型和百度飞桨的paddlehub预训练模型外,本项目涉及到的另一个关键组件是wechaty,这是一个可以几乎无缝对接包括微信在内一众主流IM软件的“神器”, 如果没有它,我们将只能让用户通过某个网页或者APP与AI进行交流,这不仅极大的增加了开发工作量,也大大削弱了实际体验,甚至无法实现我们的关键创意:让AI角色悄无声息的潜入玩家中, 并不知不觉的把所有人笼罩在“细思极恐”中。

wechaty操控微信是通过所谓的“wechaty-puppet”实现的,wechaty社区目前提供多个wechaty-puppet方案,我们这次使用的是完全免费的puppet-xp方案。 这是一个基于Windows微信客户端协议的方案,跟本项目非常适配,我们可以将主程序代码和微信客户端跑在同一台电脑上,部署最省事,然后还完全免费! 好比我写代码时最爱听一首歌在网易云音乐上的热评——又能听林忆莲,又能抖腿,你们还要啥?

不过也不得不说的是,puppet-xp目前的功能实在有限,仅能实现文本信息的收发,这导致了很多限制,甚至留下了一些硬伤,比如上文说到的引用消息问题,以及多端同步信息错误识别问题等…… 好在puppet-xp团队也在不停的升级开发,我们期待后续版本可以在免费的同时提供更多功能支持。现在NLP大模型都有往多模态发展的趋势,text2img甚至text2video都已经在路上,这些如果有朝一日能够与Wechaty结合一定会催生出更多有趣的玩法。

然而在这里,还是要向 @Wechaty 社区致敬!”好用到哭“——你们对得起这个评价! 也向爱写诗的laozhang(puppet-xp作者)致敬!感谢你把这么好的东西无私的奉献了出来!

致敬浪潮源1.0团队、百度飞桨团队,致敬githubcsdn,本项目实现过程中没少在这两个地方抄代码(其实不止本项目了,我想每个程序员都一样吧),总之致敬开源社区,致敬所有开发者

最后向Linus Torvalds表达我由衷的敬佩!尤其当我因为本项目而系统的学习了git和github的历史之后,我更加要表达这种敬佩,这确实是个凭一己之力改变世界的男人!

创作名单

主创&工程&测试导演

大兄弟666 —— Forgive me for having to remain mysterious

编导组成员

李青玲 —— 上海交通大学媒体与传播学院

胡璟葳 —— 华东理工大学艺术设计与传媒学院

赵家宁 —— 上海交通大学媒体与传播学院

翡冷翠的小羊 —— 跟这兄弟网友好多年,从来不知道真名,就更别提其他的了……

编剧指导:韩飞

感谢所有参与公测的同学,希望没有把你吓得太过,虽然这也正是本作的目的之一 😏

特别感谢华东理工大学图书馆的吉久明老师 授予我们原作的改编权,同时还无偿贡献了配套的心理测验题目,通过16道是否题,就可以比较精确的匹配到跟玩家性格特征最贴近的角色,从而让整个游戏的沉浸感更加强烈,个人认为,这倒是每一个剧本杀都值得引入的一个机制。

写在最后的话

做这个项目是有感于去年大热的各种虚拟人,我丝毫不怀疑这个赛道的潜在价值,虽然我们目前还没有办法统一而清晰的定义作为人类最终归宿的“元宇宙”,但有一点是毋庸置疑的,即未来的元宇宙中, 虚拟人数量将数倍于真人,因为只有这样,才能让我们每个人过得比现实世界中更好。然而目前阶段,虚拟人在“好看的皮囊”方面可谓日新月异,然而“有趣的灵魂”方面还都很欠缺, 靠“中之人”驱动毕竟不是长久之策;另一方面,自去年上半年我了解到NLP领域近两年来在生成式预训练大模型方面的长足进展后,也一直想看看基于这种大模型有什么可以实际落地的场景, 就这样,两个不同角度的想法合流成为了本项目的初衷。

最后的最后,我们真心欢迎各路高手和专业人士在本开源项目基础上不断增加新的剧情、新的玩法,也期待更多的中文NLP大模型研究机构移植本项目,如果有一天能够看到各路AI在一起打剧本杀,应该会很有意思!

蔡晓和"北极鹅"的故事并未完结,让我们在这里最后上一张蔡晓的"北极鹅"工卡吧!

img

(作为一个喜欢将细节拉满的团队,这张工卡里面其实隐藏着两个彩蛋,你能找到么?)

About

借助世界上最大的单体中文NLP大模型,我们做出了一个可以跟人类玩“剧本杀”的AI……

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages