降本增效、自由交互的数字员工,360 智脑大模型应用落地实践

2023-09-05
利用AI技术和工具打造数字员工,未来一个人开一家公司也许不是梦想

8月30日,由创业邦主办的2023AIGC技术应用大会在深圳举行。本届大会以“元载万物·智启新界”为主题,旨在聚焦AIGC技术的创新应用,打造深入探索AIGC产业落地的交流平台。

会上,360集团副总裁梁志辉带来了360智脑大模型应用落地实践的最新产品和场景,其中精彩观点如下:

大模型的时代,最容易取代你的并不是AI,而是比你先掌握AI的一些人。

很多企业希望能够充分利用大模型的优势:内容生成、内容理解和逻辑推理。所以我们针对这几个需求,希望把大模型的能力充分发挥在企业最需要的地方。

以下为演讲内容,由创业邦整理:

image.png

01 大模型驱动的数字人将颠覆生产关系

大模型的时代,最容易取代你的并不是AI,而是比你先掌握AI的一些人。

在这过程中我们认为大模型它更接近工业革命,我们相信未来不会只有一个大模型,未来每个公司、每个大企业都会训练自己的大模型。刚才前面有些嘉宾也提到了,其实大模型发展方向是把它做小和做专,我们希望以后能够把大模型能力赋能到百行千业,中小企业和大型企业都能用得上。

在这过程中,企业场景里去落地大模型会遇到什么问题呢?

一方面,作为一个中国企业,你很难用一个美国的ChatGPT。国内虽然也有很多类似的一些产品了。但这类大模型它可能会存在几个问题:一是数据可能会泄漏。二是大模型的幻觉以及知识更新的问题,会让它在很多企业内部无法使用。第三,如果你去建立一个私有的大模型,其实很多训练大模型的数据,它是没办法做分级管理的。

很多企业很难去训练自己的大模型,首先这个资金投入上会很大,并且对很多企业的员工来说比较费时费力。一个企业的IT部门去学会建自己的大模型、训练一个大模型很贵,会训练大模型的工程师更贵,正常来说一台A100,价格大概在150万,但是一个会用A100的工程师至少是两三百万年薪起,这是很多企业很难把大模型落地到自己的内部的原因所在。

目前我们正在积极拥抱大模型加Agent方向的一些能力。我们尝试了很多新的方案,我们的底层不只有一个千亿大模型,我们还会有一些百亿大模型。其中有些百亿大模型专门解决交流对话,有些专门解决文档分析。我们目前已经能够让多个大模型协同工作。在这个大模型之上我们会构建一套AI Agent中间件平台,让绝大部分的用户不用直接用大模型,而是通过一些更友好的、角色代入、数字人的形式去使用,同时让大模型结合外部的信息进行数据学习。360本来也是国内第二大搜索引擎公司,因此们跟搜索上也做了很多的结合,让大模型学会进行一些信息的爬取,让一些API能够接入。

具体到落地场的景,我们就是希望能解决两个问题。第一,对内能够降本增效。第二,能够提升数字人交互的自由度。

先说降本增效。这种既有最强大脑又有最佳外表的数字人能够7×24小时替你工作。我们可以给很多企业产出一些这种对外有互动功能的输出型数字人,例如数字名人、数字客服、数字销售、数字主播等。

在数字人这一块,其实我们今天在很多平台上也看到了一些数字人形象的产品,但他不见得是基于真人。目前来说我们也看到小红书上的一些号,其实它都已经是AI生成的。今天我们希望把这种技术提升到另外一个阶段,我们希望这个人他有最佳的形象,他甚至可以跟你说话,可以做情感陪伴或者甚至可以帮你工作。

在前两年大家谈到的数字人很多都是这种影视级的数字人,比如说什么希加加、柳夜熙。但是这样的数字人有一个很核心的问题,首先它每一分钟的内容生产成本超过10万,在这种场景下你只能把它当成一个拍电影的方式来进行运营,绝大部分企业是用不起来的。

再来说自由交互。现在很火的能做形象客服的数字人,也存在一定的问题。我们跟很多这种终端用户交流后发现,如果今天要做一个直播的话,用这样的数字人是很容易被封号的。为什么呢?因为很多观众看到我跟你交流,你不进行回答的话,他会怀疑你这个视频实际上是录播。我们问过同行,就类似于这样的一些形象克隆数字人,他被封号的概率超过40%,因为很多人其实是能看出来这是个假的。

所以在这种场景,我们希望基于大模型去构造的数字人能够实现跟人之间的自由对话,他每次对话的延迟控制在3秒以内,目前来说这个我们已经做到了。并且,他是可以有记忆、有灵魂的。那为什么叫有记忆呢?实际上所有人跟它说过的话,今天你告诉他我的女朋友,或者我老婆什么时候出生的、什么时候认识的,他可以把这个信息记住,下次再跟你聊的时候他不会像一个全新的操作系统一样每次都会遗忘。再者他会主动上网学习一些最新的资讯,能够根据最新的热搜来帮你编辑一篇小红书的文案,而不是胡编乱造。

化成具体的角色,今天我们已经能够用大模型生成数字客服、数字销售、数字主播和数字名人,后面我们会有一些具体例子可以看到。

像这样一个“数字老周”,其实就是我们做的一个案例。第一次做这个案例的时候是因为他阳了,出席不了某次大会,后来发现这种方式非常好。为什么呢?因为这样的视频其实我们后来给不同级别的领导都看过,反响非常不错。只需要一张照片、一段音频就能复刻我的形象、我的声音。只要把演讲稿、把他过往写过的书输入就能获得他的这种说话风格。

同时我们也可以用这样的一种形式解决直播带货的问题。例如,数字人可以在直播间里面自动抓取一些问题来自己回答。在这种互动场景中,看直播的用户不会觉得它是个数字人,他以为就是一个真人。同时在很多文旅和客服的场景里都需要有一个人亲自给你做接待、销售、介绍,今天有了这套大模型,以及AI Agnet的平台之后,我们可以让这样的一个数字人更好的带入自己的角色。它可以看得见、听得懂、说得好,它能够克隆你的形象、声音、动作以及思维,可以非常自然的进行人与人之间的交互。

像这样的数字人我们其实是做给安徽省的新华书店的。未来我们可以看到,有可能在书店里有一个无人区,这个区域所有的图书推荐都是由这个数字人来完成。通过这样的数字人,以及大家看到的老周的演讲,大家已经知道它已经是一个完成度比较高的产物了。在这个过程里面,实际上“数字老周”可以完成PPT的演讲,甚至在很多场景中还可以做这种类似于自由的对答。

02 从大模型到数字员工, 赋能企业最需要的场景

我们关注到很多企业希望能够充分利用大模型的优势:内容生成、内容理解和逻辑推理。所以在这个过程里面我们针对这几个需求,希望把大模型的能力充分发挥在企业最需要的地方。

我们希望大模型可以变成员工的知识助手、办公助手和领导的决策助手。比如说,以往总监或者是总经理以上一般才有自己的助理,这个高级领导让底下的助理帮他写一些文案,做一些内容分析,以及去安排一些会议。但是我们会发现很多企业里面不只是领导需要这样的一个数字员工,其实每个员工本身也希望有不同的助手能够帮他去做这些文案的撰写、行研的分析,以及类似这种多模态的音视频创作。

在这个过程里面,实际上我们做了一个AI数字员工的平台,在默认的情况下我们已经预训练出来9个AI数字员工。在这9个AI数字员工里面有能帮你写文案的、能帮你做社媒分析的、有能帮你做翻译的。在这种场景中我们还挖掘了一些新的应用出来,也就是说怎么样让几个AI数字人工能够帮你去协同完成一个任务。我们的产品里面支持企业知识库,所以我也许未来一个人开一家公司不是梦想。大家可以利用AI来完成很多执行上、协作上、内容分析上的工作。同时我们关注到,由于大模型的内容生成能力非常强,所以我们根据很多企业的一些应用场景,把这种类似于写工作报告,写一些周期性有固定格式的文档工作交给大模型。

我们就以写公文为例,以前一个小时最多写个一千字,但是在我们的AI数字员工的帮助下一个小时可以写一万字。同时我们可以利用我们的360鸿图的能力来进行生图。过去其实我们360也有这种大量图片的需求,因为我们是一个搜索引擎,我们有大量的推广物料要持续产出。所以在这种场景中,AI数字员工率先在360内部使用起来。我们每张图的生产时间大概是2-3分钟之间,如果要找设计师去做这样的一张图,他即使用视觉中国的图修改,一天最多做十张、八张就了不起了。现在我们一个搜索关键词对应一个配图,源源不断地让AI来生成,一天生成10万张还是100万张,其实取决于我们部署多少算力。

很多企业内部其实都会有文档分析的需求,在我们的AI数字员工里,我们试过把一个非常长的文章让AI进行分析和训练。同样的一份文档,如果真人去做阅读、分析、理解、总结,那可能几个小时就过去了。但让AI来做这个事情,200页的财报,可能10分钟它就可以给你提炼,你可以从各种角度来对它进一步分析。

对于企业用户来说,我们如果要写一个文档,做一个行业分析,你首先要让大模型知道你的企业是干什么的。所以我们提供了一种非常轻量级的,基于知识库的大模型工具。企业相关的知识,很多场景里其实都是以文档来呈现的。你可以导入一些网站和数据,在这种场景中你去建立自己的一个知识库大模型将会非常快、非常轻便。传统的大模型预训练大概要花一个月,做微调也要花大概一周的时间。基于我们企业级的大模型训练方案,你只要把几百兆的文档上传,那我们的训练时间在一个小时之内就能完成。

以上是我们360在企业实际业务场景中大模型落地的一些案例和经验,谢谢大家!

更多活动大会一手信息,欢迎加入创业邦会员,现场聆听一线投资人、头部企业家精彩分享,掌握最新创投趋势!

图片

27567280c7caafd95829dc36c70450d.png