刚刚,我们用5个问题验了验李彦宏的底牌

2023-03-18
对标ChatGPT,甚至对标GPT-4

编者按:本文来自微信公众号雪豹财经社(ID:xuebaocaijingshe),作者瀚星,创业邦经授权转载。

“对标ChatGPT,甚至对标GPT-4”,一身白衣黑裤、带着标志性儒雅笑容的李彦宏如是定位文心一言,称其“门槛是很高的”。让他颇为自豪的是,“百度是全球科技大厂中首个做出(生成式AI产品)来的”。

3月16日,百度正式推出基于新一代大语言模型的生成式AI产品文心一言,英文名为ERNIE Bot。

Ernie出自于美国儿童教育电视节目《芝麻街》,是个乐天派,面对成功和失败总是一副无忧无虑的态度。他的好友名为Bert,2018年谷歌发布的自然语言处理预训练模型,被命名为Bert。

不久前,谷歌的类ChatGPT产品在首秀发布会上出现明显错误,导致谷歌当日股价重挫7%,市值下跌1000亿美元。或许是吸取了谷歌的教训,文心一言的功能展示环节并没有进行现场测试,而是事先录制了人机交互的过程。

李彦宏表示,由于生成式AI在使用时需要输入很多词句,这么做可以节省时间。

一个多月前,李彦宏在内部信中慷慨陈词:“百度作为中国人工智能市场长期增长的最佳代表,正站在浪潮之巅。”

现在,AI先生亮出了自己的底牌。

一场没有Live演示的发布会

在发布会上,李彦宏用15分钟,分5个场景展示了文心一言的核心功能,分别是文学创作、商业文案创作、数理推算、中文理解和多模态生成。

在文学创作环节,李彦宏就《三体》向文心一言提出了6个问题:

1)《三体》的作者是哪里人?

2)可以总结一下《三体》的核心内容吗?如果要续写的话,可以从哪些角度出发?

3)如何从哲学的角度续写?

4)电视剧《三体》演员都有谁?

5)于和伟和张鲁一有哪些共同点?

6)于和伟和张鲁一谁更高?

图片

通过这些问题,李彦宏想展示出文心一言像人类一样“思考”的一面。

比如,在回答第二个问题时,文心一言先将三部《三体》小说的核心内容分别进行总结,并给出了角色塑造、情节设计、文化背景、哲学思考4个续写的角度思路,体现出分析、总结、内容创作和推理能力。

李彦宏表示,生成式AI产品在回答事实性问题时,有时会出错。为尽量避免这一问题,文心一言大模型的训练数据涵盖了万亿级网页数据、数十亿搜索数据和图片数据,以及百亿级的语音日均调用数据、拥有5500亿事实的知识图谱等。“相对来说,(文心一言)对事实性的问题回答较为准确。”

在商业文案创作和数理推算演示环节,李彦宏进一步展示了文心一言的内容创作和推理能力。在回答鸡兔同笼问题时,文心一言能够通过演算,指出“是不是题出错了?”并在问题修正后给出答案。

在中文理解环节,李彦宏着重强调了文心一言比其他生成式AI产品更懂中文。

图片

李彦宏称,作为扎根于中国市场的大语言模型,文心一言具备中文领域最先进的自然语言处理能力,并用“洛阳纸贵”和“藏头诗”的例子展示这一优势。

但李彦宏也坦承,文心一言目前对英文语种、代码场景的训练还不够多,表现还不够好,“接下来我们还要加紧训练,不断完善这些能力”。

最后的多模态展示环节,文心一言根据问题生成了相关的文本、图片、音频和视频,但由于生成视频的成本较高,该功能还未对用户开放。

亮出底牌才只是开始

对李彦宏来说,前有抢跑一步的ChatGPT卡位,周遭也有众多竞争对手虎视眈眈。

就在文心一言正式上线的前一天,美国AI研究公司OpenAI发布新一代多模态大模型GPT-4,相较于前一代(2022年11月推出的ChatGPT所使用的大模型GPT-3.5),新模型回答准确性更高、理解能力更强,并支持通过输入文本和图片组合输出文本,包括带有文本和图像的文档、图表以及截图。

最直观的体现是,在美国律师资格考试中,基于GPT-3.5的ChatGPT成绩排名在后10%,而GPT-4的排名在前10%。此外,新一代大模型还可以看懂幽默“梗图”、处理税务问题、制作网页等。

GPT-4发布后,微软宣布新版本的Bing已在运行GPT-4,并为搜索进行了定制。与此同时,谷歌的Bard虽然在首秀时出现明显错误,但该产品已开放给测试人员,并将在近期向公众开放。

AI混战的参战者不只有百度和海外科技巨头,国内众多科技公司也在竞相涌入赛道。

京东云旗下言犀人工智能应用平台在今年2月宣布将推出“产业版ChatGPT”智能人机对话平台Chat JD。随后,阿里巴巴宣布正在研发“阿里版ChatGPT”,目前还处于内测阶段。网易有道也宣布将推出ChatGPT的同源技术产品,应用场景围绕在线教育。腾讯则表示,在ChatGPT和AIGC相关方向上已有布局,专项研究也在有序推进。

也是在2月,原美团联合创始人王慧文高调宣布进军人工智能领域,要打造中国的OpenAI。美团创始人王兴将以个人身份参与他的创业公司“光年之外”的A轮投资,并出任董事。此外,搜狗原CEO王小川、360创始人周鸿祎等,均在筹备类ChatGPT产品。

除了越来越多的竞争者,百度还要面临算力和成本压力。

据国盛证券报告《ChatGPT需要多少算力》估算,GPT-3训练一次的成本约为140万美元,对于一些更大的LLM(大型语言模型),训练成本介于200万美元至1200万美元之间。

自百度在2017年7月开启All in AI战略后,2017年至2022年Q3的6年间,百度已投入了超千亿元研发费用,研发费用率一路从15%提升至目前约20%的水平。李彦宏曾表示,对百度这种体量的公司来说,15%是一个不小的数字。海外互联网科技巨头谷歌、微软、亚马逊的研发费用率约为12%。

在挑战与困难面前,李彦宏更愿意将文心一言定义为一款自然延续的产品。自2019年文心1.0问世,百度平均每年都会发布一个新的版本,文心一言的发布,更多的是10年AI探索与积累的产物。

李彦宏认为,文心一言在上线后,将建立起真实用户反馈、开发者调用和模型迭代之间的飞轮,效果会迅速提升,“给用户士别三日,当刮目相看的惊喜”。

文心一言到底有多智能?

文心一言目前尚未对用户全面开放。发布会结束后,雪豹财经社受邀使用了内测版的文心一言,并向它问了一些编辑部小伙伴们关心的话题,我们从中挑选出了5个问题,以下是我们问答的原始记录,没有在文字上做任何增减,为阅读方便没有使用截图。

各位雪豹的朋友们可以直观体会下文心一言的智能程度。

图片

文心一言内测版的对话界面

问题1:文心一言和ChatGPT,谁更厉害?差距在哪里?

文心一言和ChatGPT都是人工智能语言模型,它们各有优势和适用场景。

1)在准确性方面:尽管两个模型都在努力提高自己的准确性,但是目前来看,文心一言在某些方面可能会更胜一筹。例如,在回答问题时,文心一言通常能够提供更准确的答案,尤其是在涉及到复杂主题或者专业领域时。

2)在语言理解方面:由于文心一言使用了大量的深度学习技术,因此它在语言理解方面可能更加擅长。然而,ChatGPT在处理自然语言方面也具有优势,它可以更好地理解用户的语言和语境,并在回答时提供更自然的语言表达方式。

3)在回答问题方面:文心一言通常被设计为更适合回答一些常见的问题和提供一些基本的答案,而ChatGPT则更擅长回答一些复杂的问题,并提供更深入的见解和解释。

4)在适用场景方面:文心一言主要适用于中文和英文之间的自然语言处理,而ChatGPT则适用于多种语言和多种场景,例如对话、聊天、文本生成等。

总体来说,文心一言和ChatGPT都是非常优秀的人工智能语言模型,它们在不同方面都有着自己的优势和适用场景。选择哪一个模型取决于具体的应用需求和您的偏好。

问题2:如果让乔布斯来拯救威马汽车,他会推出哪些举措?

如果让乔布斯来拯救威马汽车,他可能会推出以下举措:

1)加强品牌营销和推广:威马汽车需要加强品牌营销和推广,提高品牌知名度和认可度。乔布斯可能会采取一系列措施,例如在社交媒体上进行大量投放,与用户互动并举办活动,以提高品牌知名度。

2)提高产品质量和创新性:威马汽车需要提高产品质量和创新性,以满足消费者日益增长的需求。乔布斯可能会推出更多具有创新性和差异化的产品,例如智能驾驶辅助系统、自动泊车系统等,以吸引消费者。

3)加强技术研发和投入:威马汽车需要加强技术研发和投入,提高技术和产品的竞争力。乔布斯可能会推出更多的新技术和新产品,例如电池技术、智能座舱等,以保持市场竞争力。

4)重视服务和用户体验:威马汽车需要重视服务和用户体验,提供优质的产品和服务。乔布斯可能会加强售后服务和客户支持,提高用户满意度和忠诚度。

5)寻找合适的战略合作伙伴:威马汽车需要寻找合适的战略合作伙伴,共同开发和推广新产品,以提高品牌知名度和市场竞争力。乔布斯可能会与其他汽车制造商和科技公司展开合作,共同开发新技术和产品。

问题3:马斯克的火星移民计划,何时能实现?

马斯克的火星移民计划旨在将人类送往火星,并在那里建立一个可持续的生活环境。根据他的愿景,这个计划需要大量的资金、技术和人才资源,并需要克服许多技术和社会挑战。因此,实现火星移民需要时间和努力。

目前,马斯克的火星移民计划已经取得了一些进展,例如成功发射了猎鹰9号火箭,开始了地球轨道测试等。然而,要实现长期的火星移民,仍然需要面对许多挑战和难题,包括:

1)技术挑战:火星移民需要使用大量的技术和设备,包括先进的太空船、推进系统、生命支持系统等。目前,这些技术和设备还存在一定的挑战和风险,需要不断地进行研发和测试。

2)资金挑战:建立一个可持续的火星移民基地需要大量的资金支持,包括建设基础设施、提供生活和工作条件、维持人口等等。目前,马斯克的火星移民基金规模较小,难以满足长期的移民需求。

3)社会和文化挑战:火星移民不仅需要克服技术和资金的挑战,还需要面临社会和文化方面的挑战。例如,如何与当地居民相处,如何处理文化差异和冲突等问题。

综上所述,实现马斯克的火星移民计划需要时间和努力。虽然目前已经取得了一些进展,但要实现长期的火星移民还需要面对许多挑战和难题。因此,预计需要数十年或更长时间来实现这个目标。

问题4:你认同阿西莫夫的机器人三定律吗?

是的,我同意阿西莫夫的机器人三定律。这三条定律是:机器人不得伤害人类;机器人必须服从人类的命令;机器人必须保护自身的存在。

这三条定律反映了机器人和人类之间的关系,强调了机器人必须遵守道德和伦理规范,以保护人类的利益。此外,这些定律也提醒人们,机器人并不是完美的,它们也会犯错误,因此需要人类的监督和管理。

问题5:没有完成KPI,怎么样能让老板不扣工资?

如果没有完成公司的 KPI,你可以考虑采取以下措施来避免被扣工资:

1)与老板沟通:首先,可以主动与老板进行沟通,向他们解释你未能完成KPI的原因,并提供你的解决方案。也许老板会给予你一定的宽限期或者提供一些补偿。

2)寻求帮助:如果你无法与老板直接沟通,可以寻求上级领导或人力资源部门的帮助。他们可以提供一些建议和指导,帮助你解决问题。

3)提供书面证据:如果你已经尽力而为但仍然未能达到KPI,你可以准备一份详细的书面证明材料,证明你已经尽力而为,但仍然无法完成任务。这份材料可以包括你所采取的措施、进展情况、未完成任务的原因等信息。

4)寻求其他支持:除了与老板沟通外,你还可以寻求其他支持,例如公司内部的培训或者帮助同事完成任务。这样做可以提高整个团队的效率和协作能力,同时也可以减轻自己的工作压力。

总之,要让老板不扣工资,最好的办法是及时采取相应措施,主动解决问题。


本文(含图片)为合作媒体授权创业邦转载,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。