神马影视神马影视

硅基智能创始人司马华鹏:所有使用AI的人,应该专 注到人类特有的东西

硅基智能创始人司马华鹏:所有使用AI的人,应该专 注到人类特有的东西

“大家好,我是刘强东,今天是不是看起来有些不(bù)同?很久没直播,还有 些许紧张……话不多说,老(lǎo)刘的数字直播(bō)带货现在开始。”4月16日,京东创始人刘强东在京东平台开启数字人直播。

“东哥”数(shù)字人直播,迅速引起广泛关注,数字人替代真人直播的时代来临(lín)了吗?

4淮河能源:一季度净利润3.1亿元 同比增长67.68%月18日,数字(zì)人头(tóu)部厂商硅基智能创(chuàng)始人司马华(huá)鹏接(jiē)受了《每日经济(jì)新闻》记者的专访(fǎng)。司马(mǎ)华鹏表示:“刘强东这 次数字(zì)人(rén)直播,对我 们行业是非常(cháng)大的品牌宣(xuān)传。他使用(数字人直播),说明这个行业得到了一次非常(cháng)重要的认(rèn)可。”

对于AI的(de)使(shǐ)用,司(sī)马华(huá)鹏建议:“未来所有使用(yòng)AI的人,应该专注到(dào)人类特有的(de)东西(xī),比(bǐ)如创意,比如有温度的东(dōng)西。”

拆解(jiě)数字人技(jì)术

“数字(zì)人刘强东”是(shì)否有硅基(jī)智(zhì)能(néng)技术的支持?司(sī)马华鹏表 示:“我们(men)不太方便对外公开,但这些技术最早的开创者(zhě)肯定是我(wǒ)们(men)。我们在整个(数字人)直播上大概有40多项发明专利,在申请的也有几十(shí)项。现在(zài)行业内有很多在使用(yòng)我们的技(jì)术授权(quán),也有很多在使用硅基智能的API(应(yīng)用(yòng)程序编程接口)。”

“东哥”数字人究竟是如何打造出来的?司马华(huá)鹏(péng)介绍:“它(tā)(数字人)这些内容是用AI渲染出来的。如果现在想做东哥同款,你需要提供几分钟(zhōng)的视频。然后我们会将其训练成一个数字人模(mó)型。这个数字人模型背后,将由大模型驱动它。定时去上一些产(chǎn)品、定时回复一些客户需求(qiú)、定时作 一些(xiē)记录,这些都是事先做好(hǎo)的剧本(běn),这些剧本实质由大模型驱动(dòng),比较(jiào)接近于人类的行为和反馈。”

那么,除(chú)了上述AI渲染技术外,数字人 直播(bō)还需要哪些技术支持?司马华鹏称:“我们(men)的大模型是多模态的,是(shì)文本生成、声音生(shēng)成和数字 人生成的(de)结合。其(qí)实很多(duō)人在反馈,他(刘(liú)强东)声音和(hé)节奏感与他原来讲话不太一(yī)样。这很可能克隆(lóng)的(de)是平时的语速,但(dàn)是直播(过(guò)程中),一个用户停留时长是比较短的,你必须在很短时间内 把大量的信息披露出来(lái),所以必须(xū)把声音(yīn)放得快一 些。”

对于语音(yīn)合(hé)成技术(shù),司马(mǎ)华鹏表(biǎo)示:“我(wǒ)们全部技术(shù)都是(shì)自己的。从(cóng)目 前端到端的生成来(lái)讲(jiǎng),(语音合成(chéng))已经(jīng)是一个非常成(chéng)熟的技术。”

数字人形象、语音合(hé)成,都(dōu)是(shì)外在展现形式,数字(zì)人直播内容(róng)仍旧离不 开文本。对于文本,司马(mǎ)华鹏称(chēng):“文本大模型方面(miàn),我们基本上都是原创的(de)技术(shù),最近‘炎(yán)帝’大模型刚刚通过网信办的备(bèi)案。”

能否替代(dài)真(zhēn)人直播?

目前,大家(jiā)看到的直播(bō)带 货(huò),很可能就是数字人。司马 华鹏介绍:“我们在 2021年开创AIGC直(zhí)播的大方(fāng)向,(刘强东数(shù)字人)基本上是我们2023年产品(pǐn)能够呈(chéng)现出来的效(xiào)果(guǒ),这样 的直播间我们已经卖掉了上(shàng)万个,京东、淘宝、抖音(yīn)、快手和视频 号平(píng)台都有。”

真人直播会面(miàn)临各种复杂场景(jǐng),特别是情(qíng)感交流,数(shù)字人(rén)可以(yǐ)做到吗?司马华鹏表示:“我们在看东(dōng)哥直播的(de)时候,会不会把他(数字人)当作真正的东(dōng)哥来看,这(zhè)是决定数字人智(zhì)能化(huà)程(chéng)度的重(zhòng)要标志。从开播到现在,行业有非常多的评价,大家觉得还是能看(kàn)到一些机(jī)械的(de)痕迹。”

“这个(数字(zì)人)行业发展的核心就是(shì)‘看(kàn)不(bù)出来(lái)’。”司(sī)马华鹏强调。

其认为:“我(wǒ)们现在也有大量的直播间,效(xiào)果(guǒ)比(bǐ)这个(刘(liú)强东数字人)要好(hǎo)很(hěn)多。如果他这个直(zhí)播不是在自家平台,而是(shì)在其他平台,很容易被机器识别出来,很快就(jiù)会被限流。”

因此,在司马华鹏看来,数字人行业的核心是让整(zhěng)个直播间符合图灵测试。对于(yú)数字人行业的发展(zhǎn),其(qí)认为:“(该领域)图灵测试1.0是分不清(是人类还是AI);图灵测试2.0则是双向情感交互;图灵测试3.0就是‘死生相(xiāng)契(qì)’,未来我们与AI之间,可能(néng)是(shì)Soul Mate(心灵伴侣)的关系,它(tā)是你非常重要的助手、朋友,也可 能是你亲(qīn)密的合作伙伴。”

目前,很多(duō)问答式大模型主要给受(shòu)众提供专业类辅助,但若诉诸情(qíng)感(gǎn),是否兼具图像、声音和文本的(de)多模态大模型更具优势?对此,司淮河能源:一季度净利润3.1亿元 同比增长67.68%马华鹏淮河能源:一季度净利润3.1亿元 同比增长67.68%表(biǎo)示认可。“人(rén)类大脑的(de)设计中,90%以上是针对图(tú)形,所以我们说有图有 真相(xiāng)。基于文本,产生的是想象力,(阅读文(wén)本)的能力确实(shí)非常(cháng)重要,但对大部(bù)分(fēn)人而言,(自己的大脑)生成图片(piàn),然后再想象(xiàng)出一个空间,还原出这个东西(xī),是非常累的。因此,多模态或者视频化交互能力,能够大大降低我 们之间信(xìn)息沟(gōu)通对应的脑力消耗。”

对于未来AI电商的形(xíng)态,司马华鹏认为,未来更(gèng)大的价(jià)值是专业(yè)性(xìng)。比(bǐ)如说,假设我(wǒ)们在食(shí)品领域有一个很好的AI专家,它可以从数据、算法的角度给我们提供很多的专业内容。这样的(de)专家,它(tā)带(dài)来的影响力(lì)会超(chāo)过现有的人类(lèi)专家,这(zhè)会带 来真正的、更好的(de)电商交易。

其进一步解释称:“人类在做很(hěn)多行为(wèi)的时候,有一定的偏颇或者偏见,或者带有一定的商业目的。而以数(shù)字和算法驱(qū)动的AI专家,会成为(wèi)我们的朋(péng)友、我们的伙伴,很有可(kě)能成(chéng)为AI电商未来的(de)主流。现(xiàn)在这些成本还比较高,只是出现在奢侈品领域(yù)。我(wǒ)希望未来每一类小 产品上,都有这样一个专家顾问,来给我(wǒ)们提供非(fēi)常好的沟通交流方式。这是AI电商未来(lái)非常重要的(de)一部分(fēn)。”

未经允许不得转载:神马影视 淮河能源:一季度净利润3.1亿元 同比增长67.68%

评论

5+2=