“采销东哥”开启直播带货3.0期间，超百个企业CEO数字人定制需求正在练习中

云轩宝贝 · 发表于 2024-4-25 19:35:59

马上注册，结交更多淘宝商家，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有帐号？立即注册

x

图片泉源：京东直播间
2023年，在ChatGPT火爆出圈的动员下，AI又一次站在了科技舞台的C位。但彼时的天生式AI本领仅范围于“文生文”。
2024年2月，OpenAI又向科技天下扔下一枚“核弹”，推出了“文生视频”大模子Sora。Sora可以根据用户的文本提示创建最长60秒的视频，该模子相识这些物体在物理天下中的存在方式，可以深度模拟真实物理天下，能天生具有多个脚色、包罗特定活动的复杂场景。继承了DALL-E 3的画质和依照指令本领，能明确用户在提示中提出的要求。Sora的问世开启了大模子应用的新期间。
除了Sora的问世以外，已往的近5个月时间内，大模子在行业侧、财产侧的应用不停涌现，可以说本年注定是行业大模子快速落地的一年。对于直播行业，多模态大模子加持下的数字人也将拉开直播行业新期间的大幕。
而这汗青性的一刻已经发生。4月16日，由京东云言犀打造的“采销东哥”AI数字人开启直播首秀，同时亮相京东家电家居、京东超市采销直播间，开启了AIGC式的电商直播3.0期间。京东云言犀负责人告诉钛媒体，采销东哥首秀后就有超百个企业CEO数字人定制需求，正在加紧练习中。

应用落地的一年，“卷”本领、“卷”应用

假如说2023年是AIGC“卷”算力、“卷”参数的一年，那么从2024年开始，今后的几年间就是AIGC“卷”应用、“卷”本领的期间。京东云言犀负责人对钛媒体表现，工程性的作用将会越来越告急，这些技能终极还是要在应用中表现真正的代价。“我们盼望一个技能出现以后，终极是能切实的落地到一个或多个场景上，而不但仅是停顿在demo上，数字人直播就是我们发掘出代价的应用场景之一。”京东云言犀负责人对钛媒体表现。
针对基于大模子打造的数字人在直播带货范畴的发展远景，京东言犀负责人告诉钛媒体，如今来看，数字人直播带货有很大的机遇成为直播范畴的一个“爆点”，“重要是由于数字人在内容条理上到达了一个新的水准，言犀又在运营方法论层面形成了深度积累，人们对数字人的继承度和信托度也较高。”该名负责人如是说。
谈及当下数字人应用时，京东云言犀负责人对钛媒体表现，当下数字人在直播带货方面的代价，更多表如今人机协作共生方面。根据京东云方面统计，人机接档的直播间，数据表现显着优于纯人或纯数字人的直播间，“现阶段，数字人的代价不是取代真人，而是通过与真人接力的情势，打造‘日不落’直播间，发掘闲时直播代价，”该名负责人指出，“如今，言犀数字人进步闲时转化率超30%。”

端到端技能，5万小时语音数据，大模子数字人应该长如许

要知道数字人虽好，但真正做到实时的，具有交互本领的，且宛在如今的数字人，可远比利用Sora天生一个一分钟的视频须要的技能更难。
据相识，为了打造出逼真度更高的数字人，言犀早在2年多前就选择了端到端的技能门路，即建模-驱动-渲染一体化，而偶合的是，Sora也是选择端到端的技能门路。
从如今端到端的技能门路看，重要分为两大类：一类是完全的端到端；另一类是针对个别数据举行建模的。
此中，完全端到端的方式中心不对任何环节举行的建模，完满是隐性的。
而针对部门素材建模的方式会根据人脸额度素材举行建模，然后再控制数字人的心情、唇形，末了再举行纹理的渲染，“这两种方案京东云会根据差异的场景举行选择，但都会用到。”京东云言犀负责人指出。
而在整个数字人建模的过程中，怎样实现人物大姿态动作，是最难的一点。对此，京东云言犀负责人对钛媒体表现，不可以大概有大幅度的活动是如今许多数字人看着不像真人的重要缘故原由之一，要让数字人看起来和真人一样，实现大姿态动作是必须的。
针对此，言犀数字人在练习过程中，从数据收罗、数据洗濯等各个方面都举行了风雅化聚焦，并对模子代码举行了压缩、量化，修改了模子精度。通过种种技能本领，让终极出现出来的数字人实现了可以像真人一样寻常活动的本领。
除此之外，言犀数字人与Sora的差异之处还在于——言犀数字人须要举行实时同步的语音播报。对此，京东云言犀负责人告诉钛媒体，京东云为了练习言犀数字人利用了凌驾5万小时的多种多样的素材语音，从而让底层的底子模子具备人类发音的根本模式，创建好语音模子，“通过凌驾5万小时的数据练习后，底子模子已经具备了模拟任何人语言的本领，而且这种本领不但范围于中文，乃至可以流利的说英语。”该名负责人夸大。
值得一提的是，颠末5万小时语音数据练习后的底子模子，仅须要再提供部门被模拟人的语音片断，不须要再对模子举行练习，就可以直接合成被模拟人原来的音色和语言的表达方式，这也是为何“采销东哥”可以大概将京东团体首创人、董事会主席刘强东“宿迁平凡话”学的惟妙惟肖的关键地点。
有了语音和视频双重加持，让“采销东哥”数字人在近期的频频直播中毫无漏洞，算是乐成通过了图灵测试。
固然数字人具备强大的本领，但在京东云言犀负责人看来，直播带货的本质还是要夸大运营，“运营要以效果为导向主导规划，从形象、演出、装修、互动、展示等全面的举行每场直播的策划，而产物和技能都必须细密围绕这套规划来开展本身的计划和打造工作。”该名负责人指出，“也是出于落实运营为王的核心方法论，言犀在本年也开始给一些重点品牌相助搭档提供代运营服务，就是为了以这些头部品牌为支点，探索并快速扩散有效的数字人直播运营履历，资助行业可以大概快速发展，快速裂变。”

更低本钱、更低门槛是发展方向

大模子制作出的数字人固然好用，但好用仅仅是开始，本钱、门槛才是决定一个技能可否大规模应用落地的关键。随着AIGC快速的发展，业内已经有差异声音——模子不是越大越好。
百度首创人、董事长兼首席实行官李彦宏曾公开指出，将来大型的AI原生应用将重要接纳巨细模子肴杂利用的方式。他表明说，这种模式被称为MoE，即不依赖单一大模子来办理全部标题，而是根据差异场景选择得当的模子。“在一些特定场景中，颠末精调后的小模子，其利用效果乃至可以媲美大模子。”李彦宏如是说。
不敷为奇，360团体首创人、董事长周鸿祎也曾指出，在具体的落地场景上，在把大模子做“大”的同时，做“小”也是一个告急的趋势，使大模子可以大概搭载在手机、电脑，各种物联网装备上，尤其是智能网联汽车，2024年将更多的搭载大模子。
IBM大中华区首席技能官、研发中心总司理谢东也曾公开表现，对于企业而言，应用模子的目标是盼望其能以较低的本钱，办理特定的标题，“对于企业级应用而言，模子反而是越小越好，由于越小越机动，越小本钱越低。”谢东指出。
.......
上述行业大佬的言语不丢脸出，大模子固然具备肯定的本领，但是其应用本钱、应用门槛较高，一样寻常企业难以负担应用大模子所产生的高昂本钱。与此同时，相较于大模子而言，较小的模子能让AI真正做到“术业有专攻”，以最低的本钱，实现最大的代价。
值得留意的是，京东云言犀算法总监告诉钛媒体，如今言犀数字人可以支持云上与本地摆设两种情势，此中，本地摆设不但支持GPU，也支持仅CPU摆设，且效果不会打扣头。这与如今市面上常见的大模子产物必须须要GPU本领加持相比，无论是在芯片采购本钱，还是后期运营本钱方面都有着显着的上风，低落了品牌商的利用门槛。“京东云提出的模子可以正确预估人物的姿态，以及对每个形象个性化的纹理建模和团结优化，即便接纳轻量化的模子，也可以大概天生天然逼真的效果。”京东云言犀算法总监如是说。
“如今，行业内也有许多轻量化的办法，比如量化或举行模子压缩，但京东云言犀可以直接做到CPU推理，这对于本钱的节省非常告急。”京东云言犀算法总监进一步指出。
而对于本身就接纳言犀大模子的用户而言，可以直接在云端利用言犀数字人，京东云言犀负责人告诉钛媒体，数字人是直接通过练习天生式网络模子实时天生的，“可以同时支持上千个直接间在云端同步直播，进一步低落开播本钱30%。”该名负责人夸大。
谈及将来，京东云言犀负责人对钛媒体表现，假如将数字人分为三个品级，第一级是像真人看齐；第二级是媲美真人；第三极是能融合真人的头脑、文化配景等，“如今言犀数字人已经到达媲美真人的级别，但对于数字人来说，尚有许多路要走，要实现让数字人具备真人的文化配景、头脑逻辑，成为真正的数字分身尚有很长的路要走。这也是言犀大模子将继承实行的一个告急方向。”该负责人指出。

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

“采销东哥”开启直播带货3.0期间，超百个企业CEO数字人定制需求正在练习中

马上注册，结交更多淘宝商家，享用更多功能，让你轻松玩转社区。

让创业更简单

关于我们

云服务支持

精彩文章，快速检索

关注我们