时代涌现茅旭超：AIGC让我们一天生产10万条视频

6月8日消息，在“韧性”2023服装产业数字化创新峰会上，时代涌现联合创始人茅旭超发表了题为《助力智能商业落地，引领消费场景变革》的演讲。他指出，随着AI技术的快速迭代，整个商业场景和商业应用都发生了巨大的变化。

茅旭超指出，传统商业和智能商业的最主要区别在于数字化营销，而内容为王是其核心之一。传统商业场景里，大量内容生产的痛点在于预算低、成本高，而AIGC工具可以突破人力产能限制，同时针对不同层级的品牌内容，产出对应类型的视频，改变内容生产模式。

（温馨提示：本文为速记初审稿，在不影响原意的基础上，由亿邦动力编辑整理。）

以下为演讲实录：

感谢大家，我是时代涌现联合创始人茅旭超，今天非常高兴来和大家分享一下，我们在AIGC领域的思考和见解。今天分享主题是“助力智能商业落地，引领消费场景变革”。

我选取这个主题的主要目的是，因为现在AI技术在非常快速地迭代，而随着技术的快速迭代，整个商业场景和商业应用其实发生了非常巨大的变化。相信在座的各位，无论是品牌方，还是服务商，应该都有非常深切的感受。相信大家也是跟我们一样的心情，又紧张又非常激动。

技术一定会带来很多变革，但是它会把大家的生意带到什么样的方向，其实充满了很多未知数。我们目前在泛商业领域的AIGC应用做了非常多的尝试，今天会给大家做一个比较具体的分享。

01 场域无限时代到来，数字化营销加速转化

首先讲一下什么叫消费场景的变革，它本质上是因为通信技术的变化。从2000年开始通信处于3G时代，那时候发彩信都很贵，基本上处于文字时代。在那个时候门户网站和博客都是非常火的在线渠道。2013年进入4G时代，开始以图文方式来进行内容创作，这个时候微信公众号和小红书，陆陆续续开始进入到大家的视野。2018年进入5G时代，我们进入全面短视频的时代，包括之前很多做传统电商的都进行了快速转型，开始切入直播赛道，短视频赛道，本质上还是通信技术变革带来消费场景的变化。

我们一直在说智能商业。那智能商业的核心是什么呢？首先对比一下传统商业和智能商业的变化。

传统商业大家比较清楚，就是传统的人货场，但是人货场之间有非常明显的隔离，简单来讲叫人货分离，场域连接。人要买到货，必须在一个非常清晰的场域里面进行挑选、支付，再有发货、供货到收货，这个链路是非常非常固定的。

进入到所谓的智能商业，首先已经没有场的概念了，场是无处不在的，人和货可以快速进行匹配。我们这次来常熟非常深刻的一个感受，我们去了线下很多档口，看到很多档口老板娘直接在店铺上做广告，最简单的就是把抖音账号、快手账号贴出来。这个就是我们说的场域无限，在线下会有一个档口，但是我在线上可以无限触达消费者。

传统商业和智能商业之间最主要的区别或者说进化的连接是什么？其实就是数字化的营销。

数字化营销的核心首先是数据驱动，第二是内容为王。我们可以快速产出一些优质的内容，在无限场域里触达到消费者。无论是传统的货架电商，消费者通过搜索去找到商品，还是现在最新的兴趣电商，通过算法匹配商品找到消费者，本质上是要通过内容去吸引到消费者，最终促成消费的转化。

这就带来一个非常大的痛点，如果在传统的模式下，内容创作这件事情，首先需要大量的人力，其次会耗费大量的成本。我们一直在说内容创作是有三个方式，最早是文本创作，然后是图文，但图文创作的成本其实是文字创作的十倍。第三阶段是视频，视频创作成本是图文的十倍。这个其实也很好理解，因为它不是割裂的三种方式，它是一个进化，文字是最基础的，图文里面是文字加上图片。什么是视频？视频的核心是把各种内容要素通过变化的方式组合起来。

我们简单来理解，任何一段视频一定会包含哪些要素呢？包含文本卖点描述或者商品描述，还会包含产品本身。今天如果我拍一段长篇广告片，我一定会要展现商品本身。这个商品不能在一个完全空白场景里面做展示，这不能吸引人。我需要它有一个场景，室内的场景或者室外的场景，甚至说需要有一些素材跟它进行匹配。比如说产品放在一个桌上，人是在沙滩边走的，这些素材也是构成视频非常重要的元素。

如果最终要生成视频的话还涉及到什么？今天传统的拍摄会有一个导演，导演最重要的事情是什么？基于他的创意，要写出一个脚本。在我们看来，一个脚本，首先镜头的变化，近景，远景，切一些快慢镜头，产品本身要做各个角度不同的展示，还要配以不同的动效。最后要把这条片子渲染出来。其实它是一个非常长的业务流。对应到商业落地要做视频，就存在内容供给的痛点。

今天我们做一个品牌，基本上商品是正向金字塔的矩阵，基本上大逻辑大家都会有一些爆款，但一定会有大量的长尾款，它的动销没有那么足，但要完整整个货品矩阵，中间会有所谓的核心款，它是可以卖的，但并没有爆款卖的那么好。

但是在传统商业模式下，传统的内容供给其实是一个倒金字塔，跟我们货品供给是反的。什么意思呢？我们一定会有大量的预算去打爆品，我们会产出一些高质量的内容。传统意义上，这些高质量内容叫做品宣的创意大片，这部分通常会有视频方式去做呈现，制作方一般来说都是广告公司或者4A创意机构，基本上是高预算、高质量，这是对爆品产生内容的要求。

针对中心的核心款，这中间的痛点是什么？预算有限，如果今天针对一个爆款，可以有100万预算拍广告片，但针对次一级十个款，我不可能全部花预算去拍，中间一定会有ROI的指标，这就是一个痛点。我们总结出来它的特点是，相对来说是低预算的，但同时要产出高质量的内容。这些内容产出的形式，视频也有，图文也有，承接机构基本上是制作公司或者影棚。

再往下就是所谓的长尾款，基本上是没有素材的。如果今天做电商，客户有一些最基本的电商素材，就是白底图和描述，仅此而已。这部分工作我们理解叫低质量、低预算，基本上会有传统的电商代运营公司或者品牌内部团队去完成。相对来说，它是比较重复性的工作。

这是目前的现状，两个完全倒立的金字塔，需求和实际产出并不完全匹配。

02 AIGC驱动数字化营销，再造内容生产金字塔

在智能商业领域，随着AIGC技术逐渐成熟，我们有机会实现的是什么？针对品牌不同层级的内容都可以有不同类型的内容供给，并且通过AI的方式进行赋能，降本增效。

我们总结了一下现在AIGC可以产出的视频内容，针对品牌不同级别的产品，分别可以做什么样的解决方案。

针对爆款，对标如果是今天品牌的品宣大片，我们可以帮品牌进行高精度的3D模型，获得虚拟数字资产。同时像做创意导演一样，帮他合成一段高质量的3D创意视频。

针对中间核心款，我们可以基于品牌现有素材，包括在电商渠道已有的详情图，它的标题和描述，品牌自有的直播录像、直播切片，还有品牌在站外进行种草的达人和KOC的素材。这些素材经过一定范式的重组，就可以把它生成智能混剪视频，比如说虚拟人的评测和讲解视频，比如说3D表达的视频。

同样针对底层的长尾款，平时没有内容的，我们要实现的是什么呢？可以非常快速地实现让品牌所有图片都动起来。我们可以做2D表达视频，商品本身可能不是360度做展示，但是可以通过一些动效让它的产品动起来。我们还可以帮大家获得平台流量红利的视频，比如说在淘宝渠道有些公域流量红利，像微详情、头图视频，如果可以通过AIGC方式快速实现，就可以直接帮品牌获得一些流量红利。

当然还可以再加上最新的AI技术，比如说通过AI方式添加一些旁白，基于品牌现有的素材，将文案进行重组，通过旁白的方式去串联视频。我们还可以通过模特换装，在服装行业大家会非常感兴趣这样的应用。我们通过AI模特进行服装换装，把本来在假模身上的一件衣服可以快速换到模特身上生成基础素材。基于这些基础素材，我们再进行混剪，商品展示，虚拟人讲解，就可以生成一段比较长的视频。

总结一下我们在做的事情，我们想要做的AIGC跟大部分提供AI工具的不太一样，我们做这件事情要全自动，我来讲解一下什么叫全自动。

今天如果我们来拆解AIGC，相信大家的第一印象肯定是从ChatGPT开始的，ChatGPT是一个文本模型，是一个应用工具，基本上可以通过你输入一段文本，跟你进行对话。今天市面上有大量工具是在通过对话的方式获得文本，已经有办法快速地提效，我要帮商品写一段文案，可以求助于ChatGPT，它可以给我写一段文案，国内有很多新的文本模型可以做的很好。

但在这中间会有两个痛点。我们给ChatGPT一个非常精准的总结叫“一本正经地胡说八道”，如果用过的人相信会有这个感知。它看上去讲的内容逻辑是非常严密的，但如果你去查一下，内容通常是不准确的。这中间核心的原因是什么？ChatGPT是美国一个不开源的大模型，它的数据更新到现在为止还是2021年底。如果今天作为个人对话类工具没有关系，你跟它聊，它可以回复你，它说得不准，大家哈哈一笑就可以了。

但想象一下，如果今天这一段内容是用于电商平台，我要做视频或者我要写一段文案的，大家最怕的是什么？一定是怕职业打假人，首先你不能出违禁词，其次你不能胡说八道，一旦被抓到将会产生风险，所以ChatGPT就不能直接进行应用，那我们要进行新的模型训练。

还有一个工具相信大家应该也比较熟悉，是图像生成类工具叫Midjourney，国内也有类似的图像生成工具。这些工具特点是什么？它非常好玩，输入一段文本文案就可以快速把图片做出来，这是一个很有趣的能力。但是如果今天我们要用于商业领域，它就会遇到问题。如果今天我做的是商业素材和内容，我不能完全让AI去生成一段图片，因为这里面的商品表达很可能是不准确的，它可以帮助我们生成素材，生成背景，但如果今天卖的是一个水瓶，我描述一下生成一个水瓶，它一定不会跟品牌本身的商品是一模一样的，这种准确度是达不到的。

通过现有图片工具也好，文本工具也好，哪怕重新开发出这样的工具也好，它一定是可以去用。但是如果最终端给到商家去做商业使用，中间会有很大的门槛，准确度是不高的，而且会产生风险。

我们现在在做这件事情叫全自动，核心能力是可以调用市面上所有公开的模型能力，比如说图形生成能力，比如说文本能力，比如说软件可以合成视频的能力，所有这些能力都会集合到基于我们自己的语言大模型，将它生成为代码。

03商业应用全自动，变革内容生产模式

我再来解释一下什么叫全自动。我们做视频，就是文案、素材、背景、镜头、动效、渲染、混剪，这是做视频所有的动作。如果今天没有我们的工具，大家会怎么做呢？传统意义上可能是一个剪辑师或者一个美工，他会用一些工具，比如Photoshop或者他做视频的CCD或者Blender，然后通过自己找到各种素材去做一条视频。现在市面上有大量的工具，这些工具可以给到专业人士进行提效。

我们一直在说，现在3D动画师很幸福，他可以通过大量工具，根据他的想象快速生成一些素材，再结合他的创意把这些素材整合到工具里面，最后做出这个视频。这里面的核心能力是什么？核心是3D动画师或者剪辑师。但是我们觉得它其实没有真正体现商业价值的改变。

我们再来举个例子，传统意义上今天一个美工或者创意师，每天可以做两段视频，这个视频可以做到100分。我们通过提效的工具可以实现一个人一天可以做10条视频，提效了5倍。这个已经非常惊人了，老板非常开心。因为这些视频是通过AI的方式去做的，可能不能达到100分的效果，只能达到90分，但其实完全OK了。

那我们在做什么事情呢？首先这个人没有了，并不存在一个人每天做多少片子。在没有人的情况下，我们每天可以做1000条，甚至一万条。我们现在对视频数量是没有限制的。我们可以做到多少分呢？我们起始可以做到80分、85分，然后通过不断训练脚本模型可以达到90分，所以它根本上解决的不光是效率问题，而是产出模式的问题。如果今天是人做的，还是每天有一个产能的限制，如果让AI全自动做，这个限制就没有了，可以每天产出无限的视频，核心能力就是全自动。

同时还有一点好处，随着不断有新的技术出来，假设有一天AI生成的元素已经非常高级，可以生成视频的素材，我们可以整合进FancyGPT的自动化能力。如果今天有另外一个文本比ChatGPT写的还要好，那我们可以外加一个FancyGPT的能力，这是我们想要做的。我们核心是做AI视频自动化生成的工具。

那我们怎么实现了呢？我们叫FancyGPT，这个是我们自主研发的，基于LLaMA模型进行自己调参，调参600亿参数做的大语言模型。这个模型目前是国内唯一泛商业领域的通用语言大模型。这个模型只能做一件事情。你问它别的问题，它不能回答你，但可以回答你一件事情，就是你只要输入一个商品的链接地址，它会自动去解析，生成一段代码。这里面会涉及到第一秒调用这个镜头，我要生成这段文本，第二秒我的产品要进行左移，调用第二个镜头生成第二个文案。这是FancyGPT现在的核心能力，它可以快速生成一段代码，在我们自己的视频渲染软件里面，通过代码实现的方式自动把视频做出来。

它是怎么做到的呢？首先进行了大量的数据训练，我们本身积累了过去三年中国品牌在电商渠道，淘宝、京东和抖音，还有在社交渠道，小红书、微博和微信公众号里面大量的商品表达信息，包含了图片、视频、标题、评论。这是非常好的数据集，我们对它进行了完整的训练，最终得到了FancyGPT。

这个训练过程只是解决两个问题——准确性和时效性。我们的模型可以输出的文本，输出这些素材，首先准确度极高，基本上不会让品牌来挑战我们内容的准确度，同时时效性非常高。现在每天要生成10万条视频，然而我们并没有一个售后团队来对应品牌，意味着我们产出视频的质量非常高，否则我们会有大量的人要去应对品牌的诉求。通过这一点实现了全自动之后，接下去要做的就是内容的输入和输出，最终形成视频。

看一下输入端需要的是什么？从最基础的店铺商品链接的素材，我们目前已经可以实现品牌把商品店铺ID 给到我们，进行绑定之后，我们自动解析品牌电商店铺里面所有素材的信息、图片、视频、文本描述。通过全自动方式调用素材，重新做整合，自动生成视频。因为我们有全自动能力，所以也接受品牌的定制化需求。再加一个工作就是品牌需要把产品寄给我们，进行3D模型的建立，我们帮他获得了虚拟商品资产之后，就可以帮他做进阶的高级3D视频。同时，我们也接受基于品牌的内容素材，现在可以通过获得品牌的直播录像、客服聊天记录，包括品牌自己的培训资料给到AI，我们会帮他做二次的数据调优，因为底层模型是我们自己开发的，完全具备这个能力。

目前可以实现的是，只要基于差不多200条品牌信息，就可以帮品牌调一个基于品牌自己的商品信息进行精准表达的小模型。

具备了这些能力，获得这些输入之后，我们的输出是什么呢？

有两套解决方案，一套叫超麦视频，主打的就是金字塔的底层部分，大量的长尾款。因为现在平台是有电商流量红利的，视频红利的，所以通过超麦视频SaaS化的年费服务，可以快速帮品牌把电商所有的内容全部视频化，获得平台的流量红利。这一步是完全不需要人工介入，只要品牌把店铺绑定给我，我这边视频就可以输出，而且我可以直接同步到品牌的视频投放渠道，做内容监控，并且做自动优化。

第二步，品牌一定会有进阶的内容要求，做一些比较高级的创意视频。我们通过获得他的3D建模之后，提供另一套解决方案叫得体营销。简单来讲就是一个内部的AI创新广告公司，我们可以把品牌的创意进行AI自动化。今天品牌给我一条创意视频，或者他希望可以实现某一个创意的想法，任何一段视频都会拆解出镜头、脚本、元素、动效，拆完之后把它变成代码，品牌如果还有别的产品，我可以按照品牌现有的视频范式去生成视频。

接下去有大量的视频案例给大家看一下，大家如果有问题，可以随时来讨论。

这是最典型的某一个商家的淘宝的商详页，里面有五张图，正面、反面、细节的模特图。下面有一个标题，再往下是详细的描述。我们跟这家店铺合作之后，自动获得所有的信息，然后就开始输出视频，在后台，商家什么都不需要操作，直接可以看到视频。

大家可能会觉得这段视频没有什么亮眼。我来告诉大家，这个视频的核心能力是什么？首先在后台是没有模板的，视频里面所有的镜头，比如这个产品图片是这样切出来的，中间要混剪一段模特走秀，所有动作合成的决定并不是人，是我们的AI。

我们会做到什么呢？今天同样一个商详页，我们可以生成无数视频。因为每一次AI 调用的镜头和生成视频是不一样的，所以我们在这样的服务框架下，可以帮品牌生成无限量的基础视频。这些视频的应用场景基本上是公域视频获得流量的渠道，比如在淘宝的微详情，包括京东、淘宝和抖音所有整个商详页的视频，我们都可以获得。

我再快速讲一下我们公司，公司成立三年，目前差不多有200个员工，有差不多500个合作伙伴。最重要的是每天产出的视频量在飞速地增加，现在每天产出差不多10万条视频量。

好的，今天我的分享就到这边，我们有一个微信视频号，里面有非常多的案例。大家如果有兴趣的话也可以来关注一下，获得更多关于我们的信息，谢谢大家。

关于本次会议

7月13日，2023服装产业数字化创新峰会暨长三角产业数字化创新峰会在常熟举办。本届峰会由中共常熟市委人才工作领导小组办公室、常熟市人力资源和社会保障局主办，常熟市工业和信息化局、常熟市商务局支持，江苏常熟服装城管委会、亿邦动力承办，常熟市纺织服装协会、常熟市电子商务协会协办。

作为纺织服装产业的年度盛会，本届峰会以“韧性”为主题，邀请了服装领域头部企业和知名品牌、优秀技术服务商、供应链平台代表等嘉宾，围绕“品牌创新之韧”、“数字营销之韧”、“研发设计之韧”和“数字供应链之韧”等四大角度依次展开讨论，共话纺织服装行业的数字化前景。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，应及时向本网站提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后，将会依法尽快联系相关文章源头核实，沟通删除相关内容或断开相关链接。

时代涌现茅旭超：AIGC让我们一天生产10万条视频

下一篇