在数睿数据nextionBI发布会上,企业展示了对数据分析的 理解

2022年2月25日,数睿数据正式发布下一代专注知识的BI产品——nextionBI,启动了自己“无代码+BI”的双产品战略布局。数睿数据总裁刘超总结,当前的BI产品过于依赖专业人员,但从根本上看是由于对于机器、知识和环境的依赖。表面上是BI产品需要专业的人去治理机器产生的脏数据,去梳理专业领域的知识,去完成知识在系统间的迁移。但本质是BI产品要求机器需要产出标准统一、质量上乘的基础数据,要求有大量可以直接录系统的行业知识,要求有一个统一的外部环境供知识在系统间自由分享。过渡的依赖外部环境,反而限制的BI产品自身的发展。下一代BI应该专注于从内部出发,主动去解决这些依赖,发展知识积累能力,主动优化融合现有数据资产,发展知识发现能力,能够快速总结归纳行业知识,发展知识传播能力,能够便捷打包成果对外输出。

而早在之前,传统行业也发现了现有的BI产品只能帮助他们看清现在,但无法看到未来,没有办法对发现的异常,从根本上给出措施建议开始探索通过新的视角重新审视业务痼疾,寻求解决之道。

nextionBI也在发布会上分享了和一些传统企业共谋数字化解决方案的真实故事,这些企业试图解决所在行业的共性问题,基于传统手段已经很难取得显著的突破。而通过与数睿数据这样的数字科技企业的合作,探索问题的另一种解法,将逐渐成为所在行业技术创新的主流。

发布会上首先分享的是一家纸材料生产制造企业,主要生产白卡纸。白卡纸属于工业用纸,采用100%漂白化学制浆抄制,具有坚挺厚实、平滑度高的特点,一般定量在210g-400g/㎡。白卡纸的产品类型主要分为纸盒、卡纸、纸袋,分别占比60%、20%、10%;下游主要应用于各类精细产品包装,如烟酒、化妆品、日用品、药品、食品、3C等日常消费产品包装。白卡纸的下游应用以必需消费品包装为主,终端需求持续稳定增长。

在数睿数据nextionBI发布会上,企业展示了对数据分析的
理解

从中国造纸协会发布的《中国造纸工业2020年度报告》中数据来看,2020 年包装用纸生产量 705 万吨,较上年增长 1.44%;消费量718 万吨,较上年增长 2.72%,是2020年纸产品中少数消费增长高于产量增长的品类。

白卡纸当前已呈现寡头垄断格局,以金光纸业、博汇纸业、晨鸣纸业、万国太阳为代表的寡头合计产能占比高达79%。金光、博汇和晨鸣的白卡纸年产能均达到200万吨以上,其中,金光纸业旗下的白卡纸生产企业包括亚洲浆纸业(150万吨/年)、广西金桂(100万吨/年)、宁波中华(62万吨/年),分布在浙江、广西等地;博汇纸业的白卡纸生产规模仅次于金光,产能主要分布在山东和江苏,合计年产能215万吨/年;晨鸣的产能主要分布在广东、山东、江西等地,合计年产能200万吨/年。

会上分享的企业作为现有的寡头之一,希望在良好的市场环境下,保持现有的竞争优势,除了营销工作之外,产品质量的稳定性是一个重要的基础。对于白卡纸来说,纸张的克重是衡量产品质量的重要指标。每个批次的纸张克重偏差越小,产品的质量稳定度也就越高。

但该企业的研发部门统计数据之后发现,目前白卡纸产品存在克重偏差较大的质量稳定性问题。由于克重不稳定,为了保证整体良品率,就不得不增加每个批次生产过程中的原料使用,从而保证即使偏差较大,但多数产品仍能够满足质量要求。但这样做显然会提高企业的生产成本,且整体的产品质量参差不齐,极大的损害了产品口碑,优化生产过程刻不容缓。

在接触nextionBI之前,该企业也早就开始针对这一问题探索解决方案,但是遇到几个现实的困难。首先,造纸过程相关的数据量极大,种类繁多。有的来自于自动化设备,有的来自于软件系统,有的靠人员手工记录,还有部分非结构化数据。这其中还包含大量的脏数据,存在诸如标准不统一、空值比例高、数据乱码等问题。在数据分析之前需要先完成复杂的数据清洗、数据标准化、数据关联等工作。企业研发部的人员虽然了解纸张生产数据的正确格式、知道不同字段的标准度量、能够将编码代号翻译成文本,但是他们大多不懂SQL语句,无法完成批量的数据加工处理工作。其次,经过材料研发人员对于大量历史数据的整理,生产制造过程中影响纸张克重的因素超过140种。但是具体是哪个因素对于克重有影响,是正相关还是负相关,这都需要一一测试。按照控制变量法的理论要求,至少要测试140次,每次都需要设计实验,调整参数,统计结果,这显然不具备可操作性。最后,难以定位影响因素对最终质量的影响值,不知道如何进行优化,针对某个因素具体优化值是多少?明确相关性只是第一步,下一步需要明确是线性相关还是指数相关,要有具体的相关函数才能形成量化可落地的操作建议。

对于数字化生产,企业认为不能简单的只是通过大屏展示生产结果数据现状,然后靠老师傅的经验决定优化方式,再通过一段时间的数据反馈判断优化效果,这种模式周期长,风险高。合理的方式应该是基于生产过程的数据分析,给出精准的操作建议,再通过生产测试进行验证,敲定生产优化措施。这就需要用到nextionBI的数据融合能力与增强分析中的主因子分析和根因定位能力。

在数睿数据nextionBI发布会上,企业展示了对数据分析的
理解

针对第一个痛点,nextionBI对接生产数据,通过强大的数据交换机能力,完成复杂的数据处理流程,实现接入数据的清洗加工,排除异常数据对于分析结果的影响。这个过程不用写任何技术代码,一个纸材料的研发人员经过简单的培训,自己就可以通过拖拽数据加工算子的方式,配置加工流程,完成大量原始数据的加工处理。如上图所示是将三个来自不同系统的数据表经过加工处理,最终融合形成了一个数据资产。整个过程清晰可见,每个步骤对应的模块都可以动态调整,大大提升了数据处理过程的灵活度。这样就解决了数据分析基础素材的问题,为后续的分析打好了基础。

在数睿数据nextionBI发布会上,企业展示了对数据分析的
理解

针对第二个痛点,利用nextionBI增强分析中的主因子分析能力,帮助客户从140多个影响因子中,快速定位影响纸张克重的主要影响因子,并提供主因子对结果的影响分析,并提供每个因子的影响值分析。如上图所示,影响因子的影响值排名从高到低分别显示的是2号浆液流量、车速、1号浆液流量、冲浆流量这四个因子,并且给出了具体的影响值,这就为下一步的分析工作提供了量化的参考依据。

针对第三个痛点,采用根因分析,通过根因定位分析能力,对影响纸张克重的可能进行根因组合,列出组合排名。提取主因子,将每种组合的具体值列出,提供系数调整优化值建议,直接提供量化的指导。

在数睿数据nextionBI发布会上,企业展示了对数据分析的
理解

如上图中所示,为不同因子分配不同的参数选择,形成多种组合。针对不同的组合分析其可能性的占比。比如图中的组合三就代表了2号纸浆流量小于等于14.25,1号纸浆流量小于等于32.05,车速小于 33.156这种参数组合形式,但是这种组合方式相较于组合一的可能性占比是偏低的,为了达到优化目标,最终应该选择组合一对应的参数设计。基于这些分析,进行了多次实验,研发部门给出了具体操作建议,帮助生产部门快速改善生产过程,稳定生产质量。

企业按照准备数据,确定方向,量化措施的过程,一步一步有条不紊的完成之前一直困扰他们的产品质量稳定性问题。nextionBI作为新发布的下一代BI的代表,其强大的数据融合处理能力、增强分析能力都很好地帮助企业完成了这次优化生产过程的目标。下一代BI的新能力,给企业提供了解决问题的新手段和方向。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

Baidu
map