文|智能相对论
作者|叶远风
在底层硬件创新之外,软件创新对提升中国前沿科技竞争力同样重要,这其中,开源的必要性毋庸置疑。但是,在全球范围内开源项目硕果累累的大背景下,中国开源过去的发展却不够快,直到最近几年才开始发力与加速。
这个过程,有大厂的宏观布局,也有垂直领域的创新企业的积极参与,整个市场的热情已经被点燃。例如,不久前全域数据能力服务商爱数正式开源了其认知智能开发框架“KWeaver”,这个产品脱胎于爱数的AnyDATA Framework 2,通过数据+AI,推动领域认知智能。
但是,KWeaver并没有采用全套高举高打的方式,爱数低调务实同时又信心满满,这背后,或也反映出中国开源项目内在的价值驱动要求。
政策驱动表象下,开源藏着价值驱动的里
基本上,能够叫得上名号的开源项目,无论是业界还是普通大众,对其印象往往都是大量的推动政策,背后的商业公司投入一系列资源,让项目有更多的参与者、更好地参与其中,加速项目的发展。
典型如,华为在新计算产业的代表昇腾AI,其全栈体系中的开发框架MindSpore开源两年,华为不断从高校人才合作、创新赛事、大模型产业联动(MindSpore在大模型训练上有特殊优势)来推动MindSpore的发展,意图更快地向Google TensorFlow靠拢。
此外,华为开源的服务器操作系统欧拉(openEuler)脱胎于过去其自用的EulerOS操作系统,在推动项目发展过程中,华为不断动用自身的产业资源优势,通过新计算架构的生态链构建来吸引开发者,推进欧拉社区的活跃度。
类似的还有百度在飞桨开源后,几乎年年都举行大规模人工智能产业创新大赛,除了提供丰厚的奖励,还邀请行业内的创投机构作为评委提供开发者将项目落地的机会。
还有更多开源项目都是如此,给人的印象都是一套技术基座配合开发者共创工具、模型、产业案例与实践经验,然后要给予大量政策支持,对接产业需求、建立产学研用正循环,把火烧旺。
但是,这些可能只是表象。无论什么开源项目,能够有起色最根本还在于其背后的商业价值或社会价值。
MindSpore、飞桨开源能够走下去,核心在于当AI进入工业化大生产时代,需要批量出产AI应用的时候,一个优质AI开发框架填补空缺十分必要,享受更便捷的开发框架是AI开发企业、产业伙伴的共同追求。
欧拉开源项目的发展,更是因为中国服务器操作系统严重空缺,而世界范围内那些传统的操作系统存在各种与当下计算需求(尤其是异构计算)的不匹配,这时候,寻求计算能力突破、数字化变革的企业们,迫切需要一个更高效和便捷的服务器操作系统。甚至,随着这种需求的进一步发酵,欧拉还在成为整个数字基础设施的操作系统,与鸿蒙在物联网终端的落地打起了配合。
在中国开源项目亟待快速发展的今天,毫无疑问,这样的价值内核才是开源项目能够高质量、快速发展的根本所在。
换句话说,如果是一块石头,怎么烧,火都是烧不旺的。
回过头来看,KWeaver这类项目的出现,也在基于价值驱动的内在逻辑,也是人工智能发展到认知智能解读的必然。
人工智能有两条线,感知智能与认知智能,目前无疑认知智能是热点,而领域认知智能是认知智能在各个场景下的不断垂直细化。领域即业务,用简单的话说,领域认知智能就是让组织拥有与人一样的“智商”,能够在吸收大量数据和信息后对外做出有逻辑的判断、推理,帮助组织解决特定的业务问题。
随着数字经济的发展,只会刻板“看数字”的业务能力已经无法满足组织的需要,能够“理解”和“解释”业务,通过数据做系统性的推理、规划,才能更好地帮助组织发展,这是数据驱动型组织的本质。这种实现了人类独有认知能力的领域认知智能,对推动数字化转型、解决业务痛点、实现降本增效有直接的价值。
KWeaver的推出,仰仗的就是这样的价值,也必须有这样的价值。
例如,KWeaver孵化自爱数三年的产品积累,其背后的 AnyDATA已经建立起了系统的数据编织到知识网络构建,再到认知推理分析的体系。在某智慧城市,构建了一套基于产业经济学理论的五维产业链模型,通过内外部数据融合,结合产业链推理分析场景,帮助区域实现从产业链精准招商、主动企业服务优化营商、内外部关联产业与经济分析,完全通过数据和业务关系网络来辅助区域产业布局、招商引资、数字化营商新模式。无论是政府数字化转型,还是企业数字化转型,爱数已经构建起来了数字化的认知模型:
• 定目标:从战略目标拆解到业务流程结构;
• 深观察:通过系统和数据观察业务状态;
• 反思优化:通过指标对比与风险监控发现问题,通过知识网络定位根因,再形成优化路径;
• 决策执行:最终形成认知分析报告和建议,指导数字化优化和执行。
认知智能是人工智能的下一程,领域认知智能的发展,让这个赛道上的开源项目有了价值支撑—在很多有价值的技术领域,新的开源项目可能已经在路上。
开发者、企业、行业,开源的价值还必须走向多方共赢
具体到不同的主体,开源项目又需要有不同的价值体现,任何一方无法获益,项目将最终无法走下去。
1、 对开发者,商业或社会价值带来最终的参与内驱力
参与到开源项目的开发者,包括专注于技术的开发人员,或者产业链中的客户企业等,项目带给他们的价值是参与到社区的最终内驱力。如果一个项目只是给予各种政策而缺乏实际的价值产出,很容易浪费资源甚至沦为“骗补贴”的游戏。
欧拉的快速发展,得益于众多参与项目的企业都能够开发出自己的商用版本,共享一些便捷的技术能力,例如操作系统厂商可以做出更加适合市场需要的版本,服务于其客户。
而KWeaver同样如此,想要通过AnyDATA推动认知智能的企业,一方面能够共享到许多技术方案,另一方面也能够通过开源将KWeaver集成到自身相关的系统中,做更智能的搜索、建设自己的认知中台等。
另外,开发者通过爱数的平台,还能实现诸如数据交易、知识变现等价值。
2、对企业,带来新兴领域发展的杠杆效应
在商业市场上,开源对主推项目的企业而言,至少要实现三种价值中的一种:培养用户、确定行业标准或者获得商业价值,否则开源项目就会失去往往是最大的技术支持来源。
以KWeaver为例,其对爱数而言,是在领域认知智能领域以技术共享的方式快速培养用户,并通过算法开源一定程度上确定行业标准,最终在领域认知智能全面开花后,凭借自家的AnyDATA产品获取对应的商业价值,实现三者兼顾。
实际上,这些价值背后,开源项目通过更多方面的参与,让企业能够撬动发展的杠杆,让更多人共享也就是让更多的人参与,加速技术创新——KWeaver让领域认知智能在各种细分领域都有对应的开发者,完成爱数一家企业无法完成的全领域认知智能,推动领域认知智能在全场景的落地,在这个过程中,爱数只需要做好底层技术服务、做好标杆领域示范即可。
3、对行业,根本上改变技术和产品发展的轨迹
众人拾柴火焰高,开源的一个重要价值,是在行业层面推动技术的快速演化,尤其是在全球化的力量参与下,更快实现技术进步、行业崛起,这种价值让整个行业有更好的发展前景,也才能支撑开源项目一直走下去,这其实是一个类似于推动“朝阳产业”发展的过程。
MindSpore、欧拉背后,新计算产业快速发展,带来了广阔的市场机遇,反过来又让开源项目越来越有期望,更多的加入者、更好的前景,一步步滚雪球。
KWeaver也是如此,其开源让领域认知智能获得全球化的参与力量,不再只有爱数一家企业推动,让人工智能中的认知智能能够以垂直细化的方式全面落地。在这个过程中,更多的企业也将获得普惠化的认知智能,使认知智能走下高高的神坛,以垂直化的方式深入千行百业,营造出广阔的发展前景。
价值驱动的同时,开源项目还要完成“底色”的描绘
当然,开源项目在价值驱动的同时,一些必要配套工作也必不可少,科技大厂们那种大量资源投入的政策做法可以看作是这方面的代表,但从KWeaver来看,还有两个方面的动作必须完成。
一是在更高代码质量要求的情况下,能够源源不断输入优质技术能力。
越是初期,来自项目主推企业的技术支撑就越为重要。一个AI开源项目最开始被贡献出来的代码质量奠定了开源社区的“品质”基调。
2019年立项,2021年1月发布1.0版,2021年正式走向商业落地,2022年3月正式发布AnyDATA 2.0……在KWeaver走向开源前,爱数已经在AnyDATA上进行了3年多的打磨,保障了开源项目最基本、最核心的技术能力。
目前,KWeaver提供有可视化的知识网络工作台,可视化的认知智能应用开发调试工具,丰富的数据加工及模型训练工具,以及所见即所得的API文档等。这背后,还离不开爱数十多年精益研发经验,对代码质量的把控,在各种测试上的有效覆盖,才能有底气做开源。
二是开源的态度建设,越开放的心态、越少的限制,越能够激发开发者的热情和创新能力。
基本上,越是成功的开源项目,在对开发者的限制上就越少,甚至“放任自由”。与此同时,越是早期的开源项目,对开发者的“放任”就越能带来更积极的结果。
KWeaver选择了Apache license 2.0作为开源许可证,原因可能就是如此。这是一个比GNU、GPL、BSD等常用许可证更加自由的标准,几乎对开发者不加以限制,可以自由利用代码。
事实上,KWeaver的出现还带有普惠技术赋能产业的色彩,人人都可以在 GitHub上获取代码,其源代码开源且技术透明,任何参与项目的用户都可以查看全部技术细节,同时还支持多元异构数据源对接,提供SDK兼容更多的第三方知识抽取模型,提供 API和 Web组件的整合方式,几乎是全方位的自由。
总而言之,中国开源项目任重道远,但遵循价值驱动的逻辑,随着各大开源项目尤其是AI开源项目的发布,这个进程正在加快。在一开始就盯住价值的情况下,这些开源项目也锁定了长期的发展潜力,为中国开源项目带来更多可能性,在全球软件创新竞争中获得更多优势。
*本文图片均来源于网络
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。