10月30日消息,10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并罕见地配套开源了600GB、150B Tokens的超大高质量开源中文数据集。
昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Math模型,它们在CEVAL, GSM8K等多个权威评测与基准测试上都展现了同等规模模型的最佳效果,其中文能力尤为出色,在中文科技、金融、政务等领域表现均高于其他开源模型。
除模型开源外,Skywork-13B系列大模型还将开源600GB、150B Tokens的高质量中文语料数据集Skypile/Chinese-Web-Text-150B,这是目前最大的开源中文数据集之一。
同时,昆仑万维「天工」Skywork-13B系列大模型即将全面开放商用——开发者无需申请,即可商用。
130亿参数、两大模型、最大中文数据集之一、全面开放商用。昆仑万维「天工」Skywork-13B系列大模型堪称业内开源最彻底的百亿高质量商用模型。
Skywork-13B系列大模型的开源将为大模型的场景应用和开源社区发展提供最佳技术支持,降低大模型商业门槛,推动人工智能技术落地千行百业,为人工智能生态建设添砖加瓦,携手开源社区探索未知世界、创造美好未来。
两大模型 领先行业
昆仑万维「天工」Skywork-13B系列包括两大模型及150B高质量中文数据集。
Skywork-13B-Base模型是Skywork-13B的基础模型,其经由3.2万亿个多语言高质量数据训练,在CEVAL, CMMLU, MMLU, GSM8K等评测与基准测试上都展现了同等规模模型的最佳效果。Skywork-13B-Math模型经过专门的数学能力强化训练,在GSM8K等数据集上取得了同等规模模型的最佳效果。Skypile/Chinese-Web-Text-150B数据集。该数据集是根据我们经过精心过滤的数据处理流程从中文网页中筛选出的高质量数据。本次开源的数据集大小约为600GB,总token数量约为(1500亿),是目前最大得开源中文数据集之一。除此之外,Skywork-13B系列还公开了模型中使用的评估方法、数据配比研究和训练基础设施调优方案等。希望这些开源内容能够进一步启发社区对于大型模型预训练的认知,并推动人工智能通用智能(AGI)的实现。
五大特点 全面超越
昆仑万维「天工」Skywork-13B系列大模型在CEVAL, GSM8K等多个权威评测与基准测试上都展现了同等规模模型的最佳效果,其中文能力尤为出色,在中文科技、金融、政务等领域表现均高于其他开源模型。
Skywork-13B系列模型的五大特点:
最强参数表现:全面超越同等规模大模型
本次开源的Skywork-13B系列模型在CEVAL, CMMLU, MMLU, GSM8K等几大权威评估基准中全面超越LLaMA2-13B等开源大模型,在同等规模大模型间取得最佳效果。(截止至10月25日数据)
最多训练数据:3.2T高质量的多语言训练数据
Skywork-13B系列大模型拥有130亿参数、3.2万亿高质量多语言训练数据。模型的生成能力、创作能力和数学推理能力提升明显。
最强中文语言建模能力:中文语言建模困惑度评测,超越所有中文开源模型
Skywork-13B系列大模型在中文语言建模方面表现出色,具有优秀的中文文创能力。在中文文本创作领域的评测中,Skywork-13B系列大模型展现出了卓越的能力,尤其在科技、金融、政务、企业服务、文创、游戏等领域均表现高于业内其他开源模型。
上图为不同领域数据下评估模型的困惑度,越低代表模型在该领域建模能力越强。结果显示天工13B在技术文章,电影,政务报告,游戏,金融,通用领域均表现出色
最大中文开源数据集之一:150B Tokens高质量中文语料
Skywork-13B系列将配套开源600GB、150B Tokens的高质量中文语料数据集Skypile/Chinese-Web-Text-150B,这是目前最大的开源中文数据集之一。开发者可以最大程度地借鉴技术报告中大模型预训练的过程和经验, 定制模型参数,有针对性的进行训练与优化。
最有诚意的开源商用:无需申请,即可实现商用
目前开源社区中的中文大模型多数并非是完全可商用,一般开源社区用户通常需要进行复杂的商用授权申请流程,在某些情况,甚至有对公司规模、所在行业、用户数等维度有明确规定不给予商业授权。
昆仑万维对Skywork-13B系列开源的开放性和可商用性高度重视,将授权流程做到极简,取消对行业、公司规模、用户等方面的限制,目的是帮助更多对中文大模型感兴趣的用户和企业在行业中不断探索和进步。
此次Skywork-13B系列大模型将全面开放商用许可,用户在下载模型并同意并遵守《Skywork模型社区许可协议》后,无需再次申请授权即可将大模型进行商业用途。希望用户能够更便捷地探索Skywork-13B系列大模型技术能力,探索在不同场景下的商业化应用。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 阿里巴巴拟发行 26.5 亿美元和 170 亿人民币债券
- 腾讯音乐Q3持续稳健增长:总收入70.2亿元,付费用户数1.19亿
- 苹果Q4营收949亿美元同比增6%,在华营收微降
- 三星电子Q3营收79万亿韩元,营业利润受一次性成本影响下滑
- 赛力斯已向华为支付23亿,购买引望10%股权
- 格力电器三季度营收同比降超15%,净利润逆势增长
- 合合信息2024年前三季度业绩稳健:营收增长超21%,净利润增长超11%
- 台积电四季度营收有望再攀高峰,预计超260亿美元刷新纪录
- 韩国三星电子决定退出LED业务,市值蒸发超4600亿元
- 鸿蒙概念龙头大涨超9倍,北交所与新能源板块引领A股强势行情
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。