2月7日消息,新年伊始,AI领域又迎来了一位耀眼的新星——DeepSeek。这位初出茅庐却势不可挡的选手,以惊人的速度席卷全球,超越ChatGPT成为全球增速最快的AI应用,也吸引了越来越多的企业使用DeepSeek系列模型。
事实上,类似的剧情在过去一年中已屡见不鲜,从GPT4到Claude 3.5再到o1……虽然这次的主角是DeepSeek,但AI领域还处于“模型争霸”时代的本质依然没变。
每当一个更强模型出现时,对普通用户而言,要使用最新AI很简单,下载对应的APP(比如这次是DeepSeek APP)直接用起来就行了。但是,对依赖大模型构建的企业级AI应用来说,要想每次都能快速、无缝使用上最新大模型的能力,就没这么简单了,需要解决一系列部署和使用模型中的工程化问题。
站在企业视角,“模型争霸”时代可谓是“铁打的应用,流水的模型”。那么,自身铁打的应用,该如何每次都能无缝搭乘上流水般涌现的新模型的东风,无疑是企业最关心的事。
“不会有一个模型一统天下”,亚马逊CEO Andy Jassy在2024 re:Invent上分享了亚马逊自身部署人工智能的关键洞察时就强调过。
在此洞察下,亚马逊云科技对帮助客户构建企业级AI应用早已有了一套成熟的思维方式和工具箱。比如,在第一时间,亚马逊云科技就已为企业提供了4种方式来部署DeepSeek-R1系列模型。
这里一起看看亚马逊云科技构建企业级AI应用的思维和工具。
认识到模型多样性的重要
如同Andy Jassy在此前的演讲中所述:“就像数据库领域,探讨了10年,大家会使用各种各样的关系型数据库或者非关系型数据库。在分析领域也是如此,曾经大家觉得TensorFlow会成为唯一的AI框架,而一直强调会有很多不同框架出现,最终PyTorch成为了最受欢迎的那个。”企业在基于大模型构建应用时,不同的应用场景需要的技术指标也各不相同,延迟、成本、微调能力、知识库协调能力、多模态支持能力等等,都会因场景需求的不同而被取舍。
2024年12月亚马逊CEO Andy Jassy在2024 re:Invent上演讲
就以DeepSeek为例,其于2024年12月推出DeepSeek-V3模型后,于2025年1月20日相继发布了参数规模达6710亿的DeepSeek-R1、DeepSeek-R1-Zero以及参数范围覆盖15亿至700亿的DeepSeek-R1-Distill系列模型。2025年1月27日,DeepSeek又新增了基于视觉的Janus-Pro-7B模型。这些模型均已开源,公开资料显示,DeepSeek系列模型通过强化学习等创新训练方法,在推理能力方面具有显著优势,并且成本效益比同类模型高出90%-95%。
但是,以快速响应场景为例,DeepSeek R1的深层思考模式显然不太合适,其生成首个token的用时超过30秒,而Amazon Nova模型则只需要数百毫秒即可生成响应。另外,目前的DeepSeek-V3模型只是文生文模型,不支持图形等多模态信息的输入。
可见,强如DeepSeek模型也不是万能的。
正是从最初就洞察到“不会有一个模型一统天下”,亚马逊云科技在精进自身大模型的同时,一直致力于为企业用户提供丰富的模型“选择”。
目前,Amazon Bedrock已上架AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI、Luma AI、poolside等厂商的最新大模型,近期还上线了Luma AI Ray 2 模型。
同时,亚马逊云科技还推出了Amazon Bedrock Marketplace功能,为客户提供100多个热门、新兴及专业模型,这其中就包括DeepSeek-R1。
如Andy Jassy所言,亚马逊云科技提供的丰富且有 的模型,让客户能够根据自身独特需求,精确选择最合适的解决方案。关注客户需求与技术发展,亚马逊云科技持续扩展模型选择,既要有潜力的新兴模型,也要有行业内的经典模型。
打造企业级AI工具全家桶
需要注意的是,基于场景选择合适的模型只是企业构建应用旅程的第一步。随着构建的深入,解决工程化问题的能力成为能否成功构建的关键。
模型成本、性能、能否针对私有数据进行定制优化,够不够安全,不同尺寸的模型和日益增长的各种智能体的复杂调度等等,这些企业部署和使用模型中的工程化问题都需要得到完美解决。
以DeepSeek为例,其公开的模型有V3和R1等不同的型号,R1也有不同的尺寸规模,如DeepSeek-R1-Distill系列模型参数范围是15亿至700亿,而R1和R1-Zero的参数规模则达到6710亿。要完整部署R1实现完美推理和响应,还需要配套的便捷工具。
Amazon Bedrock聚焦企业应用AI的实际需求,在提供丰富模型选择的同时,增添了一系列工具和功能。如低延迟优化推理、模型蒸馏、提示词缓存等功能,大幅提升推理效率。以模型蒸馏功能为例,它能够将特定知识从功能强大的大模型转移到更小、更高效的模型,运行速度最快可提高500%,成本降低75%。
Amazon Bedrock支持基于企业自有数据的定制优化。如模型微调功能,支持GraphRAG等图数据,以及够快速且经济高效地从文档、图像、音频以及视频中提取信息,并将其转换为结构化格式的Amazon Bedrock Data Automation功能等。
Amazon Bedrock负责任AI的安全和审查,通过不断丰富Guardrails功能,以简化企业实施负责任AI的投入,例入为其加入自动推理检查功能,从而能够轻松识别事实性错误,以提升生成回答的准确性。
Amazon Bedrock不但提供智能体功能,还针对智能体的快速发展,进一步推出了多智能体协作功能,使客户能够轻松地构建和协调专业智能体来执行复杂的工作流程。凭借多智能体协作功能,客户可以通过为项目的特定步骤创建和分配专用智能体,从而获得更准确的结果,并通过编排多个并行工作的智能体来加速任务。
目前,亚马逊云科技现已推出针对DeepSeek-R1模型四种不同的部署方式,企业可以在熟悉的亚马逊云科技环境中轻松部署该系列模型,例如在Amazon Bedrock Marketplace中部署,或在Amazon SageMaker Jumpstart中部署,也可以通过Amazon Bedrock自定义导入功能或Amazon EC2 Trn1实例中部署DeepSeek-R1-Distill系列模型。
图注:在Amazon Bedrock Marketplace中调用DeepSeek-R1模型
图注:在Amazon SageMaker Jumpstart中部署DeepSeek-R1模型
总结来看,亚马逊云科技围绕云和AI领域展开的全栈式创新,为企业运用全球领先模型提供三大支持:
首先是云端本身的优势,与本地部署相比,云端部署更灵活更易扩展,同时也能与云端丰富且成熟的分析、数据等基础服务进行无缝集成;
其次是多样化的模型选择优势,不同的场景能够灵活选择不同成本、性能、响应速度的模型,从而实现最优的性价比组合;
最后是模型从原型走向企业化生产环境时必须要考虑的一系列重要功能,堪称企业级AI全家桶,包括优化成本、根据自有数据定制提升准确性、至关重要的安全性以及针对未来复杂的多智能体构建和管理等。
亚马逊云科技大中华区产品部总经理陈晓建强调:“亚马逊云科技是全球云计算的开创者和引领者,更是企业构建和应用生成式AI的首选。我们不仅在云的核心服务层面持续创新,更在从芯片到模型,再到应用的每一个技术堆栈取得突破,让不同层级的创新相互赋能、协同进化。我相信,只有这样全栈联动的大规模创新才能真正满足当今客户的发展需求,加速前沿技术的价值释放,助力各行各业重塑未来。”(果青)
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )