12月15日消息,自去年末ChatGPT横空出世后,这一年来,全球各大科技公司都在加快旗下GenAI技术研发和应用能力。
微软联合OpenAI的能力推出各种copilot服务,谷歌就在上周推出了号称“迄今为止最强大、最通用的多模态模型”Gemini;亚马逊一方面斥资40亿美元投资了Anthropic,另一方面在刚刚过去的亚马逊云科技re:Invent上一共发布了200多项新服务和功能、超过350项持续的更新,其中就包括不少GenAI相关的服务。
通过2023亚马逊云科技re:Invent,可以明显看出亚马逊的GenAI科技树发展脉络已经非常明晰。
三层架构为基
如亚马逊云科技大中华区产品部总经理陈晓建所说,在理解亚马逊云科技的GenAI技术发展时,要先了解到亚马逊云科技GenAI技术所要服务的目标对象,这一首要目标群体就是亚马逊云科技现有的数百万客户。亚马逊云科技的GenAI服务和功能期望能帮助客户更好的应用GenAI能力。
因此,亚马逊云科技将端到端应用生成式AI做了三层架构的规划,由下至上在底层提供用于训练基础模型和在生产中运行这些模型的基础设施;中间层提供调用和访问基础模型的最便捷的工具,让没有AI经验的构建者,直接获得应用生成式人工智能所需的所有工具,来构建自己的应用;顶层是利用基础模型构建的开箱即用的应用程序,让没有技术基础的业务用户,也能在具体场景中直接使用生成式AI。
底层 从芯片层的优化开始
在底层,亚马逊云科技提供用于基础模型训练和推理的基础设施。其中,就包括芯片层面的创新。
一方面,2023亚马逊云科技re:Invent,新发布自研Amazon Trainium2处理器,用于生成式 AI 和机器学习训练的专用芯片,针对训练具有数千亿至数万亿参数的基础模型进行优化,相较 Amazon Trainium 4 倍性能提升,65 exaflops的按需超级计算性能。
另一方面,亚马逊云科技和英伟达共同宣布了几项最新合作,亚马逊云科技将提供首款搭载NVIDIA Grace Hopper超级芯片和亚马逊云科技UltraClusters技术的云AI超级计算机;亚马逊云科技将提供首款搭载NVIDIA Grace Hopper超级芯片和亚马逊云科技UltraClusters技术的云AI超级计算机
中间层 三个递进层面的工具服务更新
在中间工具层,亚马逊云科技提供调用大语言模型和基础模型进行构建的工具。这些工具又分为3个层面,一是可供选择的大模型、二是可以用来定制模型的工具、三是模型集成工具。
亚马逊云科技于今年4月发布的Amazon Bedrock是一项全面托管的服务,通过它,企业用户可以通过API等方式轻松访问包括亚马逊云科技自研的Titan(Amazon Titan)系列模型和AI21 Labs、Anthropic、Cohere、Meta、Stability AI等众多主流第三方大模型。
在2023亚马逊云科技re:Invent,Amazon Bedrock进一步拓展了可被调用的模型类型,包括新增支持Anthropic Claude 2.1和Meta LLama 2 70B两款业内领先大模型;同时,亚马逊云科技自有的Titan模型推出了,Amazon Titan Text Embeddings模型,能将文本转换为向量;Amazon Titan Text Lite 一种更小巧、更具成本效益的模型,支持聊天机器人问答或文本摘要等用例;Amazon Titan Text Express 模型参数量更大,可用于更广泛的任务,如开放式文本生成和对话聊天;Amazon Titan Multimodal Embeddings多模态嵌入模型,能够创建更丰富的多模态搜索和推荐体验;Amazon Titan Image Generator图像生成模型预览版,现已推出预览版,使客户能够使用自然语言提示生成高质量、逼真的图像或增强现有图像。
亚马逊云科技认为,企业创造真正价值的生成式人工智能应用程序的关键就是能够用企业自己的书据进行定制,用数据进行定制才能构建企业的差异化壁垒。
因而,在提供更多模型选择的基础上,亚马逊云科技又提供了模型定制服务工具。
2023亚马逊云科技re:Invent上,新发布了Amazon Bedrock持续预训练功能,支持对 Amazon Titan Text Lite 与 Express持续预训练。据介绍,持续预训练是在Amazon Bedrock 中一种自定义模型的方法是。这是一种使用大量未标记数据(如内部报告、财务计划或研究成果的原始文本)来提高基础模型对特定领域的知识和推理能力的技术,这种方式是适合想要拥有“领域大模型”,或者说将领域知识以及技能嵌入大模型能力的场景。
一同新发布的还有Amazon Bedrock微调功能,微调是另外一项重要模型定制技术,经常被用来控制模型去理解特定的输入格式(比如固定问问题的问法),输出以及理解回答问题的角色。然后,Amazon Bedrock 会复制一个客户专属的基础模型,并结合客户准备的S3上的数据,进行微调,并生成一个新的定制模型。目前,Amazon Bedrock微调功能支持的模型包括Cohere Command、Meta Llama 2和Amazon Titan,并将很快支持Anthropic Claude 2。
还新发布Amazon Bedrock具有知识库的检索增强生成功能。RAG检索增强可能是现在最常见的用企业数据定制的方式。知识库功能可将模型安全地连接到公司内部数据源,并通过RAG检索增强生成的方式为聊天机器人或问答系统等应用提供更准确的回答。
有了模型和定制能力,还需要和应用集成才能服务于业务。
2023亚马逊云科技re:Invent上,亚马逊云科技还新发布了模型集成服务Amazon Bedrock 代理功能。它可以使生成式AI应用跨公司系统和数据源执行多步骤任务。通过代理功能,客户在进行访问权限等简单设置后即可用自然语言编写要求,随后代理即可自动分析请求并将其分解为逻辑序列,以及采取相应的行动。
顶层应用层 生成式AI助手Amazon Q+初成规模
在亚马逊云科技端到端应用生成式AI的最上层,就是应用层为客户直接提供利用基础模型构建的应用程序。
2023亚马逊云科技re:Invent上,亚马逊云科技发布生成式AI服务Amazon Q。
Amazon Q是亚马逊云科技的专家,由亚马逊云科技17年来积累的知识和经验训练而成,可以在多种界面回答客户提出的各种亚马逊云科技相关的专业问题。Amazon Q可以在Amazon CodeWhisperer中回答开发人员的各种代码相关的问题并附上可一键实施的代码,并提供代码转换功能可以将应用维护和升级时的代码转换所需时间从几天缩短至几分钟。
Amazon Q也是企业业务的专家,它拥有40多个兼容流行数据源的内置连接器,并支持自定义连接器,企业可以轻松将其连接至其业务数据和系统中。Amazon Q可使用身份验证系统来确认用户职能和访问权限,并支持指定话题屏蔽或关键词过滤等管理控制功能。
Amazon Q也是商业智能专家,Amazon Q支持将其引入多种服务和应用中以提供基于生成式AI的帮助。 将Amazon Q引入BI应用Amazon QuickSight中,它能够在几秒钟内响应用户要求,创建精准且美观的月度业务变化的相关描述。
Amazon Q也是联络中心专家。将Amazon Q引入云联络中心应用Amazon Connect中,它能够根据实时对话检测客户问题,并能够自动回复、给出建议以及提供相关资料。
从Amazon Q的能力来看,亚马逊云科技将自身本来就有的服务和能力,加持生成式AI技术后通过Amazon Q来赋能给企业客户,这也就意味着未来Amazon Q或许有更多的能力,Amazon Q+各行各业能力的模式已经初现。
至此,以三层架构为骨架的亚马逊GenAI科技树发展优化脉络已然跃然纸上。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )