AWS推出五项AI新服务：企业搜索代码审查欺诈识别等

12月4日，在AWS re:Invent全球大会上，AWS发布五项新的人工智能（AI）服务，旨在将机器学习交到更多应用程序开发者和终端用户手中，而他们无需机器学习经验，也能轻松使用AI。

这五项AI新服务分别是：

1、Amazon Kendra重塑企业搜索，它利用自然语言处理及其它机器学习技术，将企业内部的多个数据孤岛统一起来，始终如一地为常见查询提供高质量的结果，而不是以随机的链接列表响应关键字查询；

2、Amazon CodeGuru可帮助软件开发者自动执行代码审核，确定应用中开销最大的代码行；

3、Amazon Fraud Detector基于为Amazon.com开发的相同技术，帮助企业实时识别线上身份欺诈和支付欺诈；

4、Amazon Transcribe Medical为医疗保健提供商提供高精度的、实时语音到文本转录，以便他们可以专注于患者护理；

5、Amazon Augmented Artificial Intelligence (A2I) 帮助机器学习开发者通过人工确认验证机器学习预测。

具体而言

Amazon Kendra

尽管多年来多种尝试，但内部搜索对于当今的企业来说仍是一个棘手的问题，大多数员工仍然经常难以找到他们需要的信息。机构拥有大量非结构化文本数据，如果能够发现、存储多种格式并跨不同的数据源（例如Sharepoint、Intranet、Amazon S3和本地文件存储系统），则这些数据非常有用。即使通用的、基于 Web 的搜索工具随处可见，机构仍然发现内部搜索很困难，因为没有可用工具能够很好地跨越现有数据孤岛编制索引，无法提供自然语言查询，并且无法提供准确的结果。当员工有疑问时，他们需要使用可能出现在不同上下文、多个文档中的关键字，这些搜索通常会生成一长串随机链接，员工必须筛选这些链接才能找到他们查找的信息（如果他们找得到的话）。

Amazon Kendra让员工可以使用真实问题（而不仅仅是关键字）在多个数据孤岛中搜索，在后台部署AI技术来提供他们寻求的精确答案（而不是随机的链接列表），重塑企业搜索。员工可以使用自然语言运行搜索（关键字仍然有效，但大多数用户更喜欢自然语言搜索）。例如，员工可以提出一个特定问题，如“IT服务台什么时候开？”Amazon Kendra会给他们一个具体答案，如“IT 服务台在上午9：30打开”，同时给出指向IT门户和其它相关网站的链接。客户可以在应用程序、门户和 wiki 中使用Amazon Kendra。只需在AWS管理控制台中单击几下，客户即可将Amazon Kendra指向其各种文档存储库，服务会聚合PB级的数据以构建集中索引。Amazon Kendra会扫描文档的权限，确保搜索结果符合现有的文档访问策略，搜索结果仅包含用户有权访问的文档。此外，Amazon Kendra还根据客户的特定情况，积极地重新训练机器学习模型，使用点击率数据、用户位置和反馈提高准确性，随着时间的推移提供越来越好的答案。

Amazon CodeGuru

跟亚马逊一样，AWS客户也编写了大量代码。软件开发是一个广为人知的过程。开发者编写代码、查看代码、编译代码和部署应用程序、衡量应用程序的性能并使用该数据改进代码，循环往复。然而，如果代码一开始就不正确，那么所有这些过程都没什么用，所以团队都会在新代码添加到现有应用程序代码库之前执行代码检查，检查逻辑、语法和样式。即使对于像亚马逊这样的大型机构，考虑其每天要编写的代码量，也很难有那么多有经验的开发者、他们有足够的富余时间来审核代码。而且即使是有经验的审阅者遇到面向客户的应用程序时也会漏掉问题，从而导致出错和性能问题。

Amazon CodeGuru是一种新的机器学习服务，可自动执行代码审核，找到应用程序开销最大的代码行。Amazon CodeGuru有两个组件：代码审核和应用程序分析。对于代码审核，开发者像往常一样提交其代码（目前支持GitHub和CodeCommit，未来会支持更多的存储库），将Amazon CodeGuru添加为代码审阅者之一，无需对正常过程或要安装的软件进行其他更改。Amazon CodeGuru收到拉取请求，会自动开始使用经过预先训练的模型来评估代码。这些模型已经在亚马逊和GitHub前10000的项目中经受过数十年的代码审核训练。Amazon CodeGuru将检查代码更改的质量，如果发现问题，它将向拉取请求添加易于阅读的注释，标识出代码行、特定问题和修正建议，包括示例代码和指向相关文档的链接。

Amazon CodeGuru还包含一个机器学习驱动的应用程序探查器，可帮助客户找到开销最大的代码行。要使用它，客户只要在其应用程序中安装一个小小的代理程序，然后Amazon CodeGuru就可以观察应用程序运行时，每五分钟分析一次应用程序代码。代码配置文件包括有关延迟和CPU利用率的详细信息，直接链接到特定的代码行。Amazon CodeGuru可帮助操作者在应用程序中找到开销最大的代码行，生成火焰图，帮助直观地标识出造成性能瓶颈的其它代码行。多年来，亚马逊内部团队使用Amazon CodeGuru对80000多个应用程序进行了代码分析。2017 到2018年，Amazon CodeGuru内部版本的广泛使用，帮助亚马逊消费者业务的Amazon Prime Day团队提高了其应用效率，CPU利用率提高325%，减少了管理Prime Day所需的实例数量，整体成本降低了39%。

Amazon Fraud Detector

Amazon Fraud Detector提供完全托管的服务，基于亚马逊消费者业务使用的相同技术，实时检测潜在的线上身份欺诈和支付欺诈，无需机器学习经验。Amazon Fraud Detector使用欺诈和合法交易的历史数据来构建、训练和部署机器学习模型，提供实时、低延迟的欺诈风险预测。首先，客户将交易数据上传到Amazon S3，定制模型训练。客户只需提供与交易关联的电子邮件地址和IP地址，可以选择添加其它数据（例如帐单地址或电话号码）。根据客户想要预测的欺诈类型（新帐户或线上支付欺诈），Amazon Fraud Detector将预处理数据、选择一个算法、训练一个模型————使用亚马逊数十年来大规模运行欺诈检测风险分析的经验。Amazon Fraud Detector还使用基于机器学习的、根据亚马逊数据训练过的数据检测器。这些数据检测器可帮助识别与发生在Amazon上的欺诈活动（例如异常的电子邮件命名规律）相似的模式，即使客户向Amazon Fraud Detector提供的欺诈示例数量很少，也可以帮助提高模型训练的准确性。

Amazon Fraud Detector将模型训练、部署到完全托管的私有API端点。客户可以将新活动（例如注册或新购买）发送到API、接收包括风险评分的欺诈报告。根据此报告，应用程序可以确定正确的行动（例如接受购买，或将其传递给人工审核）。借助Amazon Fraud Detector，客户可以更快、更轻松地、更准确地检测欺诈。

Amazon Transcribe Medical

如今，医生们的一部分日常工作，是将详细的数据输入病历（EHR）系统。然而，帮助他们准确记录和存档病情的解决方案是欠佳的。在许多医院，医生必须将医疗笔记口述到记录器中，然后将这些语音文件提交到第三方手动抄录，服务成本高昂，可能需要长达三个工作日，延误了存档流程。另一种选择是利用现有的前端听写软件，但受限于现有的工具，医生们仍然每天要在临床记录上花费好几小时。第三种选择是医疗保健提供商雇用人工抄写员，在医生们看病时协助做记录，但人工抄写员可能会令患者感到不安，医生们经常提到他们的记录有欠缺，医疗机构也很难大规模地安排和协调抄写员。总之，现有的解决方案在提高临床记录效率和改善患者护理方面都有不足。

Amazon Transcribe Medical通过使用机器学习技术自动转录自然医学语音来解决这些问题。建立在 Amazon Transcribe Medical语音到文本功能之上的病历应用，可以准确、经济实惠地生成记录。Amazon Transcribe Medical由多个机器学习模型组成，这些模型经过数万小时的医学语音训练，可提供准确的、机器学习驱动的医学转录。实时生成记录，消除了多日的流转时间。

Amazon Transcribe Medical可以帮助医生们在跟患者沟通时自动转录对话，不用分心手动笔记，医疗保健提供商能够专注于患者护理。医生可以自然地说话，Amazon Transcribe Medical使用内置的自动标点符号，克服现有转录软件的局限性。对于医疗保健提供商，基于Amazon Transcribe Medical的语音解决方案可扩展到数千个潜在的医疗中心，消除了管理和协调临时抄写员的操作难题。Amazon Transcribe Medical符合HIPAA认证，提供易于使用的 API，可与支持语音的应用程序和带有麦克风的任何设备集成。Amazon Transcribe Medical的输出文本也可以用于其他AWS服务，例如自然语言处理服务Amazon Comprehend Medical，在最终进入病历系统前进行下一步的数据分析。

Amazon Augmented Artificial Intelligence (A2I)

机器学习可以为各种应用场景提供高度准确的预测，包括识别图像中的对象、从扫描的文档中提取文本、或者转录与理解口语。在每种情况下，机器学习模型都会提供预测，提供置信度分数以表示模型预测的确定性。置信度分数越高，结果的可信度就越高。对于许多应用场景，当开发者收到高置信度结果时，他们可以信任其结果可能是准确的，可以自动处理它们（例如，自动调整社交网络上用户生成的内容，或者给视频加字幕）。但是，在置信度低于预期的情况下，预测结果模糊，可能需要人工审核才能解决这种模糊性。机器学习和人工审阅之间的这种相互作用，对于机器学习系统的成功至关重要，但人工审核的大规模构建和运营，很有挑战，成本高昂，通常涉及多个流程步骤，需要定制软件管理人工审核任务和结果，需要招聘和管理大量审核人员。结果，开发者时常花费大量的时间来管理人工审核过程，而不是构建其预想的应用程序，或者不得不放弃人工审核，导致许多预测的信心和效用都很低。

Amazon Augmented Artificial Intelligence (A2I) 是一项新服务，使用它很容易构建和管理机器学习应用程序的人工审核。Amazon A2I为常见的机器学习任务——例如图像中的对象检测、语音转录和内容审核——提供预构建的人工审核工作流，方便对来自Amazon Rekognition和Amazon Textract的机器学习预测做人工审核。开发者为其特定应用程序选择置信阈值，所有置信度分数低于阈值的预测都将自动发送给人工审核人员进行验证。开发者可以选择Amazon Mechanical Turk的50万全球人工、预授权人工的第三方机构如Startek、iVision、CapeStart、Cogito和iMerit、或他们自己的审核人员执行其审核。审核结果存储在Amazon S3中，开发者在审核完成后会收到通知，以便他们根据审核人员的可信结果进行下一步操作。Amazon A2I为所有开发者带来了人工审核，消除了构建和管理定制审核流程或招募大量审核人员方面的繁重工作。

截至目前，AWS提供超过175项全功能的服务，涵盖计算、存储、数据库、联网、分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体，以及应用开发、部署与管理等方面，遍及22个地理区域的69个可用区。

（免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，应及时向本网站提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后，将会依法尽快联系相关文章源头核实，沟通删除相关内容或断开相关链接。）