亚马逊希望托管公司的定制生成式AI模型

AWS,亚马逊的云计算业务,希望成为公司托管和调整他们定制生成式AI模型的首选地点。

今天,AWS宣布推出Custom Model Import(预览版),这是Bedrock中的一个新功能,Bedrock是AWS专为企业提供的一套生成式AI服务套件。该功能允许组织导入和访问他们自己的内部生成式AI模型,作为完全托管的API。

一旦导入公司专有的模型,就能够享受与Bedrock库中的其他生成式AI模型相同的基础设施(例如Meta的Llama 3或Anthropic的Claude 3)。他们还将获得工具来扩展他们的知识,微调它们,并实施防止偏见的保障措施。

“有一些AWS客户一直在使用其他工具对Bedrock之外的自己微调或构建他们自己的模型,”AWS生成式AI副总裁Vasi Philomin在接受TechCrunch采访时表示。“这个Custom Model Import功能允许他们将自己的专有模型带到Bedrock上,并且可以在Bedrock上看到它们与已经存在于Bedrock上的所有其他模型并置-并且使用也已经存在于Bedrock上的所有工作流程。”

导入定制模型

根据Intel的人工智能专业子公司Cnvrg最近的一项调查,大多数企业都是通过构建自己的模型并对其进行细化以适应其应用程序的生成式AI。根据调查,这些企业表示,基础设施,包括云计算基础设施,是他们部署的最大障碍。

通过Custom Model Import,AWS旨在填补这一需求,同时与云服务竞争对手保持步调。(亚马逊首席执行官安迪·贾西在最近的年度股东信中也预示了这一点。)

相对于一段时间以来,Google的Vertex AI,与Bedrock类似,允许客户上传生成式AI模型,定制它们并通过API提供服务。Databricks也长期提供了工具集来托管和调整定制模型,包括最近发布的DBRX。

询问了Custom Model Import的独特之处,Philomin断言说,它以及Bedrock提供比竞争对手更广泛和更深入的模型定制选项,他补充说,“数以万计的”客户今天正使用Bedrock。

“首先,Bedrock为客户提供了处理模型的几种方法,”Philomin说。“其次,我们围绕这些模型有各种工作流程-现在,客户可以站在我们已经提供的所有其他模型旁边。大多数人喜欢的一个关键点是能够在同一工作流程中跨多个不同的模型进行实验,然后实际上从同一个地方将它们推向生产。”

那么提到的模型定制选项是什么呢?

Philomin指出Guardrails,该功能允许Bedrock用户配置阈值,以过滤-或至少尝试过滤-模型的输出,例如仇恨言论,暴力以及私人个人或企业信息。(生成式AI模型以泄露敏感信息而臭名昭著;AWS的模型也不例外。)他还强调了Model Evaluation,Bedrock工具,客户可以用来测试一个或多个模型在给定标准下的表现。

Guardrails和Model Evaluation现已在数月的预览后正式推出。

我感到有必要在这里指出,Custom Model Import目前仅支持三种模型架构:Hugging Face的Flan-T5,Meta的Llama和Mistral的模型。此外,Vertex AI和其他Bedrock竞争服务,包括微软在Azure上的AI开发工具,提供更多或更少可比的安全性和评估功能(请参见Azure AI内容安全,Vertex中的模型评估等)。

然而,Bedrock的独特之处在于AWS的Titan生成式AI模型。与Custom Model Import发布同时,该领域已有一些值得关注的进展。

升级的Titan模型

Titan图像生成器,AWS的文本到图像模型,现已在去年11月的预览版之后正式推出。与之前一样,Titan图像生成器可以根据文本描述创建新的图像或自定义现有图像,例如在保留图像主题的同时更换图像的背景。

Philomin声称,相较于预览版,GA版的Titan Image Generator可以生成更具“创造性”的图像,但没有详细说明。(对于这意味着什么,你的猜测和我的一样好。)

我问Philomin是否有更多关于Titan图像生成器训练方式的细节分享。

在去年11月的模型首次亮相时,AWS并未详细说明它在训练Titan图像生成器时使用了哪些数据。很少有供应商愿意轻易透露这类信息;他们将训练数据视为竞争优势,因此保持将其以及相关信息保密。

培训数据的细节也是潜在知识产权相关诉讼的来源,这是不透露太多信息的另一个因素。目前一些案件正在法庭上审理中,这些案件反驳了供应商的合理使用辩护,认为文本到图像工具复制了艺术家的风格,而没有艺术家的明确许可,并允许用户生成类似于艺术家原作的新作品,而艺术家则没有得到任何报酬。

Philomin只告诉我,AWS使用了第一方和许可数据的组合。

“我们有专有数据源的组合,但也许还有许多数据许可,”他说。“我们实际上会支付版权所有者授权费用,以便能够使用他们的数据,并且我们已经与其中一些签订了合同。”

这比我们去年11月得到的更多细节。但我有种预感,Philomin的回答可能不会让每个人都满意,尤其是那些主张在生成式AI模型训练中提供更多透明度的内容创作者和AI伦理学家。

在透明度的缺失下,AWS表示将继续提供一项补偿政策,覆盖了当Titan Image Generator等模型重新产生(即,输出了可能受版权保护的训练示例的镜像副本)时,为客户提供保护。(包括微软和谷歌在内的几家竞争对手,也提供覆盖图像生成模型的类似政策。)

为了应对另一个紧迫的道德威胁-深度伪造- AWS表示,使用Titan图像生成器创建的图像将继续具有“防篡改”不可见水印。Philomin表示,在GA版本中,该水印已被设计得更加抗压缩和其他图像编辑和处理。

继续谈论较少有争议的领域,我问Philomin,是否像谷歌,OpenAI和其他公司一样,AWS是否在探索视频生成技术,鉴于对该技术的兴奋和投资。Philomin没有说AWS不会……但他不愿透露更多信息。

“显然,我们不断寻找客户想要拥有的新功能,视频生成技术在与客户的交流中确实经常出现,”Philomin表示。“我请你继续关注。”

在最后一个与Titan相关的消息中,AWS发布了其Titan Embeddings模型第二代,Titan Text Embeddings V2。该模型将文本转换为数字表示,称为嵌入,以支持搜索和个性化应用程序。第一代嵌入模型也是这样做的,但AWS声称Titan Text Embeddings V2在整体上更加高效,具有成本效益和更准确。

“Embeddings V2模型的作用是将使用模型的总存储量减少高达四倍,同时保留97%的准确性,”Philomin声称,“胜过其他相似的模型。”

我们将看看实际测试是否能证明这一点。