跳到主要内容
搜索

OpenSearch 向量引擎

一个开源、一体化的向量数据库,用于构建可扩展且面向未来的 AI 应用

要大规模支持人工智能 (AI) 应用,您需要一个专门为 AI 理解数据方式设计的数据库。OpenSearch 向量引擎旨在提供准确性、速度和可扩展性,使您能够在成熟的平台上构建稳定的 AI 应用程序,该平台可扩展到数百亿个向量,并内置低延迟和高可用性。与难以处理非结构化信息的传统数据库不同,向量数据库专为高维数据设计,可为聊天机器人、推荐、图像搜索和其他 AI 用例提供闪电般的快速结果。

YouTube:数百亿向量:使用 OpenSearch 向量引擎扩展您的 AI 应用

用于向量数据的 OpenSearch 向量引擎

OpenSearch 向量引擎将传统搜索、分析和向量搜索的强大功能整合到一个完整的软件包中。借助 OpenSearch 向量数据库,组织可以减少开发人员操作、管理和集成 AI 生成资产的工作量,从而加速 AI 开发。

将您的模型、向量和元数据导入 OpenSearch,以支持向量、词法和混合搜索及分析——内置性能和可扩展性。

什么是向量数据库?

信息以各种形式存在,从文本文档、富媒体和音频等非结构化数据,到地理空间坐标、表格和图表等结构化数据。AI 的进步使得使用模型或嵌入将所有这些数据类型编码为向量成为可能。这些向量代表高维空间中的数据点,捕获每个资产的含义和上下文。通过映射数据点之间的关系,搜索工具可以根据它们在该空间中的接近程度有效识别相似的资产。

向量嵌入

降低搜索成本,提升结果

向量数据库通过存储和索引向量及元数据,实现快速、低延迟的相似性搜索。借助 OpenSearch 的 k-近邻 (k-NN) 功能——由分层可导航小世界 (HNSW) 和倒排文件 (IVF) 系统等高级索引算法提供支持——您可以高效地对向量化数据运行高性能查询。

除了搜索,向量数据库还通过强大的数据管理、容错、资源访问控制和强大的查询引擎增强了 k-NN,为 AI 驱动的应用提供了坚实的基础。

向量搜索 vs. 传统搜索

用于搜索的多模态向量嵌入

生产环境中值得信赖

在数万用户生产环境中信赖的成熟搜索和分析引擎上支持 AI 应用。

大规模验证

使用经证明可扩展到数百亿向量、具有低延迟和高可用性的数据平台构建稳定的应用程序。

开放且灵活

选择开源工具,并利用与流行开放框架的集成,可选择使用主要云提供商的托管服务。

面向未来构建

通过向量、词法和混合搜索,让您的 AI 应用程序面向未来,
分析和可观测性——全部集成在一个套件中。

OpenSearch 向量功能从查询到结果。

主要功能

k-NN 搜索

使用低延迟查询,通过 k-近邻 (k-NN) 功能,根据相似度发现资产。

语义搜索

通过考虑上下文和关系的搜索,提高人类语言查询的准确性和相关性。

智能过滤

应用智能策略优化向量搜索的召回率和延迟。

内置异常检测

使用随机森林切割 (RCF) 算法,近乎实时地自动检测数据中的异常行为。

向量量化支持

通过减小索引大小和查询延迟来提高性能和降低成本,同时对召回率的影响最小。

混合搜索

将基于关键词的搜索与语义密集向量搜索相结合,以提高搜索相关性,通过组合和规范化查询相关性分数来调整搜索相关性。

开放且可扩展

使用集成的 Apache 2.0 许可向量数据库,构建可靠、可扩展的解决方案,将嵌入操作化并集成向量搜索功能。

用例

OpenSearch 向量引擎的向量数据库支持多种应用。以下是您可以构建的一些解决方案示例。

搜索

视觉搜索

创建允许用户拍照并搜索相似图像的应用程序,而无需手动标记图像。

语义搜索

通过使用捕获语义含义的文本嵌入模型为向量搜索提供支持,并使用混合评分融合词频模型 (Okapi BM25) 以改善结果,从而提高搜索相关性。要了解更多信息,请参阅语义搜索

多模态搜索

使用最先进的模型,这些模型可以融合和编码文本、图像和音频输入,以生成更准确的富媒体数字指纹,并实现更相关的搜索和洞察。要了解更多信息,请参阅多模态搜索

生成式 AI 代理

构建由生成式 AI 驱动的智能代理,同时最大程度地减少幻觉。使用 OpenSearch 通过大型语言模型 (LLM) 增强检索增强生成 (RAG) 工作流,以获得更准确和上下文感知的响应。要了解更多信息,请参阅生成式 AI 代理

个性化

推荐引擎

使用协同过滤技术生成产品和用户嵌入,并使用 OpenSearch 为您的推荐引擎提供支持。通过提供相关的重复购买、尝鲜和冷启动推荐,提升客户体验。

用户级内容定向

通过使用 OpenSearch 检索基于用户互动训练的嵌入,并根据用户倾向进行排名的内容,从而个性化网页。

相关产品

通过基于特定商品推荐相似产品,并根据客户的浏览历史或过往购买行为引导他们找到相关产品,从而提供个性化购物体验,支持“您可能喜欢这个,因为您购买/查看/点击了这个”的推荐。OpenSearch 向量引擎生成丰富的商品嵌入,这些嵌入经过优化,可预测哪些产品可能一起购买,从而提高用户参与度和转化率。

个性化产品搜索

通过将 Okapi BM25 等传统基于文本的搜索算法与向量搜索功能相结合,改进产品排名。OpenSearch 向量引擎利用历史业务数据优化搜索排名,超越简单的语言相似性,提供高度个性化的结果,提高相关性并增加转化可能性。

销售、营销和金融

客户流失预测

通过预测客户流失、识别有取消订阅或停止购买风险的用户来优化增长。采取主动措施,例如个性化通知、折扣或特别优惠,以重新吸引和留住这些用户。借助 OpenSearch 向量引擎,您可以构建强大的模型来有效预测和防止客户流失,从而推动长期客户忠诚度。

客户生命周期价值预测

预测客户生命周期价值 (LTV),以优化营销、加强客户关系并最大化盈利能力。预测未来收入,完善策略并更高效地分配资源,重点关注高价值客户。借助 OpenSearch 向量引擎,您可以构建准确的模型来预测 LTV 并推动更明智的决策。

电子邮件个性化

通过个性化内容提高电子邮件参与度,从而增加活跃用户数和订单率。OpenSearch 向量引擎支持快速部署高级推荐模型,通过量身定制的建议增强电子邮件营销活动,从而带来可衡量的业务成果。

工业和制造业

预测性维护

分析时间序列和传感器数据,预测设备何时需要维修或保养,从而防止昂贵的停机时间和维修费用。通过将传感器数据存储为向量数据并使用机器学习算法,OpenSearch 向量引擎有助于分析设备数据,预测潜在故障,从而实现及时
维护并避免昂贵的故障。

质量控制

在制造过程中实时发现缺陷,以确保产品质量并减少浪费。OpenSearch 向量数据库内置的异常检测功能有助于在问题发生时识别问题,从而实现立即采取行动以保持高标准并提高效率。

欺诈检测

应对从洗钱、信用卡欺诈到保险和退货欺诈等各种欺诈和滥用挑战。OpenSearch 向量引擎内置的异常检测功能可帮助组织精确高效地识别可疑活动,从而增强安全性并降低风险。

入门

您可以通过查看右侧的入门指南或查阅我们的向量搜索文档来开始使用 OpenSearch 向量引擎。要了解更多信息或开始讨论,请加入我们的公共 Slack 频道,查看我们的用户论坛,并关注我们的博客以获取 OpenSearch 工具和功能的最新信息。

集成

OpenSearch 向量引擎与领先的 LLM、机器学习框架和向量搜索引擎集成,支持开发尖端搜索和 AI 应用程序。

最新 OpenSearch 博客文章

2025 年 7 月 17 日 发布于 博客

OpenSearch 中语义高亮功能简介

探索 OpenSearch 3.0 的语义高亮功能,这是一项 AI 驱动的特性,它能根据含义而非精确关键词匹配智能识别相关段落。了解如何利用此功能增强您的搜索应用程序…
阅读更多
2025 年 7 月 17 日 发布于 博客

OpenSearch 四岁生日快乐!

回顾 OpenSearch 过去 48 个月的发展历程,展望未来。
阅读更多
2025 年 7 月 17 日 发布于 新闻

DevClass:OpenSearch 3.0 发布:Linux 基金会下的首个主要版本,力争与 ElasticSearch 争夺市场份额

阅读更多
2025 年 7 月 16 日 发布于 博客

使数据摄取更智能:OpenSearch 中的系统摄取管道

探索 OpenSearch 3.1 的系统摄取管道功能,它使插件开发者能够自动化摄取过程中的文档处理。了解它如何简化配置、改善用户体验并增强数据转换能力。
阅读更多
2025 年 7 月 15 日 发布于 博客

OpenSearch 中机器学习推理处理器简介:评论摘要和语义搜索

了解如何在 OpenSearch 中使用机器学习推理处理器实现语义搜索和摘要功能。
阅读更多
2025 年 7 月 9 日 发布于 博客

通过高效分数收集降低 OpenSearch 3.1 中的混合查询延迟

OpenSearch 3.1 通过优化分数收集、批处理和段级执行,将混合查询吞吐量提高了 3.8 倍,从而在负载下实现更低的延迟和更可预测的性能。
阅读更多