世界领先的内存解决方案提供商Kioxia Corporation今天宣布开源发布其新的全存储ANNS乘积量化 (AiSAQ)技术(1)。KIOXIA AiSAQ™软件采用针对固态硬盘优化的新型“近似最近邻”搜索(ANNS)算法,可为检索增强生成(RAG)提供可扩展的性能,并且无需将索引数据放在DRAM中,而是直接在固态硬盘上进行搜索。
生成式人工智能系统需要大量的计算、内存和存储资源。虽然人工智能系统有可能推动各行各业实现变革性突破,但其部署往往需要高昂的成本。RAG是人工智能的一个关键阶段,它利用公司或应用的特定数据完善大型语言模型(LLM)。
RAG的核心组件是一个向量数据库,它能将特定数据累积并转换成数据库中的特征向量。RAG还采用了ANNS算法,该算法可根据累积向量和目标向量之间的相似性,识别出能改进模型的向量。为使RAG有效,它必须快速检索与查询最相关的信息。ANNS算法以往是部署在DRAM中,以实现这些搜索所需的高速性能。
KIOXIA AiSAQ技术可为十亿规模的数据集提供可扩展的高效ANNS解决方案,内存使用量可忽略不计,并具有快速索引切换功能。
KIOXIA AiSAQ技术的主要优势:
Kioxia将其创新KIOXIA AiSAQ技术作为开源软件提供给社区,以此表明该公司对推动人工智能发展的承诺。
注
(1) 请点击链接查看KIOXIA AiSAQ的开源版本。
https://github.com/kioxiaamerica/aisaq-diskann
*公司名称、产品名称和服务名称可能是第三方公司的商标。
文章评论(0条评论)
登录后参与讨论