原创 旨在降低生成式人工智能系统DRAM需求的KIOXIA AiSAQ™技术以开源软件形式发布

2025-2-6 10:12 36 0 分类: 机器人/ AI

世界领先的内存解决方案提供商Kioxia Corporation今天宣布开源发布其新的全存储ANNS乘积量化 (AiSAQ)技术(1)。KIOXIA AiSAQ™软件采用针对固态硬盘优化的新型“近似最近邻”搜索(ANNS)算法,可为检索增强生成(RAG)提供可扩展的性能,并且无需将索引数据放在DRAM中,而是直接在固态硬盘上进行搜索。


生成式人工智能系统需要大量的计算、内存和存储资源。虽然人工智能系统有可能推动各行各业实现变革性突破,但其部署往往需要高昂的成本。RAG是人工智能的一个关键阶段,它利用公司或应用的特定数据完善大型语言模型(LLM)。


RAG的核心组件是一个向量数据库,它能将特定数据累积并转换成数据库中的特征向量。RAG还采用了ANNS算法,该算法可根据累积向量和目标向量之间的相似性,识别出能改进模型的向量。为使RAG有效,它必须快速检索与查询最相关的信息。ANNS算法以往是部署在DRAM中,以实现这些搜索所需的高速性能。


KIOXIA AiSAQ技术可为十亿规模的数据集提供可扩展的高效ANNS解决方案,内存使用量可忽略不计,并具有快速索引切换功能。


KIOXIA AiSAQ技术的主要优势:

  • 允许大型数据库在不依赖有限DRAM资源的情况下运行,从而提高RAG系统的性能。
  • 无需将索引数据加载到DRAM中,从而可立即启动矢量数据库。这支持在同一服务器上的用户特定数据库或应用特定数据库之间进行无缝切换,从而高效交付RAG服务。
  • 通过将索引存储在可在多台服务器之间共享的分解式存储中,对云系统进行了优化。这种方法可针对特定用户或应用程序动态调整矢量数据库搜索性能,并有助于在物理服务器之间快速迁移搜索实例。


Kioxia将其创新KIOXIA AiSAQ技术作为开源软件提供给社区,以此表明该公司对推动人工智能发展的承诺。


(1) 请点击链接查看KIOXIA AiSAQ的开源版本。
https://github.com/kioxiaamerica/aisaq-diskann

*公司名称、产品名称和服务名称可能是第三方公司的商标。


PARTNER CONTENT

文章评论0条评论)

登录后参与讨论
我要评论
0
0
关闭 站长推荐上一条 /3 下一条