18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Redis 8 向量搜索實測:輕松擴展至 10 億向量

虹科技術(shù) ? 來源:虹科技術(shù) ? 作者:虹科技術(shù) ? 2025-05-13 14:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

面對生成式 AI 帶來的超大規(guī)模向量需求,Redis 8 向量搜索實測輕松支持 10 億向量,依舊保持低延遲與高吞吐表現(xiàn)。本篇文章詳細(xì)介紹了 Redis 如何通過 HNSW 算法擴展至十億級別,并提供完整測試配置與性能數(shù)據(jù)。無論是 AI 檢索、推薦系統(tǒng)還是多模態(tài)生成應(yīng)用,Redis 8 都是你構(gòu)建高效向量服務(wù)的可靠選擇。

隨著越來越多的公司把生成式人工智能(GenAI)應(yīng)用投入生產(chǎn),我們看到客戶對更大向量數(shù)據(jù)庫的需求不斷增長。我們發(fā)現(xiàn)了一些需要 10 億個或更多向量的使用場景,很高興能分享我們在這一規(guī)模上的基準(zhǔn)測試結(jié)果。

在測試中,我們在中位延遲為 200 毫秒的情況下達(dá)到了 90% 的精確度,而在處理 50 個并發(fā)搜索請求時,對于前 100 個最近鄰(nearest neighbors),在中位延遲為 1.3 秒的情況下達(dá)到了 95% 的精確度。

將向量搜索擴展到 10 億個向量并非易事,但 Redis 8 的發(fā)布讓這一過程顯得輕松。今天,我們將通過展示 Redis 在實時搜索 10 億個 768 維向量時的處理能力,來說明它如何應(yīng)對大規(guī)模應(yīng)用程序。我們嚴(yán)格測試了索引與搜索的性能,證明了 Redis 不僅是最快的向量數(shù)據(jù)庫,還能從數(shù)百萬個向量擴展到數(shù)十億個向量,仍然提供極低的延遲。請查看下面的詳細(xì)信息。

測試配置詳解

我們使用了一個與 Intel? 合作準(zhǔn)備的向量數(shù)據(jù)集,該數(shù)據(jù)集包含 10 億個 768 維向量,采用 FLOAT16 精度和 10K 查詢,每個查詢有 100 個真實值(精確鄰居,exact neighbors)。該數(shù)據(jù)集源自LAION-5B 數(shù)據(jù)集,這是一個用于訓(xùn)練下一代圖生文模型(如 Stable Diffusion 和 OpenClip)的大規(guī)模數(shù)據(jù)集。

向量索引使用了歐幾里得距離度量和 FLOAT16 精度,并且在查詢時通過調(diào)整以下參數(shù)來實現(xiàn)不同的精確度:

EF_CONSTRUCTION(在索引創(chuàng)建時設(shè)置):在構(gòu)建圖時,圖中每個節(jié)點允許的最大潛在出邊(potential outgoing edges candidates)候選數(shù)量。

M(在索引創(chuàng)建時設(shè)置):在圖的每一層中,每個節(jié)點允許的最大出邊數(shù)量。在第零層,最大出邊數(shù)量將是 2M。

EF_RUNTIME(在查詢時可變):在 KNN 搜索期間要保留的最大頂級候選數(shù)量(maximum top candidates)。更高的 EF_RUNTIME 值將導(dǎo)致更準(zhǔn)確的結(jié)果,但也會增加運行時間。

使用數(shù)據(jù)集的 100 個最近鄰的真實值來評估每個回復(fù)的準(zhǔn)確性(召回率),并且我們對 M 在 4、8、16 和 32 個出邊之間,EF_CONSTRUCTION 在 4、8、16 和 32 之間,以及 EF_RUNTIME 在 4、8、16、32、64、128、256、512、1024、2048、4096 和 8192 之間進行了調(diào)整。為確保結(jié)果可重現(xiàn),每個配置都運行了 3 次,選擇了最好的結(jié)果。

Redis 8 Community Edition 十億規(guī)?;鶞?zhǔn)測試

數(shù)據(jù)集:laion-img-emb-768-1G-cosine

客戶端數(shù)量:501

繪制值:每秒請求數(shù)(RPS)| 平均延遲(秒)| 95百分位延遲(秒)| 索引時間(秒)

wKgZPGgi33-AD4ciAADd27A_1j8775.png

在我們之前的向量數(shù)據(jù)庫基準(zhǔn)測試博客中,我們專注于證明 Redis 是最快的向量數(shù)據(jù)庫?,F(xiàn)在我們證明,對于需要保持實時性延遲的使用場景,我們不僅是最快的向量數(shù)據(jù)庫,我們還可以將向量數(shù)量從數(shù)百萬擴展到數(shù)十億。

測試結(jié)果

在十億向量規(guī)模下,使用實時索引,Redis 8 社區(qū)版可以維持每秒 66K 向量插入,對于允許至少 95% 精確度(M 16 和 EF_CONSTRUCTION 32)的索引配置。對于導(dǎo)致較低精確度(M 4 和 EF_CONSTRUCTION 4)的索引配置,Redis 8 社區(qū)版可以支持高達(dá)每秒 160K 向量插入的速率。通過使用更多服務(wù)器可以進一步增加吞吐量。

對于高精確度查詢,我們可以看到更大的 HNSW 索引(更高的 M 和 EF_CONSTRUCT)會提高搜索質(zhì)量,但會增加延遲。在處理 50 個并發(fā)搜索請求時,我們在中位延遲(包括往返時間)為 200 毫秒的情況下達(dá)到 90% 精確度,而在中位延遲(包括往返時間)為 1.3 秒的情況下達(dá)到 95% 精確度。

由于所需的精確度和延遲權(quán)衡因使用場景而異,因此根據(jù)上面的圖表調(diào)整 HNSW 參數(shù)非常重要。

Redis 8 證明了實時向量搜索不僅適用于數(shù)百萬個向量,還能擴展到數(shù)十億個向量,同時保持高性能。通過正確的 HNSW 調(diào)優(yōu),你可以在精確度、延遲和吞吐量之間取得平衡,以適應(yīng)你的使用場景,實現(xiàn)高達(dá) 95% 的召回率和實時查詢。無論你是在構(gòu)建人工智能驅(qū)動的搜索、推薦引擎還是任何基于向量的應(yīng)用程序,Redis 都能為你提供所需的快速、可擴展性能。

Redis

艾體寶是Redis企業(yè)版數(shù)據(jù)庫的中國區(qū)戰(zhàn)略合作伙伴,持續(xù)關(guān)注各行業(yè)當(dāng)下急切需求,專注于為企業(yè)解答疑問,制定專屬服務(wù),提供一站式解決方案,艾體寶提供的Redis企業(yè)版數(shù)據(jù)庫是無數(shù)企業(yè)數(shù)據(jù)安全保護路上的最佳合作選擇!為企業(yè)的數(shù)據(jù)安全保駕護航!

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37213

    瀏覽量

    291991
  • 人工智能
    +關(guān)注

    關(guān)注

    1813

    文章

    49536

    瀏覽量

    259356
  • Redis
    +關(guān)注

    關(guān)注

    0

    文章

    390

    瀏覽量

    11946
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Vector向量指令集簡介(一)

    RV32V將數(shù)據(jù)寄存器和長度與向量寄存器關(guān)聯(lián)而不是指令操作碼。程序在執(zhí)行V指令之前會用數(shù)據(jù)類型和數(shù)據(jù)寬度來標(biāo)記向量寄存器,因為每個V指令通常有8個整數(shù)版本和三個浮點版本。 這個編碼一共5位,低
    發(fā)表于 10-23 08:28

    Vector向量指令集簡介(三)

    VLEN/8; vstart寄存器可讀可寫,記錄向量指令執(zhí)行的第一個元素的索引。 Vxrm寄存器:矢量定點攝入模式寄存器,它的最低有效位[1:0]中保存一個兩位讀寫舍入模式的字段。高位則都置為0
    發(fā)表于 10-23 06:23

    Vector向量指令集簡介(二)

    上次我們講vtype講到一般,今天把剩下的部分給講完。 Vma和vta表示的是向量尾部不可知與向量掩碼不可知的設(shè)置位。 這兩個位的值,都是在設(shè)置為0的時候表示未受干擾,設(shè)置為1的時候表示
    發(fā)表于 10-23 06:05

    按圖搜索1688商品的API接口

    服務(wù)(如ImageSearch)實現(xiàn)類似功能。本技術(shù)帖將逐步介紹原理、實現(xiàn)步驟和代碼示例,幫助你構(gòu)建一個可用的API接口。 1. 圖像搜索原理 按圖搜索的核心是基于內(nèi)容的圖像檢索(CBIR),它通過提取圖像特征向量并進行相似度計
    的頭像 發(fā)表于 10-22 15:05 ?82次閱讀
    按圖<b class='flag-5'>搜索</b>1688商品的API接口

    Vector向量指令集簡介(四)

    不同eew(有效元素位寬)的向量,在使用時具體區(qū)別如vle8或者vle32這樣指定。 Vm在之前說過,是掩碼。 Nf表示指令單次操作的向量個數(shù)。 Lumop/sumop所代表的是不同的尋址模式
    發(fā)表于 10-22 06:06

    使用MATLAB的支持向量機解決方案

    支持向量機 (SVM) 是一種有監(jiān)督機器學(xué)習(xí)算法,它能找到分離兩個類的數(shù)據(jù)點的最佳超平面。
    的頭像 發(fā)表于 10-21 15:00 ?109次閱讀
    使用MATLAB的支持<b class='flag-5'>向量</b>機解決方案

    RISC-V V擴展的指令代碼

    執(zhí)行指令,可以更加靈活地進行程序控制,提高了程序的可編程性和可擴展性。 2.指令代碼格式 VADD 指令 vadd.vv v1, v2, v3 這條指令將向量寄存器v2和v3中的對應(yīng)元素相加,結(jié)果存儲
    發(fā)表于 10-21 13:11

    基于蜂鳥E203架構(gòu)的指令集K擴展

    擴展指令集架構(gòu)(RISC-V ISA)的K擴展。 K擴展是一種可選的指令集擴展,它增加了一些向量和矩陣操作的指令。這些指令可以利用硬件并行性
    發(fā)表于 10-21 09:38

    1688 多模態(tài)搜索從 0 到 1:逆向接口解析與 CLIP 特征匹配實踐

    本文分享基于CLIP模型與逆向工程實現(xiàn)1688圖片搜同款的實戰(zhàn)方案。通過抓包分析破解接口簽名,結(jié)合CLIP多模態(tài)特征提取與Faiss向量檢索,提升搜索準(zhǔn)確率91%,單次響應(yīng)低于80ms,日均選品效率提升4倍,全程合規(guī)可復(fù)現(xiàn)。
    的頭像 發(fā)表于 10-17 10:00 ?117次閱讀

    在中斷向量表中,數(shù)字較小的中斷向量能否以 larg 中斷中斷向量?

    在中斷向量表中,數(shù)字較小的中斷向量能否以 larg 中斷中斷向量
    發(fā)表于 08-21 08:17

    milvus向量數(shù)據(jù)庫的主要特性和應(yīng)用場景

    Milvus 是一個開源的向量數(shù)據(jù)庫,專門為處理和分析大規(guī)模向量數(shù)據(jù)而設(shè)計。它適用于需要高效存儲、檢索和管理向量數(shù)據(jù)的應(yīng)用場景,如機器學(xué)習(xí)、人工智能、計算機視覺和自然語言處理等。
    的頭像 發(fā)表于 07-04 11:36 ?573次閱讀
    milvus<b class='flag-5'>向量</b>數(shù)據(jù)庫的主要特性和應(yīng)用場景

    RISC-V架構(gòu)下的編譯器自動向量

    進迭時空專注于研發(fā)基于RISC-V的高性能新AICPU,對于充分發(fā)揮CPU核的性能而言,編譯器是不可或缺的一環(huán),而在AI時代,毫無疑問向量算力將發(fā)揮越來越重要的作用。進迭時空非常重視RISC-V
    的頭像 發(fā)表于 06-06 16:59 ?745次閱讀
    RISC-V架構(gòu)下的編譯器自動<b class='flag-5'>向量</b>化

    redis三種集群方案詳解

    Redis中提供的集群方案總共有三種(一般一個redis節(jié)點不超過10G內(nèi)存)。
    的頭像 發(fā)表于 03-31 10:46 ?1146次閱讀
    <b class='flag-5'>redis</b>三種集群方案詳解

    RK3576有多強?實測三屏八攝像頭輕松搞定

    的MYD-LR3576開發(fā)板開發(fā)了一個三屏異顯,8路攝像頭輸入的DEMO,實測下來,RK3576輕松搞定了該任務(wù)。MYD-LR3576開發(fā)板是基于RK3576設(shè)計的一款
    的頭像 發(fā)表于 01-16 08:06 ?1058次閱讀
    RK3576有多強?<b class='flag-5'>實測</b>三屏八攝像頭<b class='flag-5'>輕松</b>搞定

    希姆計算的RISC-V矩陣擴展開源項目已升級0.5版本,支持向量+矩陣的實現(xiàn)

    希姆計算的RISC-V矩陣擴展開源項目已升級0.5版本-----支持向量+矩陣的實現(xiàn)范福杰博士&陳煒博士項目背景Background為了解決RISC-V在人工智能領(lǐng)域中指令碎片化
    的頭像 發(fā)表于 11-12 01:08 ?3737次閱讀
    希姆計算的RISC-V矩陣<b class='flag-5'>擴展</b>開源項目已升級<b class='flag-5'>至</b>0.5版本,支持<b class='flag-5'>向量</b>+矩陣的實現(xiàn)