18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

格靈深瞳突破文本人物檢索技術(shù)難題

格靈深瞳 ? 來(lái)源:格靈深瞳 ? 2025-09-28 09:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

對(duì)計(jì)算機(jī)來(lái)說(shuō),理解“穿紅色上衣的長(zhǎng)發(fā)女性”這類特征性描述,并在海量圖片中精準(zhǔn)找到對(duì)應(yīng)人物,是一項(xiàng)復(fù)雜的技術(shù)難題。盡管多模態(tài)預(yù)訓(xùn)練模型CLIP在多種視覺任務(wù)中展示出強(qiáng)大的性能,但其在人物表征學(xué)習(xí)的應(yīng)用中,也就是“以文找人”時(shí),面臨兩個(gè)關(guān)鍵挑戰(zhàn):

一是缺乏專注于人物中心圖像的大規(guī)模訓(xùn)練數(shù)據(jù);二是容易受到噪聲文本標(biāo)記的影響。

格靈深瞳參與研究的GA-DMS框架,為攻破上述技術(shù)難題提供了全新解決方案。研究團(tuán)隊(duì)通過(guò)數(shù)據(jù)構(gòu)建和模型架構(gòu)的協(xié)同改進(jìn),推動(dòng)CLIP在人物表征學(xué)習(xí)中的應(yīng)用,顯著提升了基于文本的人物檢索效果。該成果已入選EMNLP 2025 主會(huì)(自然語(yǔ)言處理領(lǐng)域的頂級(jí)國(guó)際會(huì)議之一)。

首先,團(tuán)隊(duì)開發(fā)了一個(gè)抗噪聲的數(shù)據(jù)構(gòu)建管道,利用機(jī)器學(xué)習(xí)語(yǔ)言模型(MLLMs)的上下文學(xué)習(xí)能力,自動(dòng)過(guò)濾和標(biāo)注網(wǎng)絡(luò)來(lái)源的圖像。這產(chǎn)生了一個(gè)大規(guī)模數(shù)據(jù)集WebPerson,包含500萬(wàn)高質(zhì)量的人物中心圖像-文本對(duì)。

其次,團(tuán)隊(duì)引入了梯度-注意力引導(dǎo)的雙重遮蔽協(xié)同(GA-DMS)框架,用來(lái)改善跨模態(tài)對(duì)齊。

此外,團(tuán)隊(duì)還加入了遮蔽標(biāo)記預(yù)測(cè)目標(biāo),讓模型能夠預(yù)測(cè)信息豐富的文本標(biāo)記,增強(qiáng)細(xì)粒度語(yǔ)義表征學(xué)習(xí)。

廣泛的實(shí)驗(yàn)表明,GA-DMS在多個(gè)基準(zhǔn)測(cè)試中達(dá)到了最先進(jìn)的性能,實(shí)現(xiàn)了更精準(zhǔn)的“以文找人”檢索能力——在CUHK-PEDES數(shù)據(jù)集上的準(zhǔn)確率達(dá)到77.6%,在RSTPReid上準(zhǔn)確率達(dá)到71.25%。

7c9b6aa8-9543-11f0-8c8f-92fbcf53809c.png

GA-DMS技術(shù)示意圖

關(guān)于技術(shù)報(bào)告的更多細(xì)節(jié),可點(diǎn)擊下方鏈接體驗(yàn)。

論文題目:Gradient-Attention Guided Dual-Masking Synergetic Framework for Robust Text-based Person Retrieval

研究團(tuán)隊(duì):格靈深瞳、東北大學(xué)、華南理工大學(xué)

報(bào)告鏈接:https://arxiv.org/pdf/2509.09118

項(xiàng)目主頁(yè):https://github.com/Multimodal-Representation-Learning-MRL/GA-DMS

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37213

    瀏覽量

    291994
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8532

    瀏覽量

    136018
  • 格靈深瞳
    +關(guān)注

    關(guān)注

    1

    文章

    73

    瀏覽量

    5870

原文標(biāo)題:讓AI讀懂人物描寫!新框架GA-DMS突破“以文找人”技術(shù)難題 | Glint Tech

文章出處:【微信號(hào):shentongzhineng,微信公眾號(hào):格靈深瞳】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    與奧瑞德達(dá)成戰(zhàn)略合作

    近日,與奧瑞德光電股份有限公司達(dá)成戰(zhàn)略合作。雙方將重點(diǎn)圍繞大模型技術(shù)應(yīng)用及解決方案,整合各自優(yōu)勢(shì),向國(guó)內(nèi)外客戶提供高效能的智能算力服
    的頭像 發(fā)表于 10-11 17:32 ?1320次閱讀

    視覺基礎(chǔ)模型Glint-MVT的發(fā)展脈絡(luò)

    此前,8月28-30日,2025百度云智大會(huì)在北京舉辦。在算力平臺(tái)專題論壇上,技術(shù)副總裁、算法研究院院長(zhǎng)馮子勇分享了《視覺基座:通向
    的頭像 發(fā)表于 09-05 17:13 ?1114次閱讀
    <b class='flag-5'>格</b><b class='flag-5'>靈</b><b class='flag-5'>深</b><b class='flag-5'>瞳</b>視覺基礎(chǔ)模型Glint-MVT的發(fā)展脈絡(luò)

    加入海光產(chǎn)業(yè)生態(tài)合作組織

    近日,正式加入海光產(chǎn)業(yè)生態(tài)合作組織(簡(jiǎn)稱“光合組織”),成為該組織成員單位。
    的頭像 發(fā)表于 08-25 16:10 ?437次閱讀

    智慧金融產(chǎn)品家族全新升級(jí)

    智能體時(shí)代,如何打造能用、好用、有持續(xù)成長(zhǎng)性的智慧金融產(chǎn)品?這是探索 AI+金融深度融合的實(shí)踐方向。
    的頭像 發(fā)表于 08-19 17:53 ?931次閱讀

    智慧體育產(chǎn)品全新升級(jí)

    智慧體育產(chǎn)品家族,近期迎來(lái)全新升級(jí)。
    的頭像 發(fā)表于 08-14 11:51 ?1054次閱讀

    視覺基礎(chǔ)模型Glint-MVT升級(jí)

    近日,靈感實(shí)驗(yàn)室和華為倫敦研究所發(fā)布最新版視覺基礎(chǔ)模型——Glint-MVT v1.5(RICE)。
    的頭像 發(fā)表于 07-31 11:01 ?1073次閱讀
    <b class='flag-5'>格</b><b class='flag-5'>靈</b><b class='flag-5'>深</b><b class='flag-5'>瞳</b>視覺基礎(chǔ)模型Glint-MVT升級(jí)

    與您相約WAIC 2025

    7月26-29日,2025世界人工智能大會(huì)(WAIC)將在上海世博中心和世博展覽館舉行。將在第一現(xiàn)場(chǎng),聯(lián)合華為昇騰、百度、飛騰等生態(tài)合作伙伴,展示金融全系列整體解決方案、墨刃A
    的頭像 發(fā)表于 07-26 16:14 ?842次閱讀

    六篇論文入選ICCV 2025

    近日,國(guó)際頂級(jí)會(huì)議ICCV 2025(計(jì)算機(jī)視覺國(guó)際大會(huì))公布論文錄用結(jié)果,團(tuán)隊(duì)共有6篇論文入選。
    的頭像 發(fā)表于 07-07 18:23 ?1165次閱讀

    亮相AICon 2025全球人工智能開發(fā)與應(yīng)用大會(huì)

    此前,6月27-28日,由極客邦科技旗下InfoQ中國(guó)主辦的“AICon全球人工智能開發(fā)與應(yīng)用大會(huì)”在北京舉辦。作為行業(yè)領(lǐng)先的視覺AI公司,受邀參會(huì)。
    的頭像 發(fā)表于 07-05 16:15 ?1134次閱讀

    AI技術(shù)助力體育教育事業(yè)高質(zhì)量發(fā)展

    隨著體育中考分值的提升與政策持續(xù)加碼,如何突破傳統(tǒng)考試模式效率低、公平性爭(zhēng)議大、數(shù)據(jù)管理難等問(wèn)題,成為教育現(xiàn)代化的關(guān)鍵議題。以自主創(chuàng)
    的頭像 發(fā)表于 06-04 11:44 ?727次閱讀

    與百度智能云達(dá)成戰(zhàn)略合作,共筑AI算力新基建

    力底座,推動(dòng)政務(wù)、金融、公共安全等領(lǐng)域的智能化升級(jí)。 百度智能云泛科技業(yè)務(wù)部總經(jīng)理張瑋,銷售副總裁蘆斌代表雙方簽約,百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖,
    的頭像 發(fā)表于 04-27 10:20 ?904次閱讀

    發(fā)布全國(guó)產(chǎn)超融合大模型一體機(jī)

    近日,人工智能領(lǐng)域的創(chuàng)新者宣布推出全國(guó)產(chǎn)化的超融合大模型一體機(jī),該產(chǎn)品在業(yè)界引起了廣泛關(guān)注。這款一體機(jī)不僅展現(xiàn)了
    的頭像 發(fā)表于 02-19 15:37 ?982次閱讀

    近期接連斬獲8項(xiàng)大獎(jiǎng)

    年關(guān)將至,喜事連連。憑借前沿的技術(shù)產(chǎn)品和行業(yè)領(lǐng)先的市場(chǎng)表現(xiàn),接連斬獲八項(xiàng)大獎(jiǎng),持續(xù)獲得來(lái)自政府、行業(yè)以及媒體等各界的肯定。
    的頭像 發(fā)表于 12-26 10:20 ?731次閱讀

    列車巡檢機(jī)器人順利通過(guò)科創(chuàng)課題結(jié)題評(píng)審

    近日,自研的列車巡檢機(jī)器人,在西北某鐵路局動(dòng)車段牽頭的課題中順利通過(guò)結(jié)題評(píng)審。憑借領(lǐng)
    的頭像 發(fā)表于 12-25 09:25 ?846次閱讀

    擬控股國(guó)科億道

    近日發(fā)布公告,宣布了一項(xiàng)重要的股權(quán)投資計(jì)劃。公司計(jì)劃通過(guò)增資及收購(gòu)股權(quán)的方式,取得深圳市國(guó)科億道科技有限公司的部分股權(quán),從而進(jìn)一步拓展其業(yè)務(wù)領(lǐng)域。 具體而言,
    的頭像 發(fā)表于 11-26 11:00 ?748次閱讀