18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

格靈深瞳視覺基礎模型Glint-MVT升級

格靈深瞳 ? 來源:格靈深瞳 ? 2025-07-31 11:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,格靈深瞳靈感實驗室和華為倫敦研究所發(fā)布最新版視覺基礎模型——Glint-MVT v1.5(RICE)。

格靈深瞳此前有6篇論文亮相國際頂級學術舞臺ICCV 2025,涵蓋視覺基座模型、人臉3D重建等領域,其中最新版MVT的相關論文不僅入選,還被接收為Highlight論文。

先看升級后的核心要點:

1技術創(chuàng)新性方面:新版MVT提出了一種區(qū)域局部感知增強的視覺特征學習方法。

2下游任務表現(xiàn)方面:在OCR和分割等任務上效果優(yōu)于v1.1版和AIMv2、SigLIP2。

3此外,團隊還構建了共4億圖像、20億局部區(qū)域、4億文字區(qū)域的預訓練數(shù)據(jù)集。

概括來說,MVT v1.5的最大升級在于:強化了模型對圖像細節(jié)和文字特征的捕捉和表達能力,在精細任務上表現(xiàn)更優(yōu)。

以往的視覺-文本對比學習模型,如OpenAI的CLIP模型和谷歌的改進版SigLIP模型等,更側重全局圖像特征(對圖像內容的概括性描述),核心的訓練邏輯是 “全局對齊”,讓模型理解圖像的整體語義,并和文本的整體語義相對應。

但這類模型對圖像局部區(qū)域的細節(jié)信息表達較少,難以滿足需要精細處理圖像的任務,例如OCR和圖像分割等。

針對這一問題,新版MVT提出一種區(qū)域局部感知增強的視覺特征學習方法。

在技術方案上,格靈深瞳團隊利用專家分割模型和OCR模型,對無標注數(shù)據(jù)進行處理,產生十億級局部區(qū)域,并通過聚類產生偽標簽。也就是說,通過分割-OCR-聚類的技術流程,團隊將無標注數(shù)據(jù)轉化為帶偽標簽的大規(guī)模訓練集,節(jié)約了標注成本,提升了自主學習能力。

25a2de24-6957-11f0-a6aa-92fbcf53809c.png

同時,團隊設計了區(qū)域Transformer層,用來提取局部區(qū)域特征和支持數(shù)據(jù)擴展的區(qū)域鑒別損失,使得團隊能在億級數(shù)據(jù)上進行預訓練,突破了在大規(guī)模樣本上進行高效訓練的技術挑戰(zhàn)。

基于以上技術攻關,MVT v1.5增強了局部特征和文字特征。相較于傳統(tǒng)的全局圖像特征模型,新版MVT在檢測分割、OCR等對應的下游任務表現(xiàn)上得到提升,有效性得到驗證。

25b9774c-6957-11f0-a6aa-92fbcf53809c.png

以文字OCR任務為例,從下圖可以看出,MVT v1.5(RICE)的多項分數(shù)高于CLIP和SigLIP等模型。

文字OCR任務和全局理解任務:

25c3e510-6957-11f0-a6aa-92fbcf53809c.png

引用分割:

25d64200-6957-11f0-a6aa-92fbcf53809c.png

檢測分割任務:

25e81732-6957-11f0-a6aa-92fbcf53809c.png

單目標跟蹤任務:

25fcf4ae-6957-11f0-a6aa-92fbcf53809c.png

從技術創(chuàng)新到下游任務,格靈深瞳并非單純追求學術表現(xiàn),而是注重技術成果轉化應用,通過提升任務表現(xiàn)推動AI在多元場景中真正落地。

MVT v1.5背后的技術團隊——格靈深瞳靈感實驗室,是國內計算機視覺領域的深耕者。靈感實驗室聚焦于視覺及相關模態(tài)特征表達與應用,主要研究方向包括:視覺基礎大模型、多模態(tài)大模型、圖文多模態(tài)表征、大規(guī)模分布式訓練等。下一步,團隊將錨定視頻理解領域,發(fā)布最新模型成果。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6241

    瀏覽量

    110005
  • 模型
    +關注

    關注

    1

    文章

    3618

    瀏覽量

    51543
  • 格靈深瞳
    +關注

    關注

    1

    文章

    73

    瀏覽量

    5868

原文標題:請查收一份“高光”研究成果:格靈深瞳Glint-MVT升級,局部和文字特征再增強

文章出處:【微信號:shentongzhineng,微信公眾號:格靈深瞳】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    與奧瑞德達成戰(zhàn)略合作

    近日,與奧瑞德光電股份有限公司達成戰(zhàn)略合作。雙方將重點圍繞大模型技術應用及解決方案,整合各自優(yōu)勢,向國內外客戶提供高效能的智能算力服
    的頭像 發(fā)表于 10-11 17:32 ?1320次閱讀

    視覺基礎模型Glint-MVT的發(fā)展脈絡

    此前,8月28-30日,2025百度云智大會在北京舉辦。在算力平臺專題論壇上,技術副總裁、算法研究院院長馮子勇分享了《視覺基座:通向
    的頭像 發(fā)表于 09-05 17:13 ?1114次閱讀
    <b class='flag-5'>格</b><b class='flag-5'>靈</b><b class='flag-5'>深</b><b class='flag-5'>瞳</b><b class='flag-5'>視覺</b>基礎<b class='flag-5'>模型</b><b class='flag-5'>Glint-MVT</b>的發(fā)展脈絡

    加入海光產業(yè)生態(tài)合作組織

    近日,正式加入海光產業(yè)生態(tài)合作組織(簡稱“光合組織”),成為該組織成員單位。
    的頭像 發(fā)表于 08-25 16:10 ?436次閱讀

    智慧金融產品家族全新升級

    智能體時代,如何打造能用、好用、有持續(xù)成長性的智慧金融產品?這是探索 AI+金融深度融合的實踐方向。
    的頭像 發(fā)表于 08-19 17:53 ?931次閱讀

    智慧體育產品全新升級

    智慧體育產品家族,近期迎來全新升級。
    的頭像 發(fā)表于 08-14 11:51 ?1054次閱讀

    與您相約WAIC 2025

    7月26-29日,2025世界人工智能大會(WAIC)將在上海世博中心和世博展覽館舉行。將在第一現(xiàn)場,聯(lián)合華為昇騰、百度、飛騰等生態(tài)合作伙伴,展示金融全系列整體解決方案、墨刃A
    的頭像 發(fā)表于 07-26 16:14 ?841次閱讀

    六篇論文入選ICCV 2025

    近日,國際頂級會議ICCV 2025(計算機視覺國際大會)公布論文錄用結果,團隊共有6篇論文入選。
    的頭像 發(fā)表于 07-07 18:23 ?1162次閱讀

    亮相AICon 2025全球人工智能開發(fā)與應用大會

    此前,6月27-28日,由極客邦科技旗下InfoQ中國主辦的“AICon全球人工智能開發(fā)與應用大會”在北京舉辦。作為行業(yè)領先的視覺AI公司,
    的頭像 發(fā)表于 07-05 16:15 ?1132次閱讀

    與百度智能云達成戰(zhàn)略合作,共筑AI算力新基建

    力底座,推動政務、金融、公共安全等領域的智能化升級。 百度智能云泛科技業(yè)務部總經(jīng)理張瑋,銷售副總裁蘆斌代表雙方簽約,百度集團執(zhí)行副總
    的頭像 發(fā)表于 04-27 10:20 ?903次閱讀

    入選量子位2025年AIGC雙榜單

    4月16日,第三屆中國AIGC產業(yè)峰會在京召開。大會由量子位主辦,以“萬物皆可AI”為主題,峰會C位焦點——“2025年值得關注的AIGC企業(yè)”與“2025年值得關注的AIGC產品”雙榜單正式發(fā)布!
    的頭像 發(fā)表于 04-18 09:20 ?750次閱讀

    受邀參加RWKV社區(qū)開發(fā)者大會

    和新的發(fā)展方向。算法工程師楊鎧成受邀參會并發(fā)表了《RWKV-CLIP:一個魯棒的視覺-語言表征學習器》的主題演講。
    的頭像 發(fā)表于 02-28 14:02 ?685次閱讀

    發(fā)布全國產超融合大模型一體機

    近日,人工智能領域的創(chuàng)新者宣布推出全國產化的超融合大模型一體機,該產品在業(yè)界引起了廣泛關注。這款一體機不僅展現(xiàn)了
    的頭像 發(fā)表于 02-19 15:37 ?980次閱讀

    近期接連斬獲8項大獎

    年關將至,喜事連連。憑借前沿的技術產品和行業(yè)領先的市場表現(xiàn),接連斬獲八項大獎,持續(xù)獲得來自政府、行業(yè)以及媒體等各界的肯定。
    的頭像 發(fā)表于 12-26 10:20 ?727次閱讀

    列車巡檢機器人順利通過科創(chuàng)課題結題評審

    近日,自研的列車巡檢機器人,在西北某鐵路局動車段牽頭的課題中順利通過結題評審。憑借領
    的頭像 發(fā)表于 12-25 09:25 ?845次閱讀

    擬控股國科億道

    近日發(fā)布公告,宣布了一項重要的股權投資計劃。公司計劃通過增資及收購股權的方式,取得深圳市國科億道科技有限公司的部分股權,從而進一步拓展其業(yè)務領域。 具體而言,
    的頭像 發(fā)表于 11-26 11:00 ?747次閱讀