18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度學(xué)習(xí)在計算機(jī)視覺上的四大應(yīng)用

如意 ? 來源:CSDN ? 作者:呆呆的貓 ? 2020-08-24 16:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深度學(xué)習(xí)計算機(jī)視覺上的應(yīng)用

計算機(jī)視覺中比較成功的深度學(xué)習(xí)的應(yīng)用,包括人臉識別,圖像問答,物體檢測,物體跟蹤。

人臉識別:

這里說人臉識別中的人臉比對,即得到一張人臉,與數(shù)據(jù)庫里的人臉進(jìn)行比對;或同時給兩張人臉,判斷是不是同一個人。

這方面比較超前的是湯曉鷗教授,他們提出的DeepID算法在LWF上做得比較好。他們也是用卷積神經(jīng)網(wǎng)絡(luò),但在做比對時,兩張人臉分別提取了不同位置特征,然后再進(jìn)行互相比對,得到最后的比對結(jié)果。最新的DeepID-3算法,在LWF達(dá)到了99.53%準(zhǔn)確度,與肉眼識別結(jié)果相差無幾。

圖片問答問題:

這是2014年左右興起的課題,即給張圖片同時問個問題,然后讓計算機(jī)回答。比如有一個辦公室靠海的圖片,然后問“桌子后面有什么”,神經(jīng)網(wǎng)絡(luò)輸出應(yīng)該是“椅子和窗戶”。

深度學(xué)習(xí)在計算機(jī)視覺上的四大應(yīng)用

這一應(yīng)用引入了LSTM網(wǎng)絡(luò),這是一個專門設(shè)計出來具有一定記憶能力的神經(jīng)單元。特點是,會把某一個時刻的輸出當(dāng)作下一個時刻的輸入??梢哉J(rèn)為它比較適合語言等,有時間序列關(guān)系的場景。因為我們在讀一篇文章和句子的時候,對句子后面的理解是基于前面對詞語的記憶。

圖像問答問題是基于卷積神經(jīng)網(wǎng)絡(luò)和LSTM單元的結(jié)合,來實現(xiàn)圖像問答。LSTM輸出就應(yīng)該是想要的答案,而輸入的就是上一個時刻的輸入,以及圖像的特征,及問句的每個詞語。

物體檢測問題:

① Region CNN

深度學(xué)習(xí)在物體檢測方面也取得了非常好的成果。2014年的Region CNN算法,基本思想是首先用一個非深度的方法,在圖像中提取可能是物體的圖形塊,然后深度學(xué)習(xí)算法根據(jù)這些圖像塊,判斷屬性和一個具體物體的位置。

深度學(xué)習(xí)在計算機(jī)視覺上的四大應(yīng)用

為什么要用非深度的方法先提取可能的圖像塊?因為在做物體檢測的時候,如果你用掃描窗的方法進(jìn)行物體監(jiān)測,要考慮到掃描窗大小的不一樣,長寬比和位置不一樣,如果每一個圖像塊都要過一遍深度網(wǎng)絡(luò)的話,這種時間是你無法接受的。

所以用了一個折中的方法,叫Selective Search。先把完全不可能是物體的圖像塊去除,只剩2000左右的圖像塊放到深度網(wǎng)絡(luò)里面判斷。那么取得的成績是AP是58.5,比以往幾乎翻了一倍。有一點不盡如人意的是,region CNN的速度非常慢,需要10到45秒處理一張圖片。

② Faster R-CNN方法

而且我在去年NIPS上,我們看到的有Faster R-CNN方法,一個超級加速版R-CNN方法。它的速度達(dá)到了每秒七幀,即一秒鐘可以處理七張圖片。技巧在于,不是用圖像塊來判斷是物體還是背景,而把整張圖像一起扔進(jìn)深度網(wǎng)絡(luò)里,讓深度網(wǎng)絡(luò)自行判斷哪里有物體,物體的方塊在哪里,種類是什么?

經(jīng)過深度網(wǎng)絡(luò)運算的次數(shù)從原來的2000次降到一次,速度大大提高了。

Faster R-CNN提出了讓深度學(xué)習(xí)自己生成可能的物體塊,再用同樣深度網(wǎng)絡(luò)來判斷物體塊是否是背景?同時進(jìn)行分類,還要把邊界和給估計出來。

Faster R-CNN可以做到又快又好,在VOC2007上檢測AP達(dá)到73.2,速度也提高了兩三百倍。

③ YOLO

去年FACEBOOK提出來的YOLO網(wǎng)絡(luò),也是進(jìn)行物體檢測,最快達(dá)到每秒鐘155幀,達(dá)到了完全實時。它讓一整張圖像進(jìn)入到神經(jīng)網(wǎng)絡(luò),讓神經(jīng)網(wǎng)絡(luò)自己判斷這物體可能在哪里,可能是什么。但它縮減了可能圖像塊的個數(shù),從原來Faster R-CNN的2000多個縮減縮減到了98個。

同時取消了Faster R-CNN里面的RPN結(jié)構(gòu),代替Selective Search結(jié)構(gòu)。YOLO里面沒有RPN這一步,而是直接預(yù)測物體的種類和位置。

YOLO的代價就是精度下降,在155幀的速度下精度只有52.7,45幀每秒時的精度是63.4。

④ SSD

在arXiv上出現(xiàn)的最新算法叫Single Shot MultiBox Detector,即SSD。

它是YOLO的超級改進(jìn)版,吸取了YOLO的精度下降的教訓(xùn),同時保留速度快的特點。它能達(dá)到58幀每秒,精度有72.1。速度超過Faster R-CNN 有8倍,但達(dá)到類似的精度。

物體跟蹤

所謂跟蹤,就是在視頻里面第一幀時鎖定感興趣的物體,讓計算機(jī)跟著走,不管怎么旋轉(zhuǎn)晃動,甚至躲在樹叢后面也要跟蹤。

深度學(xué)習(xí)在計算機(jī)視覺上的四大應(yīng)用

深度學(xué)習(xí)對跟蹤問題有很顯著的效果。是第一在線用深度學(xué)習(xí)進(jìn)行跟蹤的文章,當(dāng)時超過了其它所有的淺層算法。

今年有越來越多深度學(xué)習(xí)跟蹤算法提出。去年十二月ICCV 2015上面,馬超提出的Hierarchical Convolutional Feature算法,在數(shù)據(jù)上達(dá)到最新的記錄。它不是在線更新一個深度學(xué)習(xí)網(wǎng)絡(luò),而是用一個大網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練,然后讓大網(wǎng)絡(luò)知道什么是物體什么不是物體。

將大網(wǎng)絡(luò)放在跟蹤視頻上面,然后再分析網(wǎng)絡(luò)在視頻上產(chǎn)生的不同特征,用比較成熟的淺層跟蹤算法來進(jìn)行跟蹤,這樣利用了深度學(xué)習(xí)特征學(xué)習(xí)比較好的好處,同時又利用了淺層方法速度較快的優(yōu)點。效果是每秒鐘10幀,同時精度破了記錄。

最新的跟蹤成果是基于Hierarchical Convolutional Feature,由一個韓國的科研組提出的MDnet。它集合了前面兩種深度算法的集大成,首先離線的時候有學(xué)習(xí),學(xué)習(xí)的不是一般的物體檢測,也不是ImageNet,學(xué)習(xí)的是跟蹤視頻,然后在學(xué)習(xí)視頻結(jié)束后,在真正在使用網(wǎng)絡(luò)的時候更新網(wǎng)絡(luò)的一部分。這樣既在離線的時候得到了大量的訓(xùn)練,在線的時候又能夠很靈活改變自己的網(wǎng)絡(luò)。

基于嵌入式系統(tǒng)的深度學(xué)習(xí)

回到ADAS問題(慧眼科技的主業(yè)),它完全可以用深度學(xué)習(xí)算法,但對硬件平臺有比較高的要求。在汽車上不太可能把一臺電腦放上去,因為功率是個問題,很難被市場所接受。

現(xiàn)在的深度學(xué)習(xí)計算主要是在云端進(jìn)行,前端拍攝照片,傳給后端的云平臺處理。但對于ADAS而言,無法接受長時間的數(shù)據(jù)傳輸?shù)?,或許發(fā)生事故后,云端的數(shù)據(jù)還沒傳回來。

那是否可以考慮NVIDIA推出的嵌入式平臺?NVIDIA推出的嵌入式平臺,其運算能力遠(yuǎn)遠(yuǎn)強(qiáng)過了所有主流的嵌入式平臺,運算能力接近主流的頂級CPU,如臺式機(jī)的i7。那么慧眼科技在做工作就是要使得深度學(xué)習(xí)算法,在嵌入式平臺有限的資源情況下能夠達(dá)到實時效果,而且精度幾乎沒有減少。

具體做法是,首先對網(wǎng)絡(luò)進(jìn)行縮減,可能是對網(wǎng)絡(luò)的結(jié)構(gòu)縮減,由于識別場景不同,也要進(jìn)行相應(yīng)的功能性縮減;另外要用最快的深度檢測算法,結(jié)合最快的深度跟蹤算法,同時自己研發(fā)出一些場景分析算法。三者結(jié)合在一起,目的是減少運算量,減少檢測空間的大小。在這種情況下,在有限資源上實現(xiàn)了使用深度學(xué)習(xí)算法,但精度減少的非常少。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7730

    瀏覽量

    92461
  • 人臉識別
    +關(guān)注

    關(guān)注

    77

    文章

    4106

    瀏覽量

    87256
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5587

    瀏覽量

    123768
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    STM32計算機(jī)視覺開發(fā)套件:B-CAMS-IMX攝像頭模塊技術(shù)解析

    CMOS RGB圖像傳感器、ISM330DLC慣性運動單元和VL53L5CX ToF傳感器。B-CAMS-IMX可用于任何具有MIPI CSI-2? 接口(帶22引腳FFC連接器)的STM32開發(fā)板,輕松STM32微控制器和微處理器實現(xiàn)全功能
    的頭像 發(fā)表于 10-20 09:46 ?230次閱讀
    STM32<b class='flag-5'>計算機(jī)</b><b class='flag-5'>視覺</b>開發(fā)套件:B-CAMS-IMX攝像頭模塊技術(shù)解析

    如何在機(jī)器視覺中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

    人士而言往往難以理解,人們也常常誤以為需要扎實的編程技能才能真正掌握并合理使用這項技術(shù)。事實,這種印象忽視了該技術(shù)為機(jī)器視覺(乃至生產(chǎn)自動化)帶來的潛力,因為深度學(xué)習(xí)并非只屬于
    的頭像 發(fā)表于 09-10 17:38 ?550次閱讀
    如何在機(jī)器<b class='flag-5'>視覺</b>中部署<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>神經(jīng)網(wǎng)絡(luò)

    易控智駕榮獲計算機(jī)視覺頂會CVPR 2025認(rèn)可

    近日,2025年國際計算機(jī)視覺與模式識別頂級會議(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)美國田納西州納什維爾召開。
    的頭像 發(fā)表于 07-29 16:54 ?861次閱讀

    Blue Lion超級計算機(jī)將在NVIDIA Vera Rubin運行

    德國萊布尼茨超算中心(LRZ)將迎來全新超級計算機(jī) Blue Lion,其算力比該中心現(xiàn)有的 SuperMUC-NG 高性能計算機(jī)提升了約 30 倍。這臺新的超級計算機(jī)將在 NVIDIA Vera Rubin 架構(gòu)
    的頭像 發(fā)表于 06-12 15:39 ?710次閱讀

    一文帶你了解工業(yè)計算機(jī)尺寸

    一項艱巨的任務(wù)。本博客將指導(dǎo)您了解關(guān)鍵的工業(yè)計算機(jī)尺寸、使用案例。關(guān)鍵工業(yè)計算機(jī)外形要素及其使用案例一、工業(yè)微型PC尺寸范圍:寬度:100毫米-180毫米深度:10
    的頭像 發(fā)表于 04-24 13:35 ?638次閱讀
    一文帶你了解工業(yè)<b class='flag-5'>計算機(jī)</b>尺寸

    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對計算機(jī)視覺的支持

    計算機(jī)視覺的支持,擴(kuò)大了當(dāng)前對音頻、雷達(dá)和其他時間序列信號數(shù)據(jù)的支持范圍。增加這項支持后,該平臺將能夠用于開發(fā)低功耗、低內(nèi)存的邊緣AI視覺模型。這將給諸多應(yīng)用領(lǐng)域的機(jī)器
    的頭像 發(fā)表于 03-11 15:11 ?588次閱讀
    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對<b class='flag-5'>計算機(jī)</b><b class='flag-5'>視覺</b>的支持

    Arm KleidiCV與OpenCV集成助力移動端計算機(jī)視覺性能優(yōu)化

    等多種應(yīng)用中。然而,這些計算機(jī)視覺應(yīng)用可能很難實現(xiàn)最優(yōu)化的延遲性能和處理速度,特別是在內(nèi)存大小、電池容量和處理能力有限的移動設(shè)備難度更高。 而 Arm KleidiCV 便能在其中大顯身手。該開源庫利用了最新 Arm CPU
    的頭像 發(fā)表于 02-24 10:15 ?783次閱讀

    Quantinuum“Reimei”量子計算機(jī)RIKEN正式運行

    )成功安裝并全面投入運行。 此次合作中,RIKEN為“Reimei”量子計算機(jī)提供了世界級的基礎(chǔ)設(shè)施,包括為其量身定制的設(shè)計、準(zhǔn)備及交付工作。這一里程碑式的成就不僅標(biāo)志著Quantinuum量子計算領(lǐng)域的持續(xù)突破,也預(yù)示著未來
    的頭像 發(fā)表于 02-17 10:21 ?696次閱讀

    AR和VR中的計算機(jī)視覺

    ):計算機(jī)視覺引領(lǐng)混合現(xiàn)實體驗增強(qiáng)現(xiàn)實(AR)和虛擬現(xiàn)實(VR)正在徹底改變我們與外部世界的互動方式。即便是引人入勝的沉浸式
    的頭像 發(fā)表于 02-08 14:29 ?1898次閱讀
    AR和VR中的<b class='flag-5'>計算機(jī)</b><b class='flag-5'>視覺</b>

    云端超級計算機(jī)使用教程

    云端超級計算機(jī)是一種基于云計算的高性能計算服務(wù),它將大量計算資源和存儲資源集中在一起,通過網(wǎng)絡(luò)向用戶提供按需的計算服務(wù)。下面,AI部落小編為
    的頭像 發(fā)表于 12-17 10:19 ?758次閱讀

    工業(yè)中使用哪種計算機(jī)?

    工業(yè)環(huán)境中,工控機(jī)被廣泛使用。這些計算機(jī)的設(shè)計可承受極端溫度、灰塵和振動等惡劣條件。它們比標(biāo)準(zhǔn)消費類計算機(jī)更耐用、更可靠。工業(yè)計算機(jī)可控制機(jī)器、監(jiān)控流程并實時收集數(shù)據(jù)。其堅固的結(jié)構(gòu)和
    的頭像 發(fā)表于 11-29 14:07 ?936次閱讀
    工業(yè)中使用哪種<b class='flag-5'>計算機(jī)</b>?

    量子計算機(jī)與普通計算機(jī)工作原理的區(qū)別

    超越世界最強(qiáng)大的超級計算機(jī),完成以前不可想象的任務(wù)!這意味著量子計算機(jī)可能會徹底改變我們的生活。 本文中,我們將先了解普通計算機(jī)的工作原
    的頭像 發(fā)表于 11-24 11:00 ?2261次閱讀
    量子<b class='flag-5'>計算機(jī)</b>與普通<b class='flag-5'>計算機(jī)</b>工作原理的區(qū)別

    pcie深度學(xué)習(xí)中的應(yīng)用

    深度學(xué)習(xí)模型通常需要大量的數(shù)據(jù)和強(qiáng)大的計算能力來訓(xùn)練。傳統(tǒng)的CPU計算資源有限,難以滿足深度學(xué)習(xí)
    的頭像 發(fā)表于 11-13 10:39 ?1699次閱讀

    工業(yè)計算機(jī)類型介紹

    工業(yè)領(lǐng)域沒有計算機(jī)的世界就像沒有管弦樂隊的交響樂,缺乏實現(xiàn)最佳性能所需的和諧和精確度。計算機(jī)徹底改變了工業(yè)的運作方式,將效率、準(zhǔn)確性和創(chuàng)新推向了新的高度。事實,根據(jù)最近在印度進(jìn)行的一項研究
    的頭像 發(fā)表于 11-04 15:56 ?881次閱讀
    工業(yè)<b class='flag-5'>計算機(jī)</b>類型介紹

    【小白入門必看】一文讀懂深度學(xué)習(xí)計算機(jī)視覺技術(shù)及學(xué)習(xí)路線

    一、什么是計算機(jī)視覺?計算機(jī)視覺,其實就是教機(jī)器怎么像我們?nèi)艘粯?,用攝像頭看看周圍的世界,然后理解它。比如說,它能認(rèn)出這是個蘋果,或者那邊有輛車。除此之外,還能把拍到的照片或者視頻轉(zhuǎn)換
    的頭像 發(fā)表于 10-31 17:00 ?1671次閱讀
    【小白入門必看】一文讀懂<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>計算機(jī)</b><b class='flag-5'>視覺</b>技術(shù)及<b class='flag-5'>學(xué)習(xí)</b>路線