18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

錯(cuò)誤使用GPT-3:成本卻降低了40倍,速度提高了5倍

jf_WZTOguxH ? 來源:Buildt ? 2023-03-01 09:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Buildt 使用 OpenAI 基礎(chǔ)模型已經(jīng)有一段時(shí)間了。這些模型非常強(qiáng)大,關(guān)于這一點(diǎn),互聯(lián)網(wǎng)上已經(jīng)有了大量的記錄,特別是隨著 ChatGPT 的出現(xiàn),它的關(guān)注度超過了之前 GPT-3 的 100 倍。然而,在應(yīng)用這些模型解決相應(yīng)問題(代碼庫搜索、理解和增強(qiáng))的過程中,我們發(fā)現(xiàn)了一個(gè)明顯的障礙:延遲和成本。比較大的模型(特別是 davinci 家族)無疑能產(chǎn)生最高質(zhì)量的輸出,但運(yùn)行起來也最慢、最昂貴。

要獲得良好的搜索體驗(yàn),顯然速度就得快。你看谷歌,100 毫秒就可以索引數(shù)百萬個(gè)網(wǎng)頁,代碼庫搜索也是如此。我們發(fā)現(xiàn),在單個(gè)搜索中,其中一個(gè)最耗時(shí)的點(diǎn)就是生成輸出的 LLM 層(我們使用 LLM 來增強(qiáng)搜索,讓你可以搜索代碼是什么,而不是它做什么,例如“找出最慢的遞歸函數(shù)”)。Alex grave 是 Github Copilot 的創(chuàng)建者之一。據(jù)他說,每增加 10 毫秒的延遲,完成率就會(huì)下降 1%。這一邏輯也適用于搜索。所以,當(dāng)務(wù)之急是從 davinci 這樣的大型模型轉(zhuǎn)向 ada 和 babbage 這樣的小型模型。

92440896-b1cb-11ed-bfe3-dac502259ad0.png

我們的解決方案很簡單,對于給定的任務(wù),由 davinci 生成一個(gè)中等大小的語料庫,并精心優(yōu)化像 babbage 這樣的模型來完成相同的任務(wù)。如果操作得當(dāng),你可以以低 40 倍的成本、低 4-5 倍的延遲獲得幾乎相同的完成率(或至少 90% 的相似性)。

如果你愿意花點(diǎn)時(shí)間,則還可以在循環(huán)中加一個(gè)人:我們最近就做了這樣的事情來優(yōu)化 babbage 模型,以便能夠識(shí)別代碼的特征,所以我讓 ChatGPT 幫我創(chuàng)建了一個(gè)基本的 Web UI,讓我們可以輕松地審核和改進(jìn) davinci 所的識(shí)別結(jié)果;從根本上說,你永遠(yuǎn)無法從一個(gè)更小的模型那里獲得類似的性能,所以讓完成率勝過你試圖模仿的模型,意味著你至少在訓(xùn)練完成時(shí)就比較接近。

9264637a-b1cb-11ed-bfe3-dac502259ad0.jpg

關(guān)于這種技術(shù),我想的最多的一個(gè)問題是:我需要多少樣本?答案恐怕是“視情況而定”。

根據(jù)經(jīng)驗(yàn),如果你只是想標(biāo)準(zhǔn)化平淡無奇的輸出格式,那么你可以用幾百個(gè)樣本;如果你是在做邏輯推理,那么你至少需要 1000 個(gè)樣本;如果你在做 DSL 工作,那么你需要幾千個(gè)樣本。樣本大小通常會(huì)是一個(gè)障礙,但有了用更大的模型來生成合成數(shù)據(jù)集的方法,那突然變得比較容易處理了,特別是當(dāng)這些模型變得越來越好時(shí)。

這種方法有很多應(yīng)用場景;如果你有一個(gè)提示符,它可以重復(fù)做同樣的工作,那么你就可以使用這項(xiàng)技術(shù)來加快速度,降低成本。

有人問過我這種方法的維護(hù)問題,特別是如果想要更改輸出結(jié)構(gòu)時(shí)會(huì)出現(xiàn)什么情況。我們內(nèi)部構(gòu)建了一個(gè)經(jīng)過精心優(yōu)化的管道來自動(dòng)化整個(gè)過程,其底層是 davinci-003 提示符,然后我們用它來生成 n 個(gè)合成樣本,格式化后傳遞給 OpenAI 調(diào)優(yōu) API,它會(huì)吐出一個(gè)調(diào)優(yōu)過的模型。這樣,如果你想更改提示符的輸出,只需一次單擊就可以更新一個(gè)調(diào)優(yōu)過的模型。

我總是很樂意談?wù)撨@個(gè)話題,歡迎在 Twitter 上關(guān)注我(@AlistairPullen),我上面描述的所有內(nèi)容都可以在我們的代碼搜索工具 Buildt 中找到。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3618

    瀏覽量

    51551
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1235

    瀏覽量

    9714

原文標(biāo)題:錯(cuò)誤使用 GPT-3:成本卻降低了40 倍,速度提高了5 倍

文章出處:【微信號(hào):AI前線,微信公眾號(hào):AI前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    DeepSeek最新論文:訓(xùn)練速度提升9,推理速度快11

    是上一代Grok2的15左右。在Benchmarks中,Grok3毫無懸念成功地領(lǐng)先Deepseek R1、o3 mini等對手。 ? 不過用如此大規(guī)模的算力集群,花費(fèi)上一代15
    的頭像 發(fā)表于 02-20 11:25 ?2501次閱讀
    DeepSeek最新論文:訓(xùn)練<b class='flag-5'>速度</b>提升9<b class='flag-5'>倍</b>,推理<b class='flag-5'>速度</b>快11<b class='flag-5'>倍</b>!

    ?Groq LPU 如何讓萬億參數(shù)模型「飛」起來?揭秘 Kimi K2 40 提速背后的黑科技

    Groq LPU 如何讓萬億參數(shù)模型「飛」起來?揭秘 Kimi K2 40 提速背后的黑科技? 最近,Moonshot AI 的千億參數(shù)大模型 ?Kimi K2? 在 ?GroqCloud? 上
    的頭像 發(fā)表于 08-07 10:01 ?555次閱讀

    如何在VS Code中使用瑞薩RL78系列MCU

    RL78家族系列MCU,以其業(yè)界領(lǐng)先的低功耗和各種內(nèi)置的高性能外圍功能,極大地提高了電源效率,降低了BOM成本,實(shí)現(xiàn)了設(shè)備的小型化。
    的頭像 發(fā)表于 04-23 13:49 ?3581次閱讀
    如何在VS Code中使用瑞薩RL78系列MCU

    準(zhǔn)諧振反激式開關(guān)電路分析及高能效設(shè)計(jì)指南

    ,同條件效率比硬開關(guān)高。 4、變壓器二次匝數(shù)較少。方便二次采用安規(guī)絕緣線繞制。 5、非對稱設(shè)計(jì)。 6、體積相對較小 7、二次整流元件要求很低。 8、低電壓整流元件有效提高了整流效率和降低成本。 9
    發(fā)表于 03-21 16:16

    EP磁致伸縮位移傳感器助力汽車輪轂制造突破生產(chǎn)瓶頸

    博爾森EP磁致伸縮位移傳感器是氣動(dòng)門控制系統(tǒng)的核心組件,采用國產(chǎn)技術(shù)實(shí)現(xiàn)100%自主可控。通過優(yōu)化氣動(dòng)門開關(guān)速度,降低了企業(yè)運(yùn)營成本提高了生產(chǎn)效率。同時(shí),通過提供高精度反饋,
    的頭像 發(fā)表于 03-09 11:56 ?508次閱讀
    EP磁致伸縮位移傳感器助力汽車輪轂制造突破生產(chǎn)瓶頸

    Profinet 轉(zhuǎn) Modbus TCP 借網(wǎng)關(guān)達(dá)成西門子 PLC 與福伺服傳感器連接

    了每個(gè)零部件的裝配質(zhì)量,產(chǎn)品的一致性和可靠性,減少了因裝配誤差導(dǎo)致的產(chǎn)品缺陷和召回風(fēng)險(xiǎn),提升了整車的質(zhì)量和安全性。同時(shí),提高了裝配效率,縮短了生產(chǎn)周期,降低了生產(chǎn)成本。
    的頭像 發(fā)表于 02-27 14:49 ?542次閱讀
    Profinet 轉(zhuǎn) Modbus TCP 借網(wǎng)關(guān)達(dá)成西門子 PLC 與<b class='flag-5'>倍</b>福伺服傳感器連接

    工廠為什么要上設(shè)備數(shù)據(jù)采集系統(tǒng)?

    工廠上設(shè)備數(shù)據(jù)采集系統(tǒng)通過實(shí)時(shí)監(jiān)控、優(yōu)化生產(chǎn)流程和精準(zhǔn)安排生產(chǎn)計(jì)劃,有效提高了生產(chǎn)效率,降低了生產(chǎn)成本提高了整體生產(chǎn)能力。
    的頭像 發(fā)表于 01-20 10:17 ?677次閱讀
    工廠為什么要上設(shè)備數(shù)據(jù)采集系統(tǒng)?

    采用通行密鑰后,X的登錄成功率提高了1

    作者 / 開發(fā)者關(guān)系工程師 Niharika Arora X 是一款社交媒體應(yīng)用,涵蓋各類時(shí)事內(nèi)容,旨在幫助全球近 5 億用戶通過實(shí)時(shí)評述了解事件始末。最近,X 開發(fā)者改進(jìn)了 Android
    的頭像 發(fā)表于 01-20 10:11 ?1057次閱讀
    采用通行密鑰后,X的登錄成功率<b class='flag-5'>提高了</b>1<b class='flag-5'>倍</b>

    OpenAI GPT-5開發(fā)滯后:訓(xùn)練成本高昂

    近日,據(jù)最新消息,OpenAI在推進(jìn)其備受期待的下一代旗艦?zāi)P?b class='flag-5'>GPT-5的開發(fā)進(jìn)程上遇到了困難。由于計(jì)算成本高昂且高質(zhì)量訓(xùn)練數(shù)據(jù)稀缺,GPT-5的開發(fā)已經(jīng)落后于原定計(jì)劃半年之久。 據(jù)悉,OpenAI
    的頭像 發(fā)表于 12-23 11:04 ?1308次閱讀

    SL4008B dcdc5V-40V耐壓 輸出支持升壓、升降壓電源芯片

    簡化了外圍設(shè)計(jì)降低了系統(tǒng)的復(fù)雜性。此外芯片還內(nèi)置了過流保護(hù)、EN腳關(guān)斷功能以及過溫保護(hù)電路這些保護(hù)機(jī)制確保了電源和負(fù)載的安全提高了系統(tǒng)的可靠性。 芯片的工作頻率可通過外接電阻進(jìn)行調(diào)節(jié)這一特點(diǎn)使得
    發(fā)表于 12-19 11:24

    為什么隔離ADC的采樣頻率可以如此顯著的提高?但是帶寬反而降低了?

    。(AMC1304x-Q1) 為什么隔離ADC的采樣頻率可以如此顯著的提高?但是帶寬反而降低了? 為什么隔離ADC都是基于 Δ-Σ 調(diào)制器的,其他結(jié)構(gòu)的(比如SAR)沒有?
    發(fā)表于 12-06 06:42

    DDR3、DDR4、DDR5的性能對比

    通常在800MHz到2133MHz之間,最新的技術(shù)可以達(dá)到8400MHz,但并非普遍標(biāo)準(zhǔn)。其帶寬相比DDR2提高了近30%。 DDR4 :速度通常在2133MHz到4266MHz之間,傳輸速率比DDR3
    的頭像 發(fā)表于 11-29 15:08 ?1.6w次閱讀

    愛立信攜手南通移動(dòng)部署基帶節(jié)能解決方案

    近期,愛立信攜手中國移動(dòng)通信集團(tuán)江蘇有限公司南通分公司為其現(xiàn)網(wǎng)中的3,200多個(gè)基站部署4G和5G基帶節(jié)能解決方案。通過全天候不間斷運(yùn)行和優(yōu)化基站能耗,在最大限度地減少人工干預(yù)的同時(shí),該解決方案有效降低了運(yùn)營與維護(hù)
    的頭像 發(fā)表于 11-18 14:35 ?9396次閱讀

    科學(xué)家將拉曼光譜的測量速率提高100

    Ideguchi 將拉曼光譜的測量速率提高了100,拉曼光譜是一種測量分子 “振動(dòng)指紋”以識(shí)別分子的常用技術(shù)。 由于測量速率一直是一個(gè)主要的限制因素,這一改進(jìn)有助于在許多依賴于識(shí)別分子和細(xì)胞的領(lǐng)域(如
    的頭像 發(fā)表于 11-15 06:24 ?499次閱讀

    使用TPA6111A2提高放大倍數(shù)為2時(shí)發(fā)熱嚴(yán)重,為什么?

    問題:使用TPA6111A2,當(dāng)放大倍數(shù)為1時(shí),R1=20K,其反饋電阻RF=22K,空載時(shí)候電壓不升高,不發(fā)熱.而當(dāng)我要提高放大倍數(shù)為2時(shí)候,反饋電阻RF=51K的時(shí)候,空載時(shí)電壓升高發(fā)熱,負(fù)載時(shí)電壓
    發(fā)表于 11-07 07:25