18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

詳解開(kāi)源關(guān)鍵信息提取方案PP-ChatOCRv4的設(shè)計(jì)與實(shí)現(xiàn)

jf_23871869 ? 來(lái)源:jf_23871869 ? 作者:jf_23871869 ? 2025-08-21 18:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一,問(wèn)題背景與挑戰(zhàn)

在數(shù)字化時(shí)代,文檔依然是承載和傳遞信息的重要媒介。特別是在金融、法律、醫(yī)療等領(lǐng)域,從發(fā)票、合同、病歷等復(fù)雜文檔中精準(zhǔn)提取關(guān)鍵信息,是自動(dòng)化辦公和智能決策的基礎(chǔ)環(huán)節(jié)。

然而,關(guān)鍵信息提取在實(shí)際落地中面臨多重挑戰(zhàn):

復(fù)雜文檔結(jié)構(gòu)理解:文檔往往包含文本、表格、印章、圖像等多種元素,傳統(tǒng) OCR 難以完整解析復(fù)雜布局

語(yǔ)義理解與推理:不僅要識(shí)別文本,還需結(jié)合上下文和領(lǐng)域知識(shí)進(jìn)行語(yǔ)義推理

多模態(tài)信息融合:需要將視覺(jué)信息與文本語(yǔ)義有效結(jié)合,實(shí)現(xiàn)跨模態(tài)理解

模型效率與部署:大型模型效果好但部署成本高,輕量模型部署容易但精度不足

為應(yīng)對(duì)這些問(wèn)題,PP-ChatOCRv4應(yīng)需而生,融合了 OCR、計(jì)算機(jī)視覺(jué)與大語(yǔ)言模型技術(shù),實(shí)現(xiàn)了復(fù)雜文檔的高效智能解析與關(guān)鍵信息抽取。

二,PP-ChatOCRv4 解決方案概述

PP-ChatOCRv4 是一個(gè)開(kāi)源的端到端關(guān)鍵信息抽取與智能問(wèn)答系統(tǒng),面向復(fù)雜文檔的解析與交互場(chǎng)景。它結(jié)合 OCR 技術(shù)、結(jié)構(gòu)化解析、向量檢索 與 大語(yǔ)言模型(LLM),構(gòu)建了從文檔圖像到結(jié)構(gòu)化結(jié)果的完整處理鏈路 → PP-ChatOCRv4快速體驗(yàn)。

大模型社區(qū)-飛槳星河AI Studio大模型社區(qū)

1,核心設(shè)計(jì)理念

模塊化架構(gòu):組件松耦合,便于替換、擴(kuò)展和二次開(kāi)發(fā)

多模態(tài)融合:結(jié)合視覺(jué)特征與文本語(yǔ)義,提高理解準(zhǔn)確度

檢索增強(qiáng):向量檢索為 LLM 提供精準(zhǔn)上下文,提升回答質(zhì)量

輕量高效:支持輕量化部署,適配資源受限環(huán)境

開(kāi)源共建:完全開(kāi)源,與 PaddlePaddle 生態(tài)深度集成

2,技術(shù)架構(gòu)

主要模塊說(shuō)明:

PP-DocBee2

對(duì)文檔進(jìn)行全文解析與語(yǔ)義理解,直接產(chǎn)出關(guān)鍵信息候選

PP-StructureV3

執(zhí)行表格解析、版面分析、字段定位等結(jié)構(gòu)化處理

Vector Retrieval(向量檢索)

將結(jié)構(gòu)化結(jié)果轉(zhuǎn)為向量并檢索,為推理提供精準(zhǔn)上下文

Prompt Engineering(提示詞工程)

將檢索結(jié)果與用戶問(wèn)題結(jié)合,生成優(yōu)化后的 LLM 輸入

大語(yǔ)言模型

支持 ERNIE、GPT 等模型,完成跨領(lǐng)域語(yǔ)義推理與生成

Result Fusion(結(jié)果融合)

融合 LLM 輸出與 PP-DocBee2 結(jié)果,提升最終結(jié)果的準(zhǔn)確性與置信度

這種架構(gòu)既保留了傳統(tǒng) OCR 的高精度識(shí)別優(yōu)勢(shì),又結(jié)合檢索增強(qiáng)的多模態(tài)推理,使其能夠勝任復(fù)雜、多變的文檔解析任務(wù)。

三,環(huán)境準(zhǔn)備與快速體驗(yàn)

1,安裝依賴

PP-ChatOCRv4 基于 PaddleOCR 3.0 開(kāi)發(fā),使用前需安裝必要依賴:

# 安裝 PaddlePaddle (GPU版本)
python -m pip install paddlepaddle-gpu==3.1.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/
# 安裝 PaddleOCR
pip install paddleocr
# 安裝 ERNIE-4.5-0.3B 依賴
git clone https://github.com/PaddlePaddle/ERNIE.git
cd ERNIE
pip install -r requirements.txt
pip install -e .
pip install --upgrade opencv-python opencv-python-headless

2,快速上手示例

以下是一個(gè)簡(jiǎn)單的PP-ChatOCRv4使用示例,展示如何從合同文檔中提取關(guān)鍵信息:

from paddleocr import PPChatOCRv4Doc

# 配置ERNIE服務(wù)

chat_bot_config = {
"module_name": "chat_bot",
"model_name": "ernie-4.5-0.3b",
"base_url": "http://0.0.0.0:8178/v1",
"api_type": "openai",
"api_key": "sk-xxxxxx...",  # 替換為你的API密鑰
}

# 初始化PP-ChatOCRv4

pipeline = PPChatOCRv4Doc()

# 文檔視覺(jué)分析

image_path = "./contract_sample.jpg"
visual_predict_res = pipeline.visual_predict(
input=image_path,
use_doc_orientation_classify=False,
use_doc_unwarping=False,
use_common_ocr=True,
use_seal_recognition=True,
use_table_recognition=True,
)

# 提取視覺(jué)信息

visual_info_list = []
for res in visual_predict_res:
visual_info_list.append(res["visual_info"])

# 關(guān)鍵信息提取

question = "合同中的甲方名稱是什么?"
chat_result = pipeline.chat(
key_list=[question],
visual_info=visual_info_list,
chat_bot_config=chat_bot_config,
)
print(chat_result['chat_res'])

# 預(yù)期輸出: {'合同中的甲方名稱是什么?': '北京科技有限公司'}

項(xiàng)目完整代碼,請(qǐng)參見(jiàn):Practice of Key Information Extraction in Contract Scenarios Based on ERNIE-4.5-0.3B and PaddleOCR

鏈接:https://github.com/PaddlePaddle/ERNIE/blob/develop/cookbook/notebook/key_information_extraction_tutorial_en.ipynb

四,性能評(píng)估與優(yōu)化

1,基準(zhǔn)測(cè)試

我們?cè)诠_(kāi)數(shù)據(jù)集和實(shí)際業(yè)務(wù)場(chǎng)景中對(duì)PP-ChatOCRv4進(jìn)行了全面評(píng)估,以下是在合同關(guān)鍵信息提取任務(wù)上的性能表現(xiàn):

測(cè)試環(huán)境:A100 GPU, batch size=1, 輸入文本長(zhǎng)度平均512 tokens

2,優(yōu)化策略

PP-ChatOCRv4的性能優(yōu)化主要體現(xiàn)在以下幾個(gè)方面:

模型壓縮:采用知識(shí)蒸餾、量化等技術(shù),減小模型體積

推理加速:使用Paddle Inference優(yōu)化推理性能

并行計(jì)算:支持多GPU并行處理,提高吞吐量

自適應(yīng)batch size:根據(jù)輸入文檔復(fù)雜度動(dòng)態(tài)調(diào)整batch size

# 啟用INT8量化優(yōu)化

from paddle.quantization.quantize import quantize_model
quantized_model = quantize_model(model, quantize_type='INT8')

# 使用Paddle Inference加速推理

from paddle.inference import Config, create_predictor
config = Config(model_path)
config.enable_memory_optim()
config.set_cpu_math_library_num_threads(10)
predictor = create_predictor(config)

五,實(shí)際應(yīng)用案例

以下是使用PP-ChatOCRv4處理合同文檔的實(shí)際案例:

案例:從房屋租賃合同中提取面積誤差比例

from paddleocr import PPChatOCRv4Doc

# 配置ERNIE服務(wù)

chat_bot_config = {
"module_name": "chat_bot",
"model_name": "xxx",
"base_url": "http://10.214.40.13:8170/v1",
"api_type": "openai",
"api_key": "sk-xxxxxx...",  # your api_key
}

# 初始化模型

pipeline = PPChatOCRv4Doc()

# 處理文檔

image_path = "./housing_contract.jpg"
question = "合同中的面積誤差比例是多少?"
visual_predict_res = pipeline.visual_predict(
input=image_path,
use_doc_orientation_classify=False,
use_doc_unwarping=False,
use_common_ocr=True,
use_seal_recognition=True,
use_table_recognition=True,
)
visual_info_list = []
for res in visual_predict_res:
visual_info_list.append(res["visual_info"])
layout_parsing_result = res["layout_parsing_result"]

# 提取面積誤差比例

chat_result = pipeline.chat(
key_list=[question],
visual_info=visual_info_list,
vector_info=None,
mllm_predict_info=None,
chat_bot_config=chat_bot_config,
retriever_config=None,
)
print(chat_result['chat_res'])

# 輸出: {'合同中的面積誤差比例是多少?': '面積誤差比絕對(duì)值在5%以內(nèi)(含5%)'}

實(shí)際應(yīng)用中,PP-ChatOCRv4展現(xiàn)出了良好的魯棒性和準(zhǔn)確性,能夠有效處理各種復(fù)雜合同文檔。

六 總結(jié)與展望

PP-ChatOCRv4作為開(kāi)源關(guān)鍵信息提取解決方案,通過(guò)融合OCR、計(jì)算機(jī)視覺(jué)和大語(yǔ)言模型技術(shù),有效解決了復(fù)雜文檔解析的難題。其模塊化設(shè)計(jì)、多模態(tài)融合能力和輕量級(jí)部署特性,使其在金融、法律、醫(yī)療等多個(gè)領(lǐng)域具有廣泛的應(yīng)用前景。

下一步與資源

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開(kāi)源
    +關(guān)注

    關(guān)注

    3

    文章

    3893

    瀏覽量

    45365
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    170

    瀏覽量

    17004
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    淘寶圖片搜索接口開(kāi)發(fā)實(shí)戰(zhàn):從 CNN 特征提取到商品匹配(附避坑手冊(cè) + 可復(fù)用代碼)

    本文詳解淘寶圖片搜索接口開(kāi)發(fā)全流程,涵蓋CNN特征提取、商品匹配、參數(shù)配置及400/429等高頻報(bào)錯(cuò)解決方案,附合規(guī)避坑指南與可復(fù)用代碼,助你高效實(shí)現(xiàn)圖像搜商品功能。
    的頭像 發(fā)表于 10-21 10:03 ?125次閱讀

    基于微四探針(M4PP)?測(cè)量的石墨烯電導(dǎo)性能評(píng)估

    應(yīng)用的關(guān)鍵。Xfilm埃利四探針?lè)阶鑳x作為高精度電學(xué)測(cè)量設(shè)備,在該領(lǐng)域展現(xiàn)出重要的技術(shù)價(jià)值。微四探針(M4PP)憑借高精度、高空間分辨率及支持霍爾效應(yīng)測(cè)量的優(yōu)勢(shì),成為石墨
    的頭像 發(fā)表于 10-16 18:03 ?79次閱讀
    基于微四探針(M<b class='flag-5'>4PP</b>)?測(cè)量的石墨烯電導(dǎo)性能評(píng)估

    京東商品 SKU 信息接口技術(shù)干貨:數(shù)據(jù)拉取、規(guī)格解析與字段治理(附踩坑總結(jié) + 可運(yùn)行代碼

    本文詳解京東商品SKU接口對(duì)接技術(shù),涵蓋核心參數(shù)、權(quán)限申請(qǐng)、簽名生成、規(guī)格解析及常見(jiàn)坑點(diǎn)解決方案,結(jié)合可運(yùn)行代碼與實(shí)戰(zhàn)經(jīng)驗(yàn),助力開(kāi)發(fā)者高效集成SKU數(shù)據(jù),實(shí)現(xiàn)庫(kù)存、價(jià)格等關(guān)鍵
    的頭像 發(fā)表于 09-29 11:56 ?229次閱讀
    京東商品 SKU <b class='flag-5'>信息</b>接口技術(shù)干貨:數(shù)據(jù)拉取、規(guī)格解析與字段治理(附踩坑總結(jié) + 可運(yùn)行代碼

    納雷科技成為PX4開(kāi)源飛控平臺(tái)官方合作伙伴

    近日,納雷科技正式以銀級(jí)會(huì)員身份加入PX4開(kāi)源飛控生態(tài)!到目前為止,納雷科技已成為全球兩大主流無(wú)人機(jī)開(kāi)源飛控平臺(tái)(APM&PX4)的官方合作伙伴。其雷達(dá)技術(shù)將深度融入
    的頭像 發(fā)表于 05-21 14:37 ?889次閱讀

    基于算力魔方的智能文檔信息提取方案

    的進(jìn)步,使得自動(dòng)化和智能化的文檔信息提取成為現(xiàn)實(shí)。本方案結(jié)合了Intel OpenVINO平臺(tái)的性能優(yōu)化優(yōu)勢(shì)與百度飛槳(PaddlePaddle)提供的PP-OCRv4模型,旨在開(kāi)發(fā)一款高性能、高精度的智能文檔處理系統(tǒng)。 算力魔
    的頭像 發(fā)表于 05-15 10:37 ?400次閱讀
    基于算力魔方的智能文檔<b class='flag-5'>信息提取</b><b class='flag-5'>方案</b>

    如何實(shí)現(xiàn)全自動(dòng)提取發(fā)票和合同的關(guān)鍵信息?

    、資產(chǎn)負(fù)債結(jié)構(gòu)等關(guān)鍵數(shù)據(jù),導(dǎo)致經(jīng)營(yíng)決策與實(shí)際資金能力脫節(jié)?; 財(cái)務(wù)制度執(zhí)行松散?:約40%的中小企業(yè)未建立標(biāo)準(zhǔn)財(cái)務(wù)管理制度,甚至依賴親屬或非專業(yè)人員管理財(cái)務(wù),數(shù)據(jù)可靠性存疑?; 風(fēng)險(xiǎn)感知滯后?:因缺乏定期財(cái)務(wù)分析,許多企業(yè)
    的頭像 發(fā)表于 04-17 17:51 ?300次閱讀
    如何<b class='flag-5'>實(shí)現(xiàn)</b>全自動(dòng)<b class='flag-5'>提取</b>發(fā)票和合同的<b class='flag-5'>關(guān)鍵</b><b class='flag-5'>信息</b>?

    如何實(shí)現(xiàn)全自動(dòng)提取發(fā)票和合同的關(guān)鍵信息?

    代碼
    jf_23871869
    發(fā)布于 :2025年04月16日 14:21:50

    使用OpenVINO優(yōu)化并部署飛槳PP-OCRv4模型

    GitHub上與其它OCR開(kāi)源庫(kù)相比,PaddleOCR在近五年發(fā)展時(shí)間內(nèi),擁有最多的星標(biāo)(46k)、最快的星標(biāo)增速、最多的貢獻(xiàn)者(234)和最活躍的社區(qū)支持! PaddleOCR支持多種 OCR 相關(guān)前沿
    的頭像 發(fā)表于 04-03 18:07 ?1916次閱讀
    使用OpenVINO優(yōu)化并部署飛槳<b class='flag-5'>PP-OCRv4</b>模型

    如何在C#中部署飛槳PP-OCRv4模型

    《超4萬(wàn)6千星的開(kāi)源OCR黑馬登場(chǎng),PaddleOCR憑什么脫穎而出?》收到了讀者熱烈反響c,很多讀者提出:如何在C#中部署飛槳PP-OCRv4模型?本文從零開(kāi)始詳細(xì)介紹整個(gè)過(guò)程。
    的頭像 發(fā)表于 02-17 10:58 ?2494次閱讀
    如何在C#中部署飛槳<b class='flag-5'>PP-OCRv4</b>模型

    使用OpenVINO C# API輕松部署飛槳PP-OCRv4模型

    ? 作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 《超4萬(wàn)6千星的開(kāi)源OCR黑馬登場(chǎng),PaddleOCR憑什么脫穎而出?》 收到了讀者熱烈反響,很多讀者提出:如何在C#中部署飛槳PP-OCRv4模型
    的頭像 發(fā)表于 02-12 10:42 ?1889次閱讀
    使用OpenVINO C# API輕松部署飛槳<b class='flag-5'>PP-OCRv4</b>模型

    N32G4FR系列芯片關(guān)鍵特性,定貨型號(hào)及資源,封裝尺寸等信息

    電子發(fā)燒友網(wǎng)站提供《N32G4FR系列芯片關(guān)鍵特性,定貨型號(hào)及資源,封裝尺寸等信息.pdf》資料免費(fèi)下載
    發(fā)表于 01-22 15:15 ?1次下載
    N32G<b class='flag-5'>4</b>FR系列芯片<b class='flag-5'>關(guān)鍵</b>特性,定貨型號(hào)及資源,封裝尺寸等<b class='flag-5'>信息</b>

    基于鎖相環(huán)法的載波提取方案

    電子發(fā)燒友網(wǎng)站提供《基于鎖相環(huán)法的載波提取方案.pdf》資料免費(fèi)下載
    發(fā)表于 01-07 14:41 ?0次下載

    Bananna Pi開(kāi)源社區(qū)聯(lián)合矽昌通信打造開(kāi)源的低成本W(wǎng)ifi5路由器解決方案

    香蕉派 BPI-Wifi5 路由器采用矽昌SF19A2890S2芯片方案設(shè)計(jì)。它是一款高性能無(wú)線路由器,適用于小微企業(yè)、家庭和其他網(wǎng)絡(luò)環(huán)境。Banana Pi開(kāi)源社區(qū)提供整體解決方案。所有代碼
    發(fā)表于 12-12 17:15

    高效數(shù)據(jù)管理工具:PP-B2811多硬盤母源備份應(yīng)用

    PP-B2811多硬盤母源備份技術(shù),為醫(yī)療、金融和教育行業(yè)提供集中化數(shù)據(jù)管理解決方案。支持多種存儲(chǔ)設(shè)備,實(shí)現(xiàn)快速備份和數(shù)據(jù)安全。提升檢索效率,節(jié)省存儲(chǔ)空間,確保信息安全。
    的頭像 發(fā)表于 12-11 11:55 ?681次閱讀
    高效數(shù)據(jù)管理工具:<b class='flag-5'>PP</b>-B2811多硬盤母源備份應(yīng)用

    智慧公交是什么?一文帶你詳解智慧公交的解決方案!

    智慧公交是什么?一文帶你詳解智慧公交的解決方案!
    的頭像 發(fā)表于 11-05 12:26 ?1315次閱讀
    智慧公交是什么?一文帶你<b class='flag-5'>詳解</b>智慧公交的解決<b class='flag-5'>方案</b>!