數(shù)據(jù)脫敏是數(shù)據(jù)安全領(lǐng)域落地場(chǎng)景較為成熟的技術(shù)手段,在數(shù)據(jù)深層次、大范圍的共享開放的今天,數(shù)據(jù)脫敏在不影響數(shù)據(jù)使用的前提下保護(hù)敏感隱私數(shù)據(jù),已成為數(shù)據(jù)安全建設(shè)重要內(nèi)容。
本文通過對(duì)數(shù)據(jù)脫敏技術(shù)及應(yīng)用場(chǎng)景等進(jìn)行梳理,為各行業(yè)用戶更好的實(shí)施數(shù)據(jù)脫敏技術(shù)提供指南,主要內(nèi)容包括以下四個(gè)方面:
▼數(shù)據(jù)脫敏法規(guī)政策合規(guī)依據(jù)
▼數(shù)據(jù)脫敏技術(shù)定義及實(shí)施過程解析
▼數(shù)據(jù)脫敏典型應(yīng)用場(chǎng)景
▼數(shù)據(jù)脫敏管理體系的建立
數(shù)據(jù)脫敏法規(guī)政策合規(guī)依據(jù)
《網(wǎng)絡(luò)安全法》第四十二條:網(wǎng)絡(luò)運(yùn)營者不得泄露、篡改、毀損其收集的個(gè)人信息;未經(jīng)被收集者同意,不得向他人提供個(gè)人信息。但是,經(jīng)過處理無法識(shí)別特定個(gè)人且不能復(fù)原的除外。
《數(shù)據(jù)安全法》第二十七條:開展數(shù)據(jù)處理活動(dòng)應(yīng)當(dāng)依照法律、法規(guī)的規(guī)定,建立健全全流程數(shù)據(jù)安全管理制度,采取相應(yīng)的技術(shù)措施和其他必要措施,保障數(shù)據(jù)安全。
《個(gè)人信息保護(hù)法》第五十一條:個(gè)人信息處理者應(yīng)當(dāng)根據(jù)個(gè)人信息處理目的、處理方式、個(gè)人信息的種類以及對(duì)個(gè)人權(quán)益的影響、可能存在的安全風(fēng)險(xiǎn)等,采取相應(yīng)的加密、去標(biāo)識(shí)化等安全技術(shù)措施。
《信息安全技術(shù) 網(wǎng)絡(luò)安全等級(jí)保護(hù)基本要求》明確規(guī)定:二級(jí)以上保護(hù)則需要對(duì)敏感數(shù)據(jù)進(jìn)行脫敏處理。H.4.3安全計(jì)算環(huán)境 “大數(shù)據(jù)平臺(tái)應(yīng)提供靜態(tài)脫敏和去標(biāo)識(shí)化的工具或服務(wù)組件技術(shù)?!?H.4.5安全運(yùn)維管理 “應(yīng)在數(shù)據(jù)分類分級(jí)的基礎(chǔ)上,劃分重要數(shù)字資產(chǎn)范圍,明確重要數(shù)據(jù)進(jìn)行自動(dòng)脫敏或去標(biāo)識(shí)使用場(chǎng)景和業(yè)務(wù)處理流程?!?/p>
《網(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例(征求意見稿)》第十二條:數(shù)據(jù)處理者向第三方提供個(gè)人信息,或者共享、交易、委托處理重要數(shù)據(jù)的,應(yīng)當(dāng)遵守:(一)向個(gè)人告知提供個(gè)人信息的目的、類型、方式、范圍、存儲(chǔ)期限、存儲(chǔ)地點(diǎn),并取得個(gè)人單獨(dú)同意,符合法律、行政法規(guī)規(guī)定的不需要取得個(gè)人同意的情形或者經(jīng)過匿名化處理的除外。
典型行業(yè):金融行業(yè)合規(guī)要求
《中國銀行業(yè)“十二五”信息科技發(fā)展規(guī)則監(jiān)管指導(dǎo)意見》:加強(qiáng)數(shù)據(jù)、文檔的安全管理,逐步建立信息資產(chǎn)分類分級(jí)保護(hù)機(jī)制。完善敏感信息存儲(chǔ)和傳輸?shù)雀唢L(fēng)險(xiǎn)環(huán)節(jié)的控制措施,對(duì)數(shù)據(jù)、文檔的訪問應(yīng)建立嚴(yán)格的審批機(jī)制。對(duì)用于測(cè)試的生產(chǎn)數(shù)據(jù)要進(jìn)行脫敏處理,嚴(yán)格防止敏感數(shù)據(jù)泄露。
《金融行業(yè)網(wǎng)絡(luò)安全等級(jí)保護(hù)實(shí)施指引》:應(yīng)將開發(fā)環(huán)境、測(cè)試環(huán)境、實(shí)際運(yùn)行環(huán)境相互分離,敏感數(shù)據(jù)經(jīng)過脫敏后才可在開發(fā)或測(cè)試中使用。
《金融數(shù)據(jù) 安全數(shù)據(jù)生命周期安全規(guī)范》:開發(fā)測(cè)試等過程的數(shù)據(jù),應(yīng)事先進(jìn)行脫敏處理,防止數(shù)據(jù)處理過程中的數(shù)據(jù)泄露,國家及行 業(yè)主管部門另有規(guī)定的除外。
《商業(yè)銀行信息科技風(fēng)險(xiǎn)現(xiàn)場(chǎng)檢查指南》: 開發(fā)過程中是否使用了生產(chǎn)數(shù)據(jù),使用的生產(chǎn)數(shù)據(jù)是否得到高級(jí)管理層的批準(zhǔn)并經(jīng)過脫敏或相關(guān)限制?!薄皽y(cè)試用例是否有生產(chǎn)數(shù)據(jù),當(dāng)使用生產(chǎn)數(shù)據(jù)測(cè)試時(shí)是否得到高級(jí)管理層的審批并采取相關(guān)限制及進(jìn)行脫敏處理。
典型行業(yè):電信和互聯(lián)網(wǎng)行業(yè)合規(guī)要求
《電信和互聯(lián)網(wǎng)行業(yè)數(shù)據(jù)安全 標(biāo)準(zhǔn)體系建設(shè)指南》:數(shù)據(jù)處理 數(shù)據(jù)處理標(biāo)準(zhǔn)用于規(guī)范敏感數(shù)據(jù)、個(gè)人信息的保護(hù)機(jī)制 及相關(guān)技術(shù)要求,明確敏感數(shù)據(jù)保護(hù)的場(chǎng)景、規(guī)則、技術(shù)方 法,主要包括匿名化/去標(biāo)識(shí)化、數(shù)據(jù)脫敏、異常行為識(shí)別等標(biāo)準(zhǔn)。
《電信和互聯(lián)網(wǎng)行業(yè)提升網(wǎng)絡(luò)數(shù)據(jù)安全保護(hù)能力專項(xiàng)行動(dòng)方案》:指導(dǎo)電信和重點(diǎn)互聯(lián)網(wǎng)企業(yè)加強(qiáng)內(nèi)部網(wǎng)絡(luò)數(shù)據(jù)安全組織保障,推動(dòng)設(shè)立或明確網(wǎng)絡(luò)數(shù)據(jù)安全管理責(zé)任部門和專職人員,負(fù)責(zé)承擔(dān)企業(yè)內(nèi)部網(wǎng)絡(luò)數(shù)據(jù)安全管理工作,督促協(xié)調(diào)企業(yè)內(nèi)部各相關(guān)主體和環(huán)節(jié)嚴(yán)格落實(shí)操作權(quán)限管理、日志記錄和安全審計(jì)、數(shù)據(jù)加密、數(shù)據(jù)脫敏、訪問控制、數(shù)據(jù)容災(zāi)備份等數(shù)據(jù)安全保護(hù)措施,組織開展數(shù)據(jù)安全崗位人員法律法規(guī)、知識(shí)技能等培訓(xùn)。
《電信網(wǎng)和互聯(lián)網(wǎng)數(shù)據(jù)脫敏技術(shù)要求與測(cè)試方法》:提出了數(shù)據(jù)脫敏技術(shù)應(yīng)用架構(gòu),并且總結(jié)了在實(shí)際應(yīng)用數(shù)據(jù)脫敏技術(shù)過程中,主要涉及的三個(gè)要素:脫敏算法、脫敏規(guī)則、脫敏策略。此外標(biāo)準(zhǔn)還提出了數(shù)據(jù)脫敏后的效果評(píng)估策略。
《電信網(wǎng)和互聯(lián)網(wǎng)數(shù)據(jù)安全評(píng)估規(guī)范》:查驗(yàn)企業(yè)數(shù)據(jù)脫敏處理管理規(guī)范和制度文件,是否明確數(shù)據(jù)脫敏處理使用應(yīng)用場(chǎng)景,明確數(shù)據(jù)脫敏規(guī)則、脫敏方法、數(shù)據(jù)脫敏處理流程、涉及部門及人員的職責(zé)分工等。查驗(yàn)企業(yè)數(shù)據(jù)脫敏處理管理規(guī)范和制度,企業(yè)業(yè)務(wù)和業(yè)務(wù)支撐系統(tǒng)在數(shù)據(jù)權(quán)限和資源的申請(qǐng)階段,是否由該數(shù)據(jù)的數(shù)據(jù)安全管理負(fù)責(zé)人員評(píng)估使用真實(shí)數(shù)據(jù)的必要性,以及確定該場(chǎng)景下適用的數(shù)據(jù)脫敏規(guī)則及方法。
查驗(yàn)數(shù)據(jù)脫敏處理管理規(guī)范和制度,是否建立數(shù)據(jù)脫敏處理技術(shù)應(yīng)用安全評(píng)估機(jī)制,對(duì)脫敏后的數(shù)據(jù)可恢復(fù)性進(jìn)行安全評(píng)估,是否對(duì)于可恢復(fù)形成原始數(shù)據(jù)的脫敏方法(含算法)進(jìn)行安全加強(qiáng)。演示企業(yè)業(yè)務(wù)測(cè)試系統(tǒng)數(shù)據(jù)庫,企業(yè)是否使用未脫敏的數(shù)據(jù)用于業(yè)務(wù)系統(tǒng)的開發(fā)測(cè)試。查驗(yàn)演示企業(yè)數(shù)據(jù)脫敏工具,是否能對(duì)數(shù)據(jù)脫敏處理過程相應(yīng)的操作進(jìn)行記錄,提供數(shù)據(jù)脫敏處理安全審計(jì)能力。
數(shù)據(jù)脫敏技術(shù)定義及實(shí)施過程解析
01
數(shù)據(jù)脫敏的定義
數(shù)據(jù)脫敏是指對(duì)某些敏感信息通過脫敏規(guī)則進(jìn)行數(shù)據(jù)的變形,實(shí)現(xiàn)敏感隱私數(shù)據(jù)的可靠保護(hù)。在涉及客戶安全數(shù)據(jù)或者一些商業(yè)性敏感數(shù)據(jù)的情況下,在不違反系統(tǒng)規(guī)則條件下,對(duì)真實(shí)數(shù)據(jù)進(jìn)行改造并提供測(cè)試使用,如身份證號(hào)、手機(jī)號(hào)、卡號(hào)、客戶號(hào)等個(gè)人信息都需要進(jìn)行數(shù)據(jù)脫敏。
02
數(shù)據(jù)脫敏發(fā)展歷程:
▼人工脫敏階段:多為SQL腳本方式,在ETL處理過程中進(jìn)行脫敏,該方式工作量大、數(shù)據(jù)處理效率低,同時(shí)存在數(shù)據(jù)質(zhì)量差、無法保證數(shù)據(jù)結(jié)構(gòu)的完整性、數(shù)據(jù)間的關(guān)聯(lián)性。
▼平臺(tái)脫敏階段:融合了敏感數(shù)據(jù)自動(dòng)發(fā)現(xiàn)、系統(tǒng)流程化脫敏、支持豐富數(shù)據(jù)源、脫敏算法庫充足、敏感類型豐富等功能,從而減輕人工成本的同時(shí)提升效率,保證數(shù)據(jù)脫敏的基本訴求。
▼自動(dòng)脫敏階段:通過應(yīng)用機(jī)器學(xué)習(xí)等技術(shù),結(jié)合各類數(shù)據(jù)分類分級(jí)規(guī)則及已實(shí)際使用的數(shù)據(jù)脫敏策略及規(guī)則,實(shí)現(xiàn)自動(dòng)化實(shí)時(shí)敏感數(shù)據(jù)發(fā)現(xiàn)、自動(dòng)化脫敏規(guī)則匹配等智能化數(shù)據(jù)脫敏的結(jié)果。同時(shí),具備分布式等多種部署支持,智能性能分析,自動(dòng)化調(diào)優(yōu)等能力。
03
數(shù)據(jù)脫敏關(guān)鍵技術(shù)能力:
1、高仿真能力:
▼保持?jǐn)?shù)據(jù)原始業(yè)務(wù)特征
▼保持?jǐn)?shù)據(jù)之間的關(guān)聯(lián)性
▼保持?jǐn)?shù)據(jù)之間邏輯一致性
▼業(yè)務(wù)依賴數(shù)據(jù)對(duì)象同步
2、豐富數(shù)據(jù)源支持
▼關(guān)系型數(shù)據(jù)庫支持
▼大數(shù)據(jù)平臺(tái)支持
▼特殊文件類型支持
▼消息列隊(duì)支持
3、內(nèi)置豐富脫敏規(guī)則
▼支持多種數(shù)據(jù)脫敏算法
▼支持組合脫敏、自定義分段規(guī)則
▼具備細(xì)粒度數(shù)據(jù)處理能力
4、高處理效率
▼單臺(tái)設(shè)備性能最大化
▼具備增量脫敏能力
▼支持分布式部署
04
數(shù)據(jù)脫敏分類:
| 類型 | 常用場(chǎng)景 | 具體例子 |
| 靜態(tài)數(shù)據(jù)脫敏 | 靜態(tài)數(shù)據(jù)脫敏通常用于非實(shí)時(shí)場(chǎng)景。 | 將生產(chǎn)環(huán)境中的數(shù)據(jù)脫敏用于測(cè)試環(huán)境。 |
| 動(dòng)態(tài)數(shù)據(jù)脫敏 | 動(dòng)態(tài)數(shù)據(jù)脫敏通常用于生產(chǎn)環(huán)境等實(shí)時(shí)場(chǎng)景,在應(yīng)用或平臺(tái)用戶訪問敏感數(shù)據(jù)的同時(shí)進(jìn)行脫敏,用于解決根據(jù)不同情況對(duì)統(tǒng)一敏感數(shù)據(jù)讀取時(shí)需要進(jìn)行不同級(jí)別、類型脫敏的場(chǎng)景。 | 適用于對(duì)生產(chǎn)數(shù)據(jù)共享或時(shí)效性很高的數(shù)據(jù)訪問場(chǎng)景等,實(shí)現(xiàn)對(duì)生產(chǎn)數(shù)據(jù)庫中的敏感數(shù)據(jù)進(jìn)行透明、實(shí)時(shí)脫敏。 |

如上圖所示:動(dòng)態(tài)脫敏會(huì)對(duì)數(shù)據(jù)進(jìn)行多次脫敏,更多應(yīng)用于直接連接生產(chǎn)數(shù)據(jù)的場(chǎng)景,在用戶訪問生產(chǎn)環(huán)境敏感數(shù)據(jù)時(shí),通過匹配用戶IP或MAC地址等脫敏條件,根據(jù)用戶權(quán)限采用改寫查詢SQL語句等方式返回脫敏后的數(shù)據(jù)。例如運(yùn)維人員在運(yùn)維工作中直連生產(chǎn)數(shù)據(jù)庫,業(yè)務(wù)人員需要通過生產(chǎn)環(huán)境查詢客戶信息等
05
脫敏算法推薦形態(tài)
| 算法 | 描述 | 適用數(shù)據(jù)類型 | 推薦脫敏形態(tài) |
| 重排 | 跨行隨機(jī)互換原始敏感數(shù)據(jù),打破原始敏感數(shù)據(jù)與本行其他數(shù)據(jù)關(guān)聯(lián)關(guān)系。 | 通用 | 動(dòng)態(tài)脫敏、靜態(tài)脫敏 |
| 關(guān)系映射 | 原始敏感數(shù)據(jù)間存在業(yè)務(wù)關(guān)聯(lián)關(guān)系,需要在數(shù)據(jù)脫敏后仍舊保持關(guān)系。因此在脫敏處理中,利用算法表達(dá)式對(duì)脫敏后的數(shù)據(jù)進(jìn)行函數(shù)映射,使其脫敏后仍舊保持業(yè)務(wù)關(guān)聯(lián)關(guān)系。 | 通用 | 動(dòng)態(tài)脫敏、靜態(tài)脫敏 |
| 偏移取整 | 按照一定粒度進(jìn)行偏移取整。 | 日期、時(shí)間、數(shù)字 | 動(dòng)態(tài)脫敏、靜態(tài)脫敏 |
| 散列 | 對(duì)原始數(shù)據(jù)通過散列算法計(jì)算,使用計(jì)算后的散列來代替原始數(shù)據(jù)。 | 通用 | 動(dòng)態(tài)脫敏、靜態(tài)脫敏 |
| 加密 | 通過加密密鑰和算法對(duì)原始數(shù)據(jù)進(jìn)行加密,從而使敏感數(shù)據(jù)變成不可讀的密文。 | 通用 | 靜態(tài)脫敏 |
| 格式保留算法(FPE) | 一種特殊的加密脫敏算法,對(duì)敏感數(shù)據(jù)進(jìn)行加密脫敏,密文與原始數(shù)據(jù)保持格式一致。 | 通用 | 靜態(tài)脫敏 |
| 常量替換 | 使用常量偽裝數(shù)據(jù)對(duì)原始數(shù)據(jù)進(jìn)行替換(偽裝數(shù)據(jù)生成與原始數(shù)據(jù)值無關(guān))。 | 通用 | 動(dòng)態(tài)脫敏、靜態(tài)脫敏 |
| 隨機(jī)替換 | 保持?jǐn)?shù)據(jù)格式,按照特定原始數(shù)據(jù)的編碼規(guī)則重新生成一份新的數(shù)據(jù)。 | 通用 | 動(dòng)態(tài)脫敏、靜態(tài)脫敏 |
| 截?cái)?/td> | 截?cái)鄡?nèi)容 | 通用 | 動(dòng)態(tài)脫敏、靜態(tài)脫敏 |
| 標(biāo)簽化 | 按照預(yù)定類別進(jìn)行分類,將使用類別標(biāo)簽替換原始敏感數(shù)據(jù)。 | 通用 | 動(dòng)態(tài)脫敏、靜態(tài)脫敏 |
| 泛化 | 用更一般的值取代原始數(shù)據(jù),降低敏感數(shù)據(jù)精確度,達(dá)到無法識(shí)別個(gè)體的目的。 | 通用 | 動(dòng)態(tài)脫敏、靜態(tài)脫敏 |
| 匿名 | 通過對(duì)數(shù)據(jù)內(nèi)容的處理,保證在數(shù)據(jù)表發(fā)布時(shí),數(shù)據(jù)中存在一定量的準(zhǔn)標(biāo)識(shí)符上不可區(qū)分的記錄。 | 通用 | 靜態(tài)脫敏 |
| 差分隱私 | 在原數(shù)據(jù)中加入噪音信息,使得滿足差分隱私的數(shù)據(jù)集能夠抵抗任何對(duì)隱私數(shù)據(jù)的分析。 | 數(shù)據(jù)集 | 數(shù)據(jù)脫敏 |
| 浮動(dòng) | 通過浮動(dòng)脫敏算法,上浮、下降5%。 | 數(shù)據(jù)集 | 靜態(tài)脫敏 |
| 歸零 | 通過歸零算法對(duì)原數(shù)據(jù)381.38進(jìn)行脫敏。 | 數(shù)據(jù)集 | 靜態(tài)脫敏 |
| 均化 | 通過均化算法進(jìn)行脫敏。 | 數(shù)據(jù)集 | 靜態(tài)脫敏 |
| 分檔 | 將數(shù)據(jù)按照規(guī)模分為高、中、低三檔,分別進(jìn)行脫敏。 | 數(shù)據(jù)集 | 靜態(tài)脫敏 |
| 掩碼 | 對(duì)原始數(shù)據(jù)的部分內(nèi)容用通用字符進(jìn)行統(tǒng)一替換,從而使敏感數(shù)據(jù)僅保持部分內(nèi)容公開。 | 字符串 | 動(dòng)態(tài)脫敏、靜態(tài)脫敏 |
06
數(shù)據(jù)脫敏常用算法與實(shí)例
| 算法名稱 | 算法說明 | 示例 | 使用場(chǎng)景(僅做參考) |
| 固定映射 | 通過設(shè)置映射種子,在映射種子不變的情況下,相同原數(shù)據(jù)脫敏后結(jié)果相同,并保留原始業(yè)務(wù)特征 |
映射種子:111 原數(shù)據(jù):張三 一次脫敏結(jié)果:李四 二次脫敏結(jié)果:李四 |
中文姓名、身份證、電話、銀行卡、電子郵箱、地址、IP地址 日期、通用字符串、鍵、貨幣金額 醫(yī)療機(jī)構(gòu)登記號(hào)、醫(yī)師資格證書、醫(yī)師執(zhí)業(yè)證書 營業(yè)執(zhí)照、社會(huì)統(tǒng)一信用代碼、組織機(jī)構(gòu)代碼、稅務(wù)登記證、開戶許可證 護(hù)照、軍官證、中國護(hù)照、港澳通行證、永久居住證、臺(tái)灣同胞大陸通行證 證券名稱、證券代碼、基金名稱、基金代碼 |
| 隨機(jī)映射 | 對(duì)數(shù)值、字符或字符串進(jìn)行隨機(jī),并保留原業(yè)務(wù)特征 |
原數(shù)據(jù):19841222 脫敏結(jié)果:19900211 |
中文姓名、身份證、電話、銀行卡、電子郵箱、地址、郵政編碼、IP地址 CCV碼 貨幣金額、通用字符串、字符串 醫(yī)療機(jī)構(gòu)登記號(hào)、醫(yī)師資格證書、醫(yī)師執(zhí)業(yè)證書 營業(yè)執(zhí)照、社會(huì)統(tǒng)一信用代碼、稅務(wù)登記證、開戶許可證、組織機(jī)構(gòu)代碼、組織機(jī)構(gòu)名稱 護(hù)照、軍官證、中國護(hù)照、港澳通行證、永久居住證、臺(tái)灣同胞大陸通行證 證券名稱、證券代碼、基金名稱、基金代碼 |
| 遮蓋 | 通過設(shè)置遮蓋符,對(duì)原數(shù)據(jù)全部或部分進(jìn)行遮蓋處理 |
遮蓋符:* 原數(shù)據(jù):13512345678 脫敏結(jié)果:135****5678 |
中文姓名、身份證、電話、銀行卡、電子郵箱、地址、CCV碼、IP地址 組織機(jī)構(gòu)代碼、組織機(jī)構(gòu)名稱、營業(yè)執(zhí)照、社會(huì)統(tǒng)一信用代碼 醫(yī)療機(jī)構(gòu)登記號(hào)、醫(yī)師資格證書、醫(yī)師執(zhí)業(yè)證書 護(hù)照、稅務(wù)登記證、開戶許可證、軍官證、中國護(hù)照、港澳通行證、永久居住證、臺(tái)灣同胞大陸通行證 證券名稱、證券代碼、基金名稱、基金代碼 |
|
范圍內(nèi)隨機(jī) (泛化脫敏) |
對(duì)日期或金額,在一個(gè)指定的范圍內(nèi)進(jìn)行隨機(jī),并保留原業(yè)務(wù)特征 |
范圍1000至9999 原數(shù)據(jù):38472.00 脫敏結(jié)果:8394.00 |
日期 貨幣金額 通用數(shù)值 |
| 保留隨機(jī) | 選中分段保留,其他分段隨機(jī) |
原數(shù)據(jù):2020年10月10日 脫敏算法:【1900-2018】年、【01-12】月、【01-30】日 |
日期 |
| 浮動(dòng) | 對(duì)日期或金額,上浮或下降固定值或百分比,并保留原業(yè)務(wù)特征 |
上浮、下降5% 原數(shù)據(jù):1000.00 脫敏結(jié)果:1049.00 |
日期 |
| 歸零 | 對(duì)于數(shù)值,清空并置為0.00 |
原數(shù)據(jù):381.38 脫敏結(jié)果:0.00 |
通用數(shù)值 |
| 截取 | 對(duì)字符串按照起始位置進(jìn)行截取 |
開始位置:2,結(jié)束位置6 原數(shù)據(jù):abcdefghijk 脫敏結(jié)果:bcdef |
通用字符串 |
| 截?cái)?/td> | 對(duì)字符串保留除起始位置意外的內(nèi)容 |
開始位置:2,結(jié)束位置6 原數(shù)據(jù):abcdefghijk 脫敏結(jié)果:aghijk |
通用字符串 |
| 數(shù)字截?cái)?/td> | 將數(shù)字截?cái)啵槐A糁付ㄎ粩?shù) | 如12345678,保留“3位”,則為678。 | 通用數(shù)值 |
| 加密 | 通過不同的加密算法進(jìn)行加密,脫敏后顯示的數(shù)據(jù)為密文數(shù)據(jù) | SHA1加密、MD5加密、SHA256加密、AES對(duì)稱加密、RSA非對(duì)稱加密、SMS4加密等 |
中文姓名、身份證、電話、銀行卡、電子郵箱、地址、IP地址 郵政編碼(SHA1加密、MD5加密) 營業(yè)執(zhí)照、社會(huì)統(tǒng)一信用代碼、組織機(jī)構(gòu)代碼、稅務(wù)登記證、開戶許可證 醫(yī)療機(jī)構(gòu)登記號(hào)、醫(yī)師資格證書、醫(yī)師執(zhí)業(yè)證書 護(hù)照、稅務(wù)登記證、開戶許可證、軍官證、中國護(hù)照、港澳通行證、永久居住證、臺(tái)灣同胞大陸通行證 證券名稱、證券代碼、基金名稱、基金代碼 |
| 替換 | 將數(shù)據(jù)替換為一個(gè)常量,常用作不需要改敏感字段時(shí) |
原值:566 原值:789 脫敏后: 566 - 0 789 - 0 |
通用字符串 |
| 匹配替換 | 通過EXCL表格導(dǎo)入替換規(guī)則,完成匹配替換 |
1111替換為2222 3333替換為4444 |
通用字符串 |
| 水印 | 通過數(shù)字水印打上水印標(biāo)簽 | 偽行、偽列或者不可見字符 | 日期 |
| 偏移 | 小數(shù)點(diǎn)往左或往右進(jìn)行偏移 | 如設(shè)定偏移量【2】,則脫敏結(jié)果可能為【28.00】 |
貨幣金額 通用數(shù)值 |
| 取整 | 對(duì)數(shù)字位數(shù)進(jìn)行取整 |
如取整位數(shù)為2,則1988.65脫敏后為1900 如12345678,整數(shù)“3位”,則為12345000 |
貨幣金額 通用數(shù)值 |
| 分段 | 主要針對(duì)數(shù)字進(jìn)行脫敏,可以將同一范圍的數(shù)值脫敏為相同的數(shù)值 |
如1~99的數(shù)值,統(tǒng)一脫敏未1 100~199的數(shù)值,統(tǒng)一脫敏為2 200~299的數(shù)值,統(tǒng)一脫敏為3 |
貨幣金額 |
其它脫敏算法:
| 算法名稱 | 算法說明 | 示例 | 使用場(chǎng)景(僅做參考) |
| 均值脫敏 | 我們先計(jì)算它們的均值,然后使脫敏后的值在均值附近隨機(jī)分布,從而保持?jǐn)?shù)據(jù)的總和不變。 |
如學(xué)科總分500分 脫敏后各科學(xué)分相加還是為500分。 |
貨幣金額 |
| 哈希 | 將數(shù)據(jù)映射為一個(gè)hash值 |
Jim,Greenà456393 34453 |
用作將不定長的數(shù)據(jù)映射為定場(chǎng)的hash值。 |
07
數(shù)據(jù)脫敏策略
在設(shè)定具體場(chǎng)景下數(shù)據(jù)脫敏策略時(shí)應(yīng)充分考慮數(shù)據(jù)脫敏后數(shù)據(jù)自身可用性及數(shù)據(jù)保密性尋求兩者間的平衡。數(shù)據(jù)脫敏策略的選擇如下顯示。數(shù)據(jù)脫敏的目標(biāo)包括:
▼避免攻擊者識(shí)別出原始個(gè)人信息主體;
▼控制重標(biāo)識(shí)的風(fēng)險(xiǎn),確保重標(biāo)識(shí)風(fēng)險(xiǎn)不會(huì)增加;
▼在控制重標(biāo)識(shí)風(fēng)險(xiǎn)的前提下,確保脫敏后的數(shù)據(jù)集盡量滿足其預(yù)期目的;
▼選擇合適的數(shù)據(jù)處理方式保證信息攻擊成本不足以支撐攻擊動(dòng)機(jī)。

08
數(shù)據(jù)脫敏實(shí)施流程:
1、敏感數(shù)據(jù)識(shí)別,對(duì)生產(chǎn)系統(tǒng)中敏感數(shù)據(jù)的識(shí)別,主要包括:
▼存儲(chǔ)位置:明確敏感數(shù)據(jù)所在的數(shù)據(jù)庫、表、字段(列);
▼數(shù)據(jù)分類、分級(jí):明確敏感數(shù)據(jù)所屬類別及敏感級(jí)別。
2、策略選擇、算法配置,脫敏算法配置主要包括:數(shù)據(jù)脫敏后保持原始特征的分析、數(shù)據(jù)脫敏算法的選擇和數(shù)據(jù)脫敏算法參數(shù)配置。
▼保持原始數(shù)據(jù)的格式、類型;
▼保持原有數(shù)據(jù)之間的依存關(guān)系;
▼保持引用完整性、統(tǒng)計(jì)特性、頻率分布、唯一性、穩(wěn)定性。配置需要脫敏的目標(biāo)(數(shù)據(jù)庫名/表名/字段名)以及適當(dāng)?shù)拿撁羲惴▍?shù),根據(jù)業(yè)務(wù)需求完成其他算法的參數(shù)配置。
3、數(shù)據(jù)脫敏任務(wù)執(zhí)行階段,按照不同需求選擇,動(dòng)態(tài)脫敏處理步驟和靜態(tài)脫敏處理步驟:
動(dòng)態(tài)脫敏處理步驟:
▼協(xié)議解析:解析用戶、應(yīng)用訪問大數(shù)據(jù)組件網(wǎng)絡(luò)流量;
▼語法解析:對(duì)訪問大數(shù)據(jù)組件的語句進(jìn)行語法分析;
脫敏規(guī)則匹配:根據(jù)用戶身份信息及要訪問的數(shù)據(jù);
▼下發(fā)脫敏任務(wù):由脫敏引擎調(diào)度脫敏任務(wù);
脫敏結(jié)果輸出:將脫敏后的數(shù)據(jù)輸出,保證原始數(shù)據(jù)的不可見。
靜態(tài)脫敏處理步驟:
▼數(shù)據(jù)選擇/策略配置:選擇待脫敏的數(shù)據(jù)庫及表,配置脫敏策略及脫敏算法,生成脫敏任務(wù);
▼執(zhí)行脫敏處理:對(duì)不同類型數(shù)據(jù)進(jìn)行處理,將數(shù)據(jù)中的敏感信息進(jìn)行刪除或隱藏;
▼將脫敏后的數(shù)據(jù)按用戶需求,裝載至不同環(huán)境中,包括文件至文件,文件至數(shù)據(jù)庫,數(shù)據(jù)庫至數(shù)據(jù)庫,數(shù)據(jù)庫至文件等多種裝載方式。
審核編輯:劉清
-
SQL
+關(guān)注
關(guān)注
1文章
789瀏覽量
46154 -
Mac
+關(guān)注
關(guān)注
0文章
1124瀏覽量
54642 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8532瀏覽量
136018
原文標(biāo)題:深度分析 | 萬字詳解數(shù)據(jù)安全關(guān)鍵技術(shù)之?dāng)?shù)據(jù)脫敏
文章出處:【微信號(hào):談思實(shí)驗(yàn)室,微信公眾號(hào):談思實(shí)驗(yàn)室】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
SAP 數(shù)據(jù)脫敏工具:SNP TDO如何滿足新頒敏感信息政策要求
半導(dǎo)體硅片生產(chǎn)過程中的常用摻雜技術(shù)
一觸即達(dá):CCLink IE遇見Modbus RTU,解鎖智能電表“數(shù)據(jù)超車道”
航空復(fù)雜曲面工件泓川科技激光位移測(cè)量機(jī)器人自動(dòng)定位打磨系統(tǒng)實(shí)施過程解析
解鎖未來汽車電子技術(shù):軟件定義車輛與區(qū)域架構(gòu)深度解析
住宅IP動(dòng)態(tài)化技術(shù)應(yīng)用解析:對(duì)比數(shù)據(jù)中心IP的三大核心優(yōu)勢(shì)
ProfibusDP轉(zhuǎn)Profinet網(wǎng)關(guān)的技術(shù)深度解析

數(shù)據(jù)脫敏技術(shù)定義及實(shí)施過程解析
評(píng)論