智能電網中數(shù)據(jù)的可搜索加密機制

2012年7月的印度大停電,是歷史上最大的動力中斷,造成約6.7億人受災。調查顯示,導致事故的直接原因是高峰時段的電量供不應求。統(tǒng)計顯示,近十幾年影響超過百萬人小時的大規(guī)模停電,絕大部分的故障都是由于電量供需不均衡和缺乏有效的實時診斷措施而引起的,為了提高電網的可靠性和安全性,包括美國、中國和英國在內的很多國家都已經開始更新電力設施,并開始實施智能電網技術。眾所周知,智能電網是涉及億萬居民日常生活和社會安定的重要電力網絡。在該網絡中,居民的隱私保護是智能電網發(fā)展和普及應用的關鍵因素之一。

本文綜合分析了目前智能電網中居民隱私保護的數(shù)據(jù)加密和查詢機制的研究成果,提出了兩種集數(shù)據(jù)加密和查詢于一體的可搜索加密方案的設計思路,用以提高廣大居民的用電安全性。

一、智能電網中隱私保護問題

智能電網最大的特色在于它的雙向通信能力,它能夠通過智能電表遠程采集用戶細粒度的能量消費數(shù)據(jù),使電網運營商能有效地管理電量的需求和供應,通過提供合理的實時電價等措施轉移用電高峰,達到“銷峰填谷”和負載平衡的作用,從而極大地提高了電網的可靠性和安全性。

為了獲得實現(xiàn)負載均衡所需的實時電量消費和供應數(shù)據(jù),每戶家庭必須安裝智能電表,每個發(fā)電廠也必須進行實時監(jiān)控。但是德國與荷蘭的研究者們通過研究發(fā)現(xiàn):這些用戶相關的細粒度消費數(shù)據(jù)在一定程度上泄露了居民的電量消耗模式。這些涉及居民隱私信息的泄露將會導致入室盜竊等犯罪行為的發(fā)生,因而智能電表被人們誤認為是“家庭監(jiān)視器”。德國居民拒絕在自己家里安裝智能電表,基于用戶隱私和人權的考慮,2009年,荷蘭議會也拒絕了強制性部署智能電表的提案。由此可見,智能電表測量數(shù)據(jù)中居民的隱私保護問題成為制約智能電網發(fā)展和普及的一個主要“瓶頸”。

為保護居民的隱私,當前的研究主要集中在測量數(shù)據(jù)的加密和數(shù)據(jù)聚合方面,極少關注到智能電網中加密數(shù)據(jù)的查詢,但在密碼學和數(shù)據(jù)庫領域的一些密文查詢的成果值得借鑒和改進。

二、測量數(shù)據(jù)加密與數(shù)據(jù)聚合

2010年,EFTHYMIOU C等人認為,在智能電網中,居民端的測量數(shù)據(jù)通常有兩種類型,即低頻率傳輸?shù)臄?shù)據(jù)和尚頻率傳輸?shù)臄?shù)據(jù)。低頻率傳輸?shù)臄?shù)據(jù)包含一個周期性的用電總數(shù),足夠粗略,不會泄漏隱私,它可能被直接發(fā)送到控制中心用于電網的實時監(jiān)控決策與優(yōu)化,它關系到居民的隱私,必須進行保護,因此,根據(jù)這一分類,應為每個智能電表分配兩個身份標識:一個用于低頻數(shù)據(jù)傳輸(LFID);另一個用于高頻數(shù)據(jù)傳輸(HFID)。前者是一個匿名的身份,在電網中是公開的。隱私保護的目的是能夠隱藏高頻測量數(shù)據(jù)與智能電表的真實身份HFIDs之間的聯(lián)系。只有一個可信的第三方(稱為托管),它能知道一對有效的真假身份(HFID,LFID)之間的對應關系,并為每個智能電表分配兩組公/私密鑰對,分別對應智能電表的真假身份。

由于端到端的加密可以保護隱私,每一個智能電表接人智能電網時都需要注冊。只有注冊電表的測量數(shù)據(jù)才會被接受,由于高頻數(shù)據(jù)和低頻數(shù)據(jù)的傳輸使用的是不同的ID,高頻數(shù)據(jù)不直接發(fā)給控制中心而由托管方進行轉發(fā),因此電網不會知道HFID的真實身份。

LIX等人認為測量數(shù)據(jù)本身是比較小的,但每一次當數(shù)據(jù)被公鑰加密后,其密文的大小都會增加。當這樣的信息被多個轉發(fā)設備加密后,通信帶寬和傳輸延遲也會隨之增加,事實上,在一個局部網絡中智能電表的測量數(shù)據(jù)往往會通過本地的網關進行轉發(fā),大部分文獻都認為網關服務器可以對收到的加密數(shù)據(jù)進行聚合,得到一個聚合結果(如數(shù)據(jù)總和)后再以緊湊的形式轉發(fā)給控制中心。這樣可以提高加密后測量數(shù)據(jù)的傳輸效率,同時由于每個測量數(shù)據(jù)是用智能電表與控制中心共享的密鑰進行加密的,網關無法得知測量數(shù)據(jù)的具體內容,因此數(shù)據(jù)隱私也得到了保護。

同態(tài)加密是一種數(shù)據(jù)聚合形式,它允許人們對密文進行特定的代數(shù)運算后得到的仍然是加密的結果,與對明文進行同樣的運算再將結果加密一樣。換言之,這項技術可以在加密的數(shù)據(jù)中進行渚如求和/差、比較等操作,得出正確的結果,而在整個處理過程中無需對數(shù)據(jù)進行解密。

目前,大多數(shù)基于同態(tài)加密的數(shù)據(jù)聚合方案只考慮了一維數(shù)據(jù),即低頻傳輸數(shù)據(jù)的聚合,在智能電網中高頻傳輸?shù)臏y量數(shù)據(jù)通常是多維的,如消耗的數(shù)量,為什么目的消費等。當多個維度的數(shù)據(jù)存在時,現(xiàn)有的方案不得不單獨地對每一個維度進行處理。這樣又進一步增加了智能電表和控制中心的處理負擔,相應的處理和通信時間也會增加.基于同態(tài)加密系統(tǒng)Paillier,LU R等人提出了一個新穎而高效的隱私保護聚合(EPPA)方案,該方案能將所有維度的數(shù)據(jù)作為一個整體進行加密,從而節(jié)省了計算開銷和通信開銷,減少了數(shù)據(jù)延遲,提高了實時響應能力。但其數(shù)據(jù)聚合使用的是相同的密鑰,其隱私保護能力不強,且沒有考慮聚合后加密數(shù)據(jù)的查詢等問題,使得加密后數(shù)據(jù)的可用性不高。

三、加密數(shù)據(jù)的查詢

國內外對于加密數(shù)據(jù)的查詢問題研究按照數(shù)據(jù)的所有者分為3類,即:公共數(shù)據(jù);用戶自己擁有的數(shù)據(jù);第三方擁有的數(shù)據(jù)。

(1)公共數(shù)據(jù) 指對所有用戶公開的數(shù)據(jù),用戶想要查詢某一數(shù)據(jù)項但并不想、止數(shù)據(jù)庫知道自己查詢的是什么。針對該問題,最簡單的解決方法就是采用公共信息檢索協(xié)議。該協(xié)議允許用戶以很小的通信代價完成秘密查詢,用戶可以下載整個數(shù)據(jù)庫,然后查詢自己想要的數(shù)據(jù)項,而后面的很多研究成果大多是基于該方法的變形。

(2)用戶自己擁有的數(shù)據(jù)一個用戶想要上傳自己的隱私數(shù)據(jù)到一個遠程服務器,并希望對遠程服務器保持自己數(shù)據(jù)的私密性,用戶以后能從服務器中查詢到包括某一關鍵詞的所有文檔,2000年,可搜索的對稱加密方案被研究者提出,該方案幾乎不需要用戶與服務器之間的通信,僅需要一次的交互,且對于每一個查詢數(shù)據(jù)庫所執(zhí)行的操作都是線性時間的解決方案則需要多項式次交互(依賴于數(shù)據(jù)庫的大小),即對于每次查詢數(shù)據(jù)庫需要多項式時間的操作。這些研究成果僅適用于用戶將自己的數(shù)據(jù)加密后存儲到一個不可信的遠程服務器并能在日后進行秘密查詢的情況。

(3)第三方擁有的密文數(shù)據(jù)2004年,BONEH D等人提出了一種帶關鍵詞搜索的公鑰加密方案(PEKS)。該方案基于雙線性映射,在用戶發(fā)送郵件時需要對該郵件所有關鍵詞進行加密,每次加密都要用到對運算.在服務器上查詢時,查詢關鍵詞需要被轉化為關鍵詞限門以后發(fā)送給服務器進行密文查詢,隨后,BAEKJ等人在改進的雙線性映射方案基礎上,提出了一種支的關鍵詞搜索方案,提高了服務器搜索的效率,并且該方案在限門的傳輸過程中增加了時戳,有效地防止了重放攻擊。但這些方案大多數(shù)都不能同時支持數(shù)據(jù)加密和查詢,使得其應用具有局限性。LIUQ等人提出了一個云計算中能隱私保護的關鍵詞搜索(EPPKS)方案。它整合了數(shù)據(jù)加密和關鍵詞搜索等功能,但只能支持一維數(shù)據(jù)的加密和查詢,當需要對具有多維特性的數(shù)據(jù)進行加密和查詢時,其通信和計算開銷會很大。

此外,在數(shù)據(jù)庫應用中還有一些基于保序加密、分桶方式和特殊樹結構的密文區(qū)間查詢方法。但這些方法的安全性不高,從而使得隱私保護的效果不佳。最近,蔡克等人提出了采用單斷言實現(xiàn)敏感數(shù)據(jù)的區(qū)間判斷、同時使用可逆矩陣對區(qū)間索引和區(qū)間限門進行安全保護的方法,不僅減少了整個方案的信息泄露,而且保證了區(qū)間索引和區(qū)間限門的安全,但在多維數(shù)據(jù)查詢等方面的效果還不是很理想,還需要繼續(xù)完善和提高。

四、可搜索公鑰加密方案的設計

將電表測量的居民數(shù)據(jù)以加密的形式存儲和發(fā)送是保護數(shù)據(jù)隱私的一種較為有效的手段,當數(shù)據(jù)被加密傳送到控制中心后,為保證數(shù)據(jù)的機密性,控制中心會以密文的方式存儲。但除控制中心以外的第三方數(shù)據(jù)查詢者,如市場決策者、營銷分析師、研究和開發(fā)的專業(yè)人員等,通常會通過用戶類型、地址區(qū)域或日期等條件,進行組合后查詢這些加密的多維測量數(shù)據(jù),從而挖掘出有利于市場決策的信息。這時,如何通過多重關鍵詞組合查詢加密后的多維數(shù)據(jù)就具有非常重要的意義。將公鑰加密與關鍵詞搜索融合,從整個(采集一傳輸—使用”)流程對數(shù)據(jù)進行隱私保護,以及對數(shù)據(jù)可用性進行優(yōu)化設計,可以使加密和查詢集中在同一套可搜索加密方案中。

本文基于帶關鍵詞的公鑰加密和隱向量加密兩種方式,提出可搜索加密方案的設計思路,在對數(shù)據(jù)加密的同時對其可搜索屬性進行隱藏。帶關鍵詞的公鑰加密是指為數(shù)據(jù)的可搜索屬性選擇一些特征關鍵詞作為代表,然后將這些特征關鍵詞以加密的形式轉換為關鍵詞標簽,附著在每一個密文的后面。當查詢者的查詢條件達到后,其中的詢問關鍵詞會被加密為關鍵詞限門??刂浦行目梢栽诓唤饷苊芪牡那闆r下驗證哪些密文的關鍵詞標簽與查詢者的關鍵詞限門匹配,然后將滿足條件的密文發(fā)送給查詢者,查詢者可以用被授權的密鑰對密文進行解密。而隱向量加密是將可搜索的屬性值映射為一組加密向量,基于這組向量,多維數(shù)據(jù)會被加密為一組密文,而查詢者的查詢條件也會被轉換為一組查詢向量并生成相應的查詢令牌,控制中心使用查詢令牌與各密文進行匹配驗證,如果驗證通過則數(shù)據(jù)會被解密并傳送給查詢者;否則,輸出錯誤,但隱向量加密會隨著屬性值域的擴大而增加,查詢的通信和計算開銷會較大。

1、基于帶關鍵詞的可搜索加密機制

帶關鍵詞搜索的公鑰加密方案是在加密的數(shù)據(jù)上添加可查詢標簽和進行不解密的匹配查詢的一種方法。在這一背景下,數(shù)據(jù)可以被分布式地存放在本地網關服務器上,作為一個數(shù)據(jù)倉庫便于后期使用,控制中心和其他的查詢者都可以對服務器上的密文進行查詢。帶關鍵詞搜索的公鑰加密框架(PEKS)如圖1所示。

智能電網中數(shù)據(jù)的可搜索加密機制

其工作流程主要分為以下兩個階段。

(1)當一個智能電表已用公鑰加密將其測量數(shù)據(jù)di加密為ci后,運行關鍵詞查詢算法PEKS()和接收者的公鑰生成一些關鍵詞的標簽信息ci',并將密文和標簽存儲在網關服務器上。

(2)查詢者通過一個函數(shù)ftrapdoor()來計算其查詢條件中的關鍵詞,得到一個限門T,將T發(fā)送到網關服務器。網關服務器將搜索其數(shù)據(jù)庫中密文的標簽ci并驗證其是否與查詢關鍵詞限門T匹配。若是,則將查到的密文C發(fā)送給查詢者,查詢者根據(jù)自己的私鑰可以解密數(shù)據(jù)。若否,則查詢下一條密文。

本方法用于多維加密數(shù)據(jù)查詢,如果該數(shù)據(jù)有k維是可查詢的,則首先需要為此多維數(shù)據(jù)選擇一個關鍵詞序列W=w1,w2,W3,…,Wk來代表這個數(shù)據(jù)在每一個可企詢屬性上的特征,然后將這組關鍵詞加密為關鍵詞標簽Ci,當有查詢條件達到時,也需要為其查詢的屬性選擇一些查詢關鍵詞,表示為序列W=w1,w2,W3,…,Wk,再將這個序列轉化為查詢限門T當然,查詢者也可以構造關鍵詞的子集進行查詢(即v≤k)?,F(xiàn)有的大部分關鍵詞查詢大多只注重于關鍵詞查詢算法PEKS()的構造端,而與數(shù)據(jù)的加密端是獨立的。帶關鍵詞的可搜索公鑰加密則使用同一套加密參數(shù)完成數(shù)據(jù)加密和關鍵詞查詢兩個步驟。

2、基于隱向量加密的可搜索加密機制

隱向量加密( HVE)的概念是由BONEH D等人提出的。它是一種謂詞加密,包含有兩個分別與密文和查詢令牌相關聯(lián)的屬性向量。在一定程度上,當且僅當這兩個向量的對應位相等時,密文和查詢令牌是相匹配的,數(shù)據(jù)就會被解密。在多維數(shù)據(jù)等值查詢的數(shù)據(jù)加密階段,發(fā)送者會選擇一個加密向量x=x1,X2,X3,…,xl,并根據(jù)此向量將測量數(shù)據(jù)加密為C后發(fā)送給網關服務器。當有查詢條件到達時,它會被程序轉化為查詢向量v =v1,v2,v3,…,vi.其中,vi=*表示查詢者不關心第f維是否相等。然后根據(jù)查詢向量產生查詢令牌并發(fā)送給網關服務器,網關服務器會將密文C與查詢令牌進行匹配,如果s(v)是所有yj≠宰的下標j的集合,則查詢渭詞可表示為:

智能電網中數(shù)據(jù)的可搜索加密機制

當pHVE(X)=1時,表示查詢向量與加密向量是匹配的,這樣數(shù)據(jù)會被恢復后發(fā)送給查詢者,基于隱向量加密的查詢流程如圖2所示。

智能電網中數(shù)據(jù)的可搜索加密機制

在執(zhí)行多維數(shù)據(jù)的比較查詢時,在數(shù)據(jù)加密階段,發(fā)送者也會根據(jù)可查詢屬性的值來選擇一個特征向量x=x1,X2,x3,…,xl,如果X1的值域是{1,2,3,…,n},則x會被映射為具有,l位代碼的向量:智能電網中數(shù)據(jù)的可搜索加密機制相應地,特征向量x也就被映射為加密向量:

智能電網中數(shù)據(jù)的可搜索加密機制

根據(jù)此加密向量u(x),測量數(shù)據(jù)被加密為C后發(fā)送給網關服務器.當有查詢條件到達時,查詢條件也會被轉化為一組向量v=v1,V2,V3,…,vl如果vi的值域為{1,2,3,…,n},則vi也會被映射為具有n位代碼的查詢向量:而v則被映射為:

然后,根據(jù)查詢向量σ(v)生成的查詢令牌也會被發(fā)送給網關服務器,如果s(σ(v))表示所有的σ(v)j*≠*的下標j ∈{1,2,3,…,nl}的集合,則比較謂詞可表示為:

因此,當pHVEσ(v)σ(x)=1時,表示查詢向量與加密向量是匹配的,這樣數(shù)據(jù)會被恢復后發(fā)送給查詢者。利用比較查詢以同樣的方式反方向構造,就可以構造出區(qū)間查詢的加密向量和查詢向量,從而使得隱向量加密可以用于加密數(shù)據(jù)區(qū)間查詢中。

小知識之智能電網

智能電網就是電網的智能化(智電電力),也被稱為“電網2.0”,它是建立在集成的、高速雙向通信網絡的基礎上,通過先進的傳感和測量技術、先進的設備技術、先進的控制方法以及先進的決策支持系統(tǒng)技術的應用,實現(xiàn)電網的可靠、安全、經濟、高效、環(huán)境友好和使用安全的目標,其主要特征包括自愈、激勵和包括用戶、抵御攻擊、提供滿足21世紀用戶需求的電能質量、容許各種不同發(fā)電形式的接入、啟動電力市場以及資產的優(yōu)化高效運行。