唉!微軟刪除了客戶數(shù)據(jù)庫(kù):5 分鐘的交易數(shù)據(jù)消失得無影無蹤
1月29日的AZURE故障帶來了一些意料之外的受害者:一些倒霉的客戶發(fā)現(xiàn)數(shù)據(jù)庫(kù)被意外刪除,AZURE SQL陷入刪除門。
據(jù)IT外媒THE REGISTER看到微軟發(fā)給用戶的消息顯示,這個(gè)問題困擾著許多使用自定義KEYVAULT密鑰用于透明數(shù)據(jù)加密(TDE)的AZURE SQL數(shù)據(jù)庫(kù)。在昨天AZURE門戶網(wǎng)站搖搖欲墜期間,一些內(nèi)部代碼意外刪除了這些數(shù)據(jù)庫(kù),迫使MICROSOFT利用5分鐘前的快照恢復(fù)客戶數(shù)據(jù)。
這就意味著,這5分鐘期間的交易事務(wù)、產(chǎn)品訂單以及對(duì)數(shù)據(jù)存儲(chǔ)系統(tǒng)的其他更新統(tǒng)統(tǒng)丟失。這讓客戶大為惱火。
該消息解釋,這次烏龍事件是在微軟稱為網(wǎng)絡(luò)基礎(chǔ)設(shè)施事件的過程中自動(dòng)發(fā)生的:CENTURYLINK的DNS故障實(shí)際上導(dǎo)致一半的MICROSOFT 365客戶無法正常使用云帳戶,這一故障始于10:45 UTC。
“我們正在從數(shù)據(jù)庫(kù)被刪除前不到5分鐘的恢復(fù)時(shí)間點(diǎn)來恢復(fù)這些SQL數(shù)據(jù)庫(kù)的副本。這些恢復(fù)的數(shù)據(jù)庫(kù)......與原始數(shù)據(jù)庫(kù)放在同一臺(tái)服務(wù)器上。”
真要命。WINDOWS巨頭現(xiàn)表示,如果你知道在這5分鐘的期間中可能有影響業(yè)務(wù)流程的任何重要交易事務(wù),那么可以隨時(shí)提交支持工單。備忘錄的更多內(nèi)容如下:
我們要求每個(gè)數(shù)據(jù)庫(kù)的客戶確定在這5分鐘的時(shí)間內(nèi)丟失的交易事務(wù)有沒有影響業(yè)務(wù)流程或數(shù)據(jù)庫(kù)之外的應(yīng)用程序。如果確有影響,我們要求您提交支持工單。如果恢復(fù)的數(shù)據(jù)庫(kù)合適,可以將數(shù)據(jù)庫(kù)重命名為原始名稱,繼續(xù)使用。
你也知道這是個(gè)嚴(yán)重的錯(cuò)誤,因?yàn)槲④洷硎久赓M(fèi)提供數(shù)月的數(shù)據(jù)庫(kù)服務(wù),作為補(bǔ)償:
我們對(duì)于給您服務(wù)帶來的影響深表歉意。所有恢復(fù)的數(shù)據(jù)庫(kù)將免除2個(gè)月的AZURE使用費(fèi),所有原始數(shù)據(jù)庫(kù)將免除3個(gè)月的使用費(fèi)。我們不斷采取措施以改進(jìn)微軟AZURE平臺(tái)和我們的流程,幫助確保將來不會(huì)發(fā)生此類事件。
用戶們紛紛跑到社交媒體上吐槽這次云失誤......
我花了一整天的時(shí)間來搞清楚為什么我們的AZURE SQL數(shù)據(jù)庫(kù)被刪除,創(chuàng)建了一個(gè)新的AZURE SQL數(shù)據(jù)庫(kù),隨機(jī)名稱附加到被刪除的數(shù)據(jù)庫(kù)名稱后面,
只收到AZURE支持團(tuán)隊(duì)的消息“一個(gè)自動(dòng)化過程旨在從KEYVAULT刪除自定義密鑰時(shí)觸發(fā),網(wǎng)絡(luò)故障期間無意中導(dǎo)致這些TDE數(shù)據(jù)庫(kù)被刪除?!蹦銈儽驹撛趲仔r(shí)前發(fā)送此消息:(
昨晚21:23左右,我們的一些AZURE SQL數(shù)據(jù)庫(kù)被刪除,但不是我們刪除的。數(shù)據(jù)庫(kù)已恢復(fù)但里面空空如也,我們沒有進(jìn)行恢復(fù)嗎?
我從別人那里聽說他們也有同樣的問題,但數(shù)據(jù)庫(kù)并沒有恢復(fù)。
據(jù)微軟聲稱,透明數(shù)據(jù)加密(TDE)旨在保護(hù)AZURE SQL數(shù)據(jù)庫(kù)免受這家科技巨頭所謂的“惡意活動(dòng)威脅”。很顯然,它防范不了在故障期間惡意腳本為非作歹的威脅。
自帶密鑰(BYOK)支持這項(xiàng)功能讓用戶可以使用名為TDE PROTECTOR的非對(duì)稱密鑰來加密數(shù)據(jù)庫(kù)加密密鑰(DEK),旨在進(jìn)一步讓用戶放心。然后,TDE存儲(chǔ)在AZURE密鑰保險(xiǎn)柜(AZURE KEY VAULT)中。
在微軟關(guān)于使用TDE和BYOK的指南中,這家公司在竭力解釋“如果TDE加密的SQL數(shù)據(jù)庫(kù)因無法繞過防火墻而訪問不了密鑰保險(xiǎn)柜,數(shù)據(jù)庫(kù)將在24小時(shí)內(nèi)被刪除?!?/p>
發(fā)言人稱:“數(shù)量有限的一群客戶無法使用資源,我們?cè)谂謴?fù)、讓客戶可以正常使用資源。我們已經(jīng)為大多數(shù)這些客戶重新建立了全面訪問機(jī)制。”