Microchip Technology Inc. 頻率與授時(shí)系統業(yè)務(wù)部 產(chǎn)品營(yíng)銷(xiāo)經(jīng)理 David Chandler ![]() 利用原子鐘授時(shí)現已成為數據中心不可或缺的組成部分。目前,通過(guò)全球定位系統(GPS)和其他全球導航衛星系統(GNSS)網(wǎng)絡(luò )傳輸的原子鐘時(shí)間已使全球各地的服務(wù)器實(shí)現了同步,并且部署在各個(gè)數據中心的原子鐘可在傳輸時(shí)間不可用時(shí)保持同步。 無(wú)論是由于系統需求還是合規性,這種出色的同步性能都至關(guān)重要,可確保每年在全球范圍內收集的數據(以澤字節為單位)能夠得到有效存儲并用于許多應用。原子的量子性質(zhì)可保持精確的時(shí)間,是確保未來(lái)能夠以更快的速度處理更多數據的關(guān)鍵所在,而具有諷刺意味的是,就在幾年前,原子的量子性質(zhì)還被視為提升數據處理能力和速度的最大阻礙。 1965年,Gordon Moore預測集成電路上的晶體管數量每年翻一番。這一數字最終被修改為每?jì)赡攴环。隨著(zhù)晶體管密度的增加,速度有了顯著(zhù)提升,成本和功耗也不斷下降。 在1965年,人們可能很難想象,2021年時(shí)在一個(gè)半導體上布置500億個(gè)晶體管是一種現實(shí)需求,但正如半導體技術(shù)隨著(zhù)時(shí)代不斷發(fā)展,應用需求也在不斷變化。手機、金融交易和DNA圖繪制等應用都非常依賴(lài)單片機每秒可執行的運算次數,而這一數字與芯片上的晶體管數量密切相關(guān)。 ![]() 圖1. 極具諷刺意味的圖片:工程師試圖遵循摩爾定律 摩爾定律的消亡 遺憾的是,由于物理學(xué)限制,摩爾定律正在迅速走向終結。隨著(zhù)晶圓生產(chǎn)工藝節點(diǎn)現已達到10納米以下,晶體管的大小僅為硅原子的10到50倍左右。在這個(gè)尺度上,原子和自由電子的大小以及量子特性顯著(zhù)阻礙了晶體管大小的進(jìn)一步縮減。從本質(zhì)上講,可以將原子視作推翻這一定律的最終原因。 盡管摩爾定律終將消亡,但是,對提高處理能力的需求卻不斷增加。隨著(zhù)物聯(lián)網(wǎng)(IoT)、信息流服務(wù)、社交媒體帖文和自動(dòng)駕駛汽車(chē)的出現,每天產(chǎn)生的數據量會(huì )繼續呈指數增長(cháng)。 據估計,2021年每天產(chǎn)生的數據量為2.5艾字節(2,882,303,761,517,120,000字節)。當前使用的艾字節數據庫每秒可處理超過(guò)10萬(wàn)個(gè)事務(wù)(一個(gè)事務(wù)包含許多次運算),而在可預見(jiàn)的將來(lái),數據庫的規模和每秒處理的事務(wù)數將持續增長(cháng)。 同步機器 數據量的這種爆炸式增長(cháng),再加上數據必須達到的寫(xiě)入、讀取、復制、分析、操作和備份速度,這些因素要求數據中心架構師找到一種能夠繞過(guò)摩爾定律終結的方法。對于采用分布式數據庫的數據中心,架構師采用了水平擴展方法,即將數據庫分布在一個(gè)集群中的多個(gè)服務(wù)器上,而不是整個(gè)數據庫駐留在一個(gè)服務(wù)器上。 在這種配置下,集群本質(zhì)上用作一臺巨型機器,因此系統的大小和速度現在受到數據中心的外形尺寸而非原子大小的限制(接招吧,原子。。 軟件工程師現在的職業(yè)是編寫(xiě)能夠實(shí)現水平擴展的代碼。但是,要使各種軟件都正常工作,所有機器都必須同步,否則會(huì )違反因果關(guān)系的概念。 什么是因果關(guān)系?舉個(gè)最簡(jiǎn)單的示例。假設您用兩臺攝像機來(lái)記錄100米短跑的圖像,每臺攝像機都有自己的內部時(shí)鐘。第一臺攝像機位于起跑器上。第二臺攝像機位于終點(diǎn)線(xiàn)上。兩個(gè)傳感器都在進(jìn)行連續拍攝,并用各自時(shí)鐘的時(shí)間給每個(gè)圖像添加時(shí)間戳。 要確定比賽中獲勝的短跑選手的正式成績(jì),將檢查第一臺攝像機的圖像以了解第一位選手離開(kāi)起跑器時(shí)的時(shí)間點(diǎn),然后用終點(diǎn)線(xiàn)上的攝像機圖像上該選手沖過(guò)終點(diǎn)線(xiàn)時(shí)的時(shí)間減去該時(shí)間戳。 要實(shí)現此目的,兩臺攝像機的同步精度必須都達到可接受的偏差水平。如果時(shí)鐘的同步精度只有±0.05秒,那么便無(wú)法確定成績(jì)?yōu)?.6秒的選手是否確實(shí)打破了9.58秒的世界紀錄。如果它們與體育場(chǎng)時(shí)鐘的同步精度只有±5秒怎么辦? 想象一下這樣的場(chǎng)景:從體育場(chǎng)的主時(shí)鐘觀(guān)察,一場(chǎng)比賽正好在下午12:00:00:00開(kāi)始。第一位選手在下午12:00:09:60時(shí)沖過(guò)終點(diǎn)線(xiàn)。從體育場(chǎng)主時(shí)鐘的角度來(lái)看,正式比賽成績(jì)是9.6秒。 但是,如果第一臺攝像機的時(shí)鐘正好快5秒,而第二臺攝像機的時(shí)鐘正好慢5秒呢?比賽將在下午12:00:05:00正式開(kāi)始,在下午12:00:04:60結束。比賽將在開(kāi)始前0.4秒正式結束,這會(huì )打破世界紀錄并推翻物理定律,目前的紀錄保持者很有可能會(huì )不公正地遭到所有贊助商的棄用。 ![]() 圖2. 時(shí)鐘偏差會(huì )導致因果關(guān)系問(wèn)題。在這種情況下,比賽在開(kāi)始前就正式結束了。 將因果關(guān)系應用于數據庫 同樣的因果關(guān)系原則在數據庫中也十分重要。事務(wù)記錄更新必須按照它們發(fā)生的順序出現在數據庫中。如果您期望在通過(guò)直接取款支付每月房貸之前直接存入自己的工資,而銀行的數據庫沒(méi)有按正確的順序記錄這些事務(wù),那么您可能會(huì )被收取透支費。在一臺機器上,因果關(guān)系錯誤很容易防止,但在多個(gè)服務(wù)器上,每個(gè)服務(wù)器都有自己的內部時(shí)鐘,服務(wù)器必須同步并為每個(gè)事務(wù)加上時(shí)間戳。 要實(shí)現此目的,必須有一個(gè)服務(wù)器充當參考時(shí)鐘,就像體育場(chǎng)的時(shí)鐘,它必須采用最大程度減小每個(gè)服務(wù)器時(shí)鐘的時(shí)間誤差的方式,將時(shí)間分配給每個(gè)服務(wù)器。每個(gè)時(shí)間戳的偏差(比賽中為±5秒)形成一個(gè)時(shí)間包絡(luò ),其長(cháng)度為時(shí)鐘偏差的兩倍(比賽中為10秒)。對于分布式數據庫,一秒內可以容納的非重疊時(shí)間包絡(luò )數量應當至少與系統預期的每秒事務(wù)數量大致相同。 概率、因果關(guān)系的關(guān)鍵性和實(shí)現成本最后都會(huì )在最終解決方案中發(fā)揮作用,但這種關(guān)系是一個(gè)很好的起點(diǎn)。時(shí)間戳偏差為±1毫秒的系統將具有2毫秒的時(shí)間包絡(luò ),一秒內最多可容納500個(gè)非重疊時(shí)間包絡(luò )。此系統可以支持每秒執行約500個(gè)事務(wù)。 NTP和PTP的不足 以太網(wǎng)授時(shí)技術(shù)也稱(chēng)為網(wǎng)絡(luò )時(shí)間協(xié)議(NTP)和精確時(shí)間協(xié)議(PTP),用于同步數據中心的分布式數據庫中的所有服務(wù)器。這些協(xié)議可以確保局域網(wǎng)能夠以亞毫秒(NTP)或亞微秒(PTP)的偏差來(lái)分配時(shí)間,從而支持每秒執行數千(NTP)或數百萬(wàn)(PTP)個(gè)事務(wù)。 遺憾的是,即使憑借這些解決方案可以繞過(guò)原子帶來(lái)的摩爾定律消亡,物理學(xué)仍以光速的形式在分布式數據庫的道路上設置了另一個(gè)障礙。 試想一下,一個(gè)使用PTP進(jìn)行準確同步的分布式數據庫在加州圣何塞運行,每秒可輕松執行100,000個(gè)事務(wù),且不會(huì )產(chǎn)生任何因果關(guān)系問(wèn)題。一位數據庫架構師正坐在自己位于紐約的辦公室里,他的老板要求他更新大量記錄。 這名架構師希望能夠充分利用其新數據庫并展示系統的能力。他計劃每秒執行100,000個(gè)事務(wù)。 為了根據請求更新記錄,他創(chuàng )建了一個(gè)簡(jiǎn)單的事務(wù),即僅當第一個(gè)記錄的值大于第二個(gè)記錄時(shí),才會(huì )將第一個(gè)記錄的值與第二個(gè)記錄相加。如要達到這一目的,他必須對這兩個(gè)記錄發(fā)出讀取請求。然后,他在紐約的本地機器對這些值進(jìn)行比較,然后在需要時(shí)向第二個(gè)記錄發(fā)送寫(xiě)命令。 完成此操作后,他想要接著(zhù)執行下一個(gè)事務(wù),即將第三個(gè)值與新的總和進(jìn)行比較。如果新的總和大于第三個(gè)記錄,那么將使用第三個(gè)記錄替換總和。他想對600萬(wàn)條記錄重復此操作。由于數據庫每秒能夠處理100,000個(gè)事務(wù),他認為此任務(wù)將在大約一分鐘內完成。他告訴老板,他將在五分鐘內更新記錄,然后離開(kāi)去喝杯咖啡。 喝咖啡的時(shí)候,他讀到一個(gè)故事,內容是新的百米短跑成績(jì)是負0.4秒,這違背了物理定律,并且之前的紀錄保持者因為失去了所有的代言費正在起訴體育場(chǎng)負責人。架構師自顧自地笑了起來(lái),認為體育場(chǎng)應該聘請他作為同步專(zhuān)家。 五分鐘后他回到辦公桌前,沮喪地發(fā)現他的數據庫更新只完成了不到1,500個(gè)事務(wù)。他難過(guò)地意識到自己的錯誤,并準備將自己的簡(jiǎn)歷發(fā)給那個(gè)體育場(chǎng),他希望他的PTP部署不會(huì )出現同樣的問(wèn)題。 問(wèn)題出在哪里?光速將紐約和圣何塞之間理論上最快的數據傳輸速度限制在13.7毫秒。 ![]() 圖3. 光速對兩點(diǎn)之間的數據傳輸速度施加了理論上的限制 距離問(wèn)題 遺憾的是,現實(shí)世界的事務(wù)處理速度甚至更慢。即使兩個(gè)地點(diǎn)之間有專(zhuān)用的光纖鏈路,光纖的折射率、光纖的實(shí)際路徑和其他系統問(wèn)題也會(huì )延長(cháng)傳輸時(shí)間。因此,僅僅從紐約傳輸一次,就需要40到50毫秒的時(shí)間才能到達圣何塞。 但是,此事務(wù)中有四個(gè)獨特的操作。有兩個(gè)可以同時(shí)發(fā)生的讀操作,隨后必須將它們發(fā)送回紐約。往返過(guò)程需要80到100毫秒。然后,在對兩個(gè)值進(jìn)行比較后,就會(huì )發(fā)出寫(xiě)操作,并且必須發(fā)回寫(xiě)確認以指示寫(xiě)操作已完成,然后才能開(kāi)始下一個(gè)事務(wù)。 突然之間,數據庫每秒能否執行100,000個(gè)事務(wù)已無(wú)關(guān)緊要,因為距離將系統每秒的處理能力限制為不超過(guò)5個(gè)事務(wù)。要完成600萬(wàn)個(gè)事務(wù),此系統需要13天的時(shí)間,這樣便有足夠的時(shí)間再喝幾杯咖啡,甚至更新一份簡(jiǎn)歷。這種延遲稱(chēng)為通信延遲。 規避延遲 但就像摩爾定律一樣,數據庫架構師想出了規避延遲的方法。在用戶(hù)附近創(chuàng )建數據庫副本,這樣他們便可隨意使用數據,而不必將信號發(fā)送到全國各地。 定期比較和協(xié)調復制以確保一致性。在協(xié)調過(guò)程中,事務(wù)時(shí)間戳用于確定事務(wù)的實(shí)際順序,并且當存在不可協(xié)調的差異時(shí)(例如事務(wù)時(shí)間包絡(luò )重疊時(shí)),有時(shí)會(huì )回滾記錄。減少時(shí)鐘偏差可以減少復制的實(shí)例中不可協(xié)調的差異數量,因為時(shí)間包絡(luò )增多會(huì )減少重疊的概率。這可提高效率并降低數據損壞概率。 但現在,時(shí)間戳不僅在每個(gè)數據中心內部必須做到精確,在不同的數據中心之間也必須精確,這些數據中心可能相隔數千英里,并通過(guò)云相互連接。由于需要一個(gè)偏差極低且在兩個(gè)地點(diǎn)均可隨時(shí)獲得的外部參考,因此這項任務(wù)變得愈加困難。 下至原子級別 此時(shí),數據庫架構師以前的敵人“原子”登場(chǎng)。當原子忙于廢除摩爾定律時(shí),其亞原子粒子卻在忙于自旋。原子核內的中子和質(zhì)子一直在旋轉,而與此同時(shí)電子則一邊忙于圍繞原子核公轉,一邊自旋。這類(lèi)似于地球在繞太陽(yáng)公轉的同時(shí)自轉。 電子可以圍繞自身的軸順時(shí)針或逆時(shí)針自旋?紤]到人體內約有7*10^27(7后面有27個(gè)零)個(gè)原子,所有亞原子粒子都在我們體內自旋,令人驚訝的是我們并沒(méi)有一直頭暈目眩。(注:亞原子粒子并不是真的在忙著(zhù)自旋和公轉,它們實(shí)際上是在忙著(zhù)給我們提供概率波函數和磁相互作用,這會(huì )讓我們獲得類(lèi)似于它們進(jìn)行自旋和公轉時(shí)的結果。但是,如果想到所有的自旋會(huì )讓您頭暈目眩,那么試圖理解量子物理學(xué)的現實(shí)肯定會(huì )更令人厭惡。) ![]() 圖4. 具有核和價(jià)電子的概念性原子,具有核自旋、電子自旋和軌道自旋 如果電子吸收特定精確頻率的微波輻射,繞電子軸的自旋方向會(huì )改變。如果地球上發(fā)生這種情況,太陽(yáng)會(huì )突然從東方落下,從西方升起! 原子鐘這種機器專(zhuān)門(mén)用于檢測電子自旋狀態(tài),然后通過(guò)微波輻射改變方向。頻率變化取決于元素、同位素和電子的激發(fā)態(tài)。 在機器確定頻率(即所謂的超精細躍遷頻率)后,便可將周期確定為頻率的倒數,這樣便可計算周期數來(lái)確定經(jīng)過(guò)的時(shí)間。國際上對秒的定義是誘導銫原子軌道外層內電子的超精細躍遷所需的9,192,631,770個(gè)輻射周期。 原子鐘是世界上最穩定的商用時(shí)鐘。一副紙牌大小的原子鐘稱(chēng)為芯片級原子鐘(CSAC),其24小時(shí)內的漂移為百萬(wàn)分之一秒,而冰箱大小的原子鐘稱(chēng)為氫微波激射器,其24小時(shí)內的漂移僅為十萬(wàn)億分之一秒。巧合的是,十萬(wàn)億分之一也大約是氫原子半徑與百米短跑選手和現已失業(yè)的紐約數據中心架構師身高的比值。 憑借這些原子鐘提供的精度,可以為在東京、倫敦、紐約、廷巴克圖或世界其他任何地方的數據中心運行的分布式數據庫提供大約50萬(wàn)到500億個(gè)非重疊時(shí)間包絡(luò )。 ![]() 圖5. 單位“秒”是通過(guò)計算銫超精細透射輻射頻率的9,192,631,770個(gè)周期來(lái)定義的 時(shí)間的分配 時(shí)間如何從這些原子鐘到達所有數據中心?協(xié)調世界時(shí)(UTC)是通過(guò)衛星、光纖網(wǎng)絡(luò )甚至互聯(lián)網(wǎng)分配的全球時(shí)間。UTC本身源自位于世界各地的國家實(shí)驗室和授時(shí)站的一系列高精度原子鐘。UTC的提供組織會(huì )收到一份報告,其中載明了源自這些時(shí)鐘的UTC時(shí)間以及它們各自與計算出的UTC的偏移量。然后,這些實(shí)驗室和其他設施將時(shí)間傳送到世界各地。 UTC報告每月公布一次,告訴這些國家實(shí)驗室他們在上一個(gè)月與UTC的微小時(shí)間偏移量。從技術(shù)上講,直到事發(fā)一個(gè)月后,我們才知道準確的時(shí)間偏差。更糟糕的是,由于地球自轉和我們與可觀(guān)測恒星的相對位置的變化,UTC會(huì )定期增加額外的秒數,即躍遷秒。雖然這可使地球與宇宙保持一致,但它會(huì )引起數據中心和100米短跑成績(jì)的混亂。 ![]() 圖6. 氫微波激射器中產(chǎn)生的超精細躍遷頻率為1.420405751 GHz,將導致電子自旋反轉 GNSS登場(chǎng) 數據中心用來(lái)獲取UTC的常用方法有兩種:通過(guò)互聯(lián)網(wǎng)使用公開(kāi)的NTP時(shí)間服務(wù)器,以及通過(guò)衛星使用GPS或GNSS網(wǎng)絡(luò )。雖然在分布式數據庫的早期部署期間,通過(guò)互聯(lián)網(wǎng)上的公共NTP時(shí)間服務(wù)器進(jìn)行授時(shí)很常見(jiàn),但固有的性能、可追溯性和安全問(wèn)題已經(jīng)促使人們放棄了這種解決方案。 盡管GPS和其他GNSS通常被視為定位和導航系統,但它們實(shí)際上是精確授時(shí)系統。接收器的位置和時(shí)間取決于信號以光速從多個(gè)衛星傳輸到接收器的傳輸時(shí)間。極具諷刺意味的是,這是物理學(xué)原理引發(fā)問(wèn)題的又一個(gè)案例(此案例中是光速而不是原子),但也有助于解決問(wèn)題。 這些衛星有自己的機載原子鐘,這些原子鐘與從地面站傳輸到衛星的UTC同步。利用這種方法獲取UTC可以提供5納秒范圍內的時(shí)間偏差,從而實(shí)現每秒1億個(gè)時(shí)間包絡(luò )。 這種方法比公共NTP服務(wù)器更可靠、更精確,雖然這些信號可能會(huì )被太陽(yáng)風(fēng)暴或蓄意的信號干擾等事件中斷,但在出現這些信號時(shí),可以在每個(gè)單獨的數據中心放置與衛星信號同步的備份時(shí)鐘,以便在中斷期間提供所需的偏差水平。 ![]() 圖7. 數據庫事務(wù)速率的發(fā)展歷程以及實(shí)現和禁用的技術(shù) 下一步:躍遷電子 隨著(zhù)未來(lái)對獲取、存儲和處理數據的需求不斷增加,我們需要具有極低偏差的新型原子鐘技術(shù)和時(shí)間傳輸系統。目前,國家授時(shí)實(shí)驗室正在開(kāi)發(fā)一種新型原子鐘,用于研究電子躍過(guò)軌道層時(shí)發(fā)生的光學(xué)躍遷。這些原子鐘的頻率穩定性可達到萬(wàn)億分之一赫茲,最終將用于重新定義秒這個(gè)單位。 通過(guò)專(zhuān)用光纖鏈路或機載激光器實(shí)現的信號傳輸已經(jīng)顯著(zhù)提高了傳輸精度。憑借這些不斷涌現的創(chuàng )新數據,原子和光將繼續它們之間復雜的愛(ài)恨交織關(guān)系,從而能夠以更快速度處理越來(lái)越多的數據,而不會(huì )出現一致性或因果關(guān)系問(wèn)題。 |