數據庫,被譽為“基礎軟件皇冠上的明珠”。

數字化時代,無論是查詢健康碼、存取款還是日常辦公等,都有賴于底層數據庫的支持。可以說,數據庫是一切應用軟件運行的基礎。尤其在數字化轉型的浪潮下,數據庫已成為新型基礎設施建設的堅實底座,其關乎國家科技戰略全局,也是IT廠商的必經之路。
從大型機集成、封閉的數據庫服務,到小型機時代經典的IOE數據庫架構,再到互聯網帶來的MySQL、PostgreSQL開源數據庫浪潮,直至云計算興起開啟了云數據庫的時代,數據庫的發展始終與用戶需求變遷緊密相關。如今,云原生數據庫正成為企業關注的技術領域之一,不管是老牌的數據庫廠商,還是大型云計算企業都在向這一趨勢靠攏。從云數據庫到云原生數據庫,其中產生了哪些關鍵變化?為何數據庫廠商們紛紛瞄準云原生數據庫?
為什么是云原生數據庫?
過去60年里,數據庫產品形態經歷漫長的變遷與更迭。1961年,通用電氣(GE)研發出世界第一個數據庫管理系統(DBMS);1976年,霍尼韋爾(Honeywell)研發出世界第一個商用關系數據庫系統。在之后幾十年的發展中,數據庫領域一直上演著“三國演義”,Oracle、IBM和Microsoft美國數據庫三巨頭把持著全球數據庫產業的江山,呈現出傳統數據庫市場極度集中的格局。自2000年以來,隨著互聯網的興起,云計算也逐漸走向行業的縱深應用。
特別是2010年后,開源數據庫的發展風起云涌,在越來越多的應用場景下呈現出替代傳統數據庫的新趨勢。而隨著云原生技術已從單一容器技術發展到龐大的全棧化云原生技術體系,云原生數據庫承載著云原生技術優勢脫穎而出,不僅成為亞馬遜云科技、華為云等一眾廠商們力推的數據庫發展方向,更有望書寫數據庫市場的新格局。
為應對傳統數據庫帶來的挑戰,不同數據庫廠商各有各的發展路徑。傳統數據庫廠商借助上云策略的推進,實現數據庫上云,也推出支持容器化等創新技術,但總讓人覺得云原生不夠徹底;新興開源數據庫廠商基于自身業務發展需求,與公有云合作并推出云原生數據庫;公有云廠商有著天然的云原生優勢,對于升級云原生數據庫有著根本性策略,也有著分布式改造的徹底性。
云數據庫更像是傳統數據庫按照云模式來提供的數據庫服務,存在諸如存儲空間浪費、系統性能有限、業務應用受限等缺點,并且這些缺點往往會在當前新的業務場景中得到放大。
相比云數據庫,云原生數據庫作為一種云平臺,以PaaS的形式進行分發,用戶可以將該平臺用于多種目的,例如存儲、管理和提取數據。云原生數據庫不再是簡單的資源供給,而是在架構和技術上能感知應用特征。云原生數據庫的一切設計圍繞用戶應用需求出發,目標是讓應用能更智能、更高效地使用數據庫。
隨著企業上云成為大勢所趨,各大云服務商們最早意識到云原生數據庫的重要性,并且紛紛推出相應的云原生數據庫服務,比如亞馬遜云科技的Amazon DynamoDB、Google的Spanner、微軟的Socrates等。從國內來看,具有代表性的云原生數據庫如阿里云的PolarDB、騰訊云的CynosDB、華為云的TaurusDB等。此外,從這些國內外公有云廠商近年來的業績表現來看,數據庫已經成為虛擬機、CDN、存儲之后又一個重要的云業務貢獻者,并且數據庫競爭的差異化不僅對公有云IaaS業務有著直接的拉動力,同時也讓公有云廠商看到了更多的利潤來源。可見,公有云廠商發展云原生數據庫更具優勢,成為主要推動者。
云原生數據庫釋放數字生產力
隨著數字化進程的不斷提速,各行業企業面對數據量指數級暴漲和數據類型及應用場景的多元細分等諸多挑戰,對數據庫性能、擴展性、高可用性以及成本效益等需求也愈發嚴苛。
例如,汽車行業企業需要處理如車聯網產生的海量以及多樣化數據;制造業中的智能家居/設備類企業,需要管理不同生命周期數據并生成洞察;金融業需要減少成本并提升風險控制能力等等。事實上,很多業務都是從需求的角度推動數據庫的轉變,具體而言就是以資源為中心到應用為中心、從地域為中心到流量為中心,以及從負載為中心到數據為中心,云原生數據庫能夠帶來極致彈性,讓用戶按需使用。
同時其依靠安全可靠和易可擴展的特性,保障業務規模化的安全運行。此外,進一步降低企業門檻,應用在架構設計、業務處理與切換等方面透明,滿足企業多元化需求。云原生數據庫由于具有強大性能、高可用性、可擴展性、支持多場景需求且具備成本效益等優勢,正成為越來越多傳統行業企業的選擇。
Gartner預測,到2025年,基于云原生平臺的數字化業務比例將達到95%,將帶來云原生數據庫市場的快速增長。
對此,亞馬遜云科技大中華區產品部總經理陳曉建表示,數據作為企業的核心資產和創新的主要推動力,企業需要率先夯實數據庫這一新基建,為數字化轉型打下堅實的地基。云原生數據庫是打破固有瓶頸,充分發揮公有云架構優勢,釋放數據創新潛力的必選項。

亞馬遜云科技大中華區產品部總經理 陳曉建
2004年,亞馬遜電商因商用數據庫負載過高導致擴展失敗,出現數小時的服務故障,后續統計表明:70%的數據訪問并不需要SQL事務級別的復雜性。
因此開始研究NoSQL非關系型數據庫,并于2012年推出第一個云原生NoSQL數據庫Amazon DynamoDB。Amazon DynamoDB可以說是最有代表性的云原生數據庫,也是業界第一個真正意義上的云原生數據庫。
在Amazon DynamoDB問世后的十年里,亞馬遜云科技對其進行的持續完善,不僅涉及底層可用性、持久性、安全性和規模等特性,還包括易用性等。現在Amazon DynamoDB已服務于全球眾多客戶,也包括亞馬遜自身,其通過十年來的實踐證明了云原生數據庫是打破傳統數據庫瓶頸的必然歸宿。
云原生+分布式會碰撞出怎樣的火花?
隨著企業業務更加數字化、智能化,企業面臨的數據存儲量將會更加巨大,面臨著更多突發狀況帶來的挑戰。據IDC預測,2025年,三分之二的企業將會每天都發布軟件版本,通過敏捷的開發能力來實現創新與交付,以形成差異化的市場競爭力。在這樣的商業趨勢下,數據庫就需要全面進入云原生+分布式的時代,實現智能升級,充分釋放云計算紅利。所謂的分布式,是面向業務擴展而出現的一個概念,而分布式數據庫,就是為了解決存儲可擴展性的一類數據庫。
它是由多個相互連接的數據庫組成,這些數據庫分布在各個數據中心,通過中央服務器進行通信,然后組合在一起形成一個面向用戶的單個數據庫。基于Shared Nothing的架構,分布式數據庫能夠實現數據的水平分片、水平擴展。而云原生數據庫是基于Shared Everything + Shared Storage的存儲計算分離架構,能夠實現資源池化高效管理。
因此,云原生數據庫的優勢+分布式數據庫的效率,可以將兩者的特性完美結合,代表了一種未來的解決方案。事實上,云原生和分布式如今已經融為一體。如果底層基礎設施全部云化,人們思考技術問題的角度自然變成“云原生”角度。隨著云原生應用深入企業各個業務場景,云原生正在走向分布式,滿足跨云跨地域統一協同治理、保證一致應用體驗等新需求。
根據Gartner預測,2022年,全世界75%的數據庫會以云的方式運行。未來,數據庫領域的核心發展方向是云原生+分布式,以及由此帶來的幾個核心技術布局:安全穩定、自動化與智能化、數據庫大數據一體化、數據倉庫與數據湖、多模數據庫以及軟硬件結合。面向未來,在抓住數據庫歷史發展機遇的過程中,云計算廠商們正在不斷強化在數據庫領域的創新韌性,進一步加大自主研發投入,聚焦深度自主創新的云原生數據庫技術。由于在功能和可靠性上優于傳統數據庫,再加上增強的可伸縮性,云原生分布式數據庫無疑代表了數據庫的未來。有了更強大的云原生能力,企業也將進一步鍛造出數字化轉型的創新基石,賦能數字經濟更可持續的發展。