MySQL Autopilot提供 9 種基于機器學習的自動化能力,進一步提升MySQL Heatwave服務的性能和可擴展性。
根據行業標準TPC-H基準,MySQL HeatWave的性價比高出Snowflake達 35 倍,比亞馬遜Redshift的AQUA高 13 倍。
2021年8月12日,北京——甲骨文宣布推出MySQL Heatwave服務的最新組件MySQL Autopilot,可作為在Oracle云基礎設施(Oracle Cloud Infrastructure, OCI)之上,MySQL數據庫服務的內存中查詢加速引擎。MySQL Autopilot借助先進的機器學習技術實現HeatWave自動化,使其更易于使用,同時提升性能和可擴展性。任何其他云供應商都沒有為自己的數據庫產品提供這種先進的自動化能力,且MySQL HeatWave客戶無需支付額外費用即可獲得Autopilot。
MySQL Autopilot可自動執行和高查詢性能相關的許多關鍵、具挑戰性的功能,包括配置、數據加載、查詢執行和故障處理。它使用先進的技術來提取數據樣本,采集和查詢統計數據,使用Oracle AutoML構建機器學習模型,以構建內存使用、網絡負載和執行時間模型。這些機器學習模型可被MySQL Autopilot用于執行其核心能力,隨著查詢的次數越來越多,MySQL Autopilot將使得HeatWave查詢優化程序漸趨智能化,從而不斷改善系統性能,而這一能力正是亞馬遜Redshift、亞馬遜Aurora、Snowflake或其他基于MySQL數據庫產品所不具備的。
MySQL Autopilo納入了以下功能:
自動配置 — 通過對需要分析的表數據進行自適應采樣,以預測運行工作負載所需的HeatWave節點數,因此客戶不再需要以人工的方式估算集群的最佳大小,同時也是任何其他數據庫服務無法提供的獨特能力。
自動并行加載 —通過預測加載到 HeatWave 中的每個表的最佳并行度,以優化加載時間和內存使用。
自動數據放置 —預測應在內存中對哪些表進行分區,以實現最佳查詢性能,并通過推薦的新列預測查詢性能的改善程度,可最小化操作人員的影響,最大限度地減少跨節點的數據移動。任何其他數據庫服務都未提供這一能力。
自動編碼 — 可決定加載至HeatWave的最佳呈現方式,同時將查詢納入考慮。這一最佳呈現方式能提供最佳的查詢性能,最小化集群的大小,從而最小化成本。
自動查詢計劃 — 智能地學習執行查詢后的各種統計數據,用于改進未來的查詢動作。隨著查詢次數的日益增多,系統的性能將會得到進一步提升。任何其他數據庫服務都未提供這一能力。
自動估算查詢時間 —可在執行查詢前估算執行時間,幫助客戶確定查詢時間是否過長,是否應該進行其他查詢。
自動變更傳播 — 當MySQL數據庫發生變更時,智能地確認傳到HeatWave橫向擴展數據管理層的最佳時間,確保在恰當的時間傳播變更。任何其他云供應商尚未提供這一能力。
自動調度 — 智能地確定隊列中哪些查詢運行時間較短,并將其優先排列在運行時間較長的查詢之前,以縮短總體等待時間。其他大多數數據庫都使用“先進先出”(FIFO)調度機制。
自動錯誤恢復 — 由于軟件或硬件故障導致一個或更多個HeatWave節點無法響應,系統則會配置新的節點并重新加載必要的數據。
甲骨文公司首席企業架構師Edward Screven表示:“集成HeatWave技術的MySQL數據庫服務可高效支持OLTP和OLAP,可讓用戶運行混合工作負載,或對自己的MySQL數據庫進行實時分析,相比于其他分析或基于MySQL的數據庫,性能可提升 10 至1, 000 倍,而成本不到其一半。MySQL HeatWave是OCI上發展最快的云服務之一,越來越多的客戶將MySQL工作負載遷移至HeatWave。今天發布的眾多創新都是甲骨文多年研發的結果,在自動化、性能和成本方面均有了極大改善,使得HeatWave更加領先于其他云服務。”
甲骨文同時推出MySQL橫向擴展數據管理(MySQL Scale-out Data Management),將數據加載至HeatWave的性能提升高達 100 倍。HeatWave現可支持 64 個節點(原來為 24 個)的集群,處理多達32 TB的數據(原來為12 TB),進一步強化了HeatWave相對于主要競爭對手的性價比優勢。
相比于所有其他數據庫和分析云服務,HeatWave的價格更低,分析和混合工作負載的性能更高。具體來說,HeatWave具備:
性價比比亞馬遜Redshift AQUA高 13 倍 — 價格為其一半,速度快6. 5 倍(TPC-H10TB)
性價比比Snowflake高 35 倍 — 價格為其1/5,速度快 7 倍(TPC-H10TB)
性價比比谷歌Big Query高 36 倍 — 價格為其1/4,速度快 9 倍(TPC-H30TB)
性價比比Azure Synapse高 15 倍 — 價格為其1/4,速度快 3 倍(TPC-H30TB)
在混合工作負載方面,性價比比亞馬遜Aurora高 42 倍 — 價格為其42%,延遲低 18 倍,吞吐量多 110 倍(CH-benCHmark100G)
客戶可訪問此處,了解甲骨文公開提供基準代碼,并自行使用。甲骨文同時也宣布現在可使用HeatWave加速行業標準TPC-DS基準測試。
從亞馬遜遷移至OCI上MySQL HeatWave的客戶可顯著降低成本,極大提升云工作負載的性能。
Red3i是美國的一家領先的商務智能和數字營銷企業,其聯合創始人兼首席技術官Amit Palshikar表示:“我們將6TB數據庫和數字營銷及媒體管理應用程序從亞馬遜網絡服務Aurora成功地遷移至OCI上的MySQL HeatWave,從而降低成本達60%,將復雜查詢的性能提升了 1000 多倍,總體工作負載改善了85%。同時,我們無需對應用程序進行任何修改,自動恢復功能最小化了停機時間。幫助我們擴展至數千個核,因應我們越來越多的需求。”
IDC數據管理軟件研究副總裁Carl Olofson指出:“市面上有一些云數據庫提供商繼續提供針對特定工作負載的專用數據庫,尤其是在開源領域,開發者希望通過人工調整參數的方式優化性能。甲骨文采取了不同的方式,將數據庫的各種功能整合在一個系統中,在開源云數據庫服務MySQL HeatWave中提供數據庫融合和自動化能力。甲骨文在 2020 年推出了MySQL HeatWave,在一個數據庫中提供全面的本地云支持,將OLTP和OLAP整合,無需提取、轉換和加載(ETL)。在本次發布的新版本中,甲骨文增加了基于機器學習的自動化,避免了與配置、數據加載、查詢執行和故障處理相關的猜測和人工需求。這些自動化功能也是 HeatWave 優秀的性能和性價比結果主要原因,正如甲骨文公開可訪問和可重復的基準所報告所顯示,其提供的指標與其他云數據庫服務提供商的指標相比相當具有優勢。”
MySQL HeatWave也被集成進了甲骨文的湖倉(lake house),而OCI數據目錄是該湖倉的唯一目錄,包含MySQL數據庫服務、Oracle自治數據庫和對象存儲的數據(OCI Object Storage)。湖倉用戶可通過該目錄發現MySQL數據,按需移動或分析這些數據。Oracle分析云和Oracle云數據集成服務等其他OCI服務也與MySQL HeatWave進行集成。






