国产日本三级,亚洲欧美激情小说另类,国产亚洲papapa

亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告：魔扣目錄網(wǎng)為廣大站長提供免費(fèi)收錄網(wǎng)站服務(wù)，提交前請做好本站友鏈：【網(wǎng)站目錄：http://www.430618.com 】，免友鏈快審服務(wù)（50元/站），

網(wǎng)站：51998
待審：31
小程序：12
文章：1030137
會員：747

智匯華云 | OpenStack 虛擬機(jī) GPU 性能優(yōu)化

發(fā)布時間：2020-08-13 11:02:00 作者：網(wǎng)友整理

隨著大數(shù)據(jù)、人工智能技術(shù)的發(fā)展，越來越多的用戶產(chǎn)生了獲取擁有GPU算力的彈性計算服務(wù)的需求，GPU云主機(jī)具有突出的圖形處理和高性能計算能力，適用于科學(xué)計算、視頻處理、深度學(xué)習(xí)等應(yīng)用場景，受到了市場的青睞。

本期智匯華云，特別邀請到華云數(shù)據(jù)OpenStack開發(fā)工程師傅成超為大家?guī)?ldquo;OpenStack 虛擬機(jī) GPU 性能優(yōu)化”。

首先為大家簡單介紹一下 NUMA 的概念。NUMA 是一種解決多 CPU 工作的技術(shù)方案，在此之前，市面上主要采用 SMP 和 MPP 兩種架構(gòu)。

SMP 技術(shù)

計算機(jī)技術(shù)發(fā)展初期，服務(wù)器都是單 CPU 結(jié)構(gòu)，隨著技術(shù)的不斷發(fā)展，多 CPU 結(jié)構(gòu)開始流行起來，為了滿足多 CPU 共同工作的需求，SMP 技術(shù)應(yīng)運(yùn)而生。

如圖所示，多個 CPU 通過一個總線訪問存儲器，因此無論在什么時候，處理器只能為內(nèi)存的每個數(shù)據(jù)保持或共享唯一一個數(shù)值。

SMP 的缺點(diǎn)是十分明顯的，即擴(kuò)展性有限，因此在存儲接口達(dá)到飽和的時候，增加處理器的數(shù)量并不能獲得更高的性能，因此 SMP 架構(gòu)支持的 CPU 數(shù)量十分有限。

MPP 技術(shù)

MPP 則是一種分布式存儲器模式，它能將更多的處理器納入一個系統(tǒng)的存儲器。一個分布式存儲器具有多個節(jié)點(diǎn)，每個節(jié)點(diǎn)都有自己的存儲器，單個節(jié)點(diǎn)相互連接形成了一個總系統(tǒng)。MPP 可以近似理解為一個 SMP 的橫向擴(kuò)展集群。

NUMA 技術(shù)

NUMA 是目前最常用的技術(shù)，在 NUMA體系中每個處理器都有自己的存儲器，同時，每個處理器也可以訪問其他處理器的存儲器。

下圖為多核 NUMA CPU 架構(gòu)

如上文所說，每個處理器既可以訪問自己的存儲器，也可以訪問其他處理器的存儲器，事實上，前者的速度要比后者最高快到100倍之多。在 Linux 中，系統(tǒng)默認(rèn)采用自動 NUMA 平衡策略，所以 NUMA 調(diào)優(yōu)的目的就是讓處理器盡可能地訪問自己的存儲器，以提高計算速度。

在 OpenStack 中，可以采用 virsh numatune 命令查看和修改虛擬機(jī)的 NUMA 配置，反映在 XML 文件上的便是和 < numatune > 中的 id 保持一致。

那么在 GPU 云主機(jī)中，是否可以采用相同的思路進(jìn)行性能調(diào)優(yōu)呢？答案自然是肯定的。

在進(jìn)行 GPU 性能優(yōu)化前，我們還需要進(jìn)一步了解一下 render-nodes 的概念。

render-nodes 是一種用于訪問具有 DRI 能力的 GPU 非特權(quán)功能的 DRM 接口，在 Linux 內(nèi)核中，DRM 驅(qū)動程序通過 render-node 接口公開其用戶空間 API 的非特權(quán)部分，并作為一個單獨(dú)的設(shè)備文件 (/dev/dri/renderDXX) 存在。信息技術(shù)變革日新月異，如今，客戶端已不再需要運(yùn)行合成器或圖形服務(wù)器來使用 GPU ，通過 render-node 即可實現(xiàn)對 GPU 資源的訪問。

將 render-node 和所在的 NUMA 綁定，可以有效防止跨片 PCIE 訪問帶來的性能損耗。

通過 lspci –vvvs bus_id 命令便可查看 GPU 所在的 NUMA 節(jié)點(diǎn)，即 /dev/dri/renderDXX 與 NUMA 的對應(yīng)關(guān)系。以我本機(jī)為例，renderD128 對應(yīng) NUMA 0，renderD129 對應(yīng) NUMA 1，此時我們便可以使用 numactl 進(jìn)行綁定。

然而在一個 OpenStack 云環(huán)境中可能會運(yùn)行著成百上千的云主機(jī)，云主機(jī)創(chuàng)建完成后逐一進(jìn)行手動綁定明顯不是一個現(xiàn)實的方案，此時可以通過修改 /nova/virt/libvirt/driver.py中的相關(guān)邏輯。當(dāng)程序獲取到 vcpu 被分配的 NUMA 節(jié)點(diǎn)后，通過設(shè)備之間的映射關(guān)系，在添加 GPU 設(shè)備階段為其綁定對應(yīng)的 render-node。這樣虛擬機(jī)在創(chuàng)建之初便擁有了卓越的性能，無需后期進(jìn)行人工綁定。

結(jié)束語

本文從 NUMA 出發(fā)，為大家簡單介紹了多 CPU 的常用技術(shù)架構(gòu)，并以此為延伸，分享了 GPU 虛擬機(jī)的性能調(diào)優(yōu)方案。目前，華云數(shù)據(jù)公有云產(chǎn)品線中已經(jīng)包含具有超強(qiáng)計算能力的 GPU 型云主機(jī)，在新基建的風(fēng)口，推動中國企業(yè)全面上云，助力客戶實現(xiàn)數(shù)字化轉(zhuǎn)型。

分享到：

標(biāo)簽：虛擬機(jī) 優(yōu)化性能華云 OpenStack GPU