機(jī)器學(xué)習(xí)有望為先進(jìn)的管理開創(chuàng)新的紀(jì)元,但數(shù)據(jù)中心的許多基礎(chǔ)設(shè)施的管理仍然還有很長(zhǎng)的路要走,這些基礎(chǔ)設(shè)施管理有必要從過(guò)去那種晦澀難懂基于電子表格管理管理逐漸發(fā)展演化到以自動(dòng)化管理為主的方向上來(lái)。
數(shù)據(jù)中心基礎(chǔ)設(shè)施管理(DCIM)軟件的終極目標(biāo)是最終實(shí)現(xiàn)自我管理或完全自動(dòng)化的數(shù)據(jù)中心。
業(yè)界當(dāng)前寄希望于人工智能驅(qū)動(dòng)的管理軟件(可能是基于的)將會(huì)監(jiān)控和控制IT和設(shè)施基礎(chǔ)設(shè)施,以及應(yīng)用程序。人工智能將實(shí)現(xiàn)無(wú)縫整體性地 可能是跨越多個(gè)站點(diǎn) 實(shí)施其監(jiān)控管理。冷卻散熱、電源、計(jì)算、工作負(fù)載、存儲(chǔ)和網(wǎng)絡(luò)將動(dòng)態(tài)化,以實(shí)現(xiàn)最高效率,生產(chǎn)力和可用性。
通過(guò)將基于云的分析應(yīng)用于從數(shù)千個(gè)地點(diǎn)采集的傳感器數(shù)據(jù),設(shè)施設(shè)備和IT也將在一定程度上得到自我修復(fù),從而有助于企業(yè)數(shù)據(jù)中心得以運(yùn)用其來(lái)指導(dǎo)和制定有針對(duì)性的預(yù)測(cè)性和預(yù)防性維護(hù)計(jì)劃。備用零件將可能是經(jīng)由靈巧的機(jī)器人進(jìn)行訂購(gòu)、測(cè)試和安裝,以便在需要時(shí)精確匹配,以避免發(fā)生故障失效,同時(shí)避免不必要的維護(hù)和測(cè)試。
這種以人工智能驅(qū)動(dòng)的管理模式在數(shù)據(jù)中心業(yè)界可能已經(jīng)有十年甚至更長(zhǎng)的歷史了,但是,整個(gè)數(shù)據(jù)中心行業(yè)目前也僅僅只是在部分的領(lǐng)域取得了一些進(jìn)展。例如,谷歌公司在2014年透露,該公司一直在使用通過(guò)其收購(gòu)英國(guó)AI專家DeepMind公司所獲得的技術(shù)來(lái)改善其部分?jǐn)?shù)據(jù)中心站點(diǎn)的基礎(chǔ)設(shè)施管理。
正如谷歌在當(dāng)時(shí)所指出的那樣:鑒于數(shù)據(jù)中心內(nèi)部有太多的電力和冷卻設(shè)備相互作用,故而使得其基礎(chǔ)設(shè)施的管理無(wú)疑是太過(guò)復(fù)雜而人類員工是無(wú)法勝任的。該公司當(dāng)時(shí)曾表示:
想象一處簡(jiǎn)化的數(shù)據(jù)中心場(chǎng)景:一處數(shù)據(jù)中心只有10款設(shè)備,其中每款設(shè)備有10個(gè)設(shè)置,可能將會(huì)有10到100億款可能的電源配置,以及相關(guān)可能的其它配置,這就已經(jīng)遠(yuǎn)遠(yuǎn)超出任何人工測(cè)試的真實(shí)能力的范疇了 但即使這樣,其也遠(yuǎn)遠(yuǎn)低于一處實(shí)際的數(shù)據(jù)中心可能的配置。
AI驅(qū)動(dòng)的效率
谷歌公司使用來(lái)自其數(shù)據(jù)中心內(nèi)部的成千上萬(wàn)個(gè)傳感器所收集的歷史數(shù)據(jù)信息來(lái)訓(xùn)練一款 深度人工神經(jīng)網(wǎng)絡(luò)集合體 。谷歌表示,將所得到的算法應(yīng)用于其基礎(chǔ)設(shè)施的管理過(guò)程,使得其實(shí)現(xiàn)了冷卻能耗降低了40%,進(jìn)而使得數(shù)據(jù)中心的整體能源消耗降低了15%.目前,該公司還在繼續(xù)開發(fā)和完善機(jī)器學(xué)習(xí)的使用 人工智能應(yīng)用的一個(gè)子集范疇 無(wú)疑還將進(jìn)一步取得更杰出的成果。
但事實(shí)上,并非僅僅只有谷歌這樣的高級(jí)云服務(wù)供應(yīng)商們?cè)谶M(jìn)行著機(jī)器學(xué)習(xí)領(lǐng)域的試驗(yàn)項(xiàng)目。DCIM軟件供應(yīng)商Vigilent公司表示,該公司已經(jīng)將機(jī)器學(xué)習(xí)整合融入其動(dòng)態(tài)的冷卻管理系統(tǒng)多年了:每一分鐘,來(lái)自數(shù)百或數(shù)千個(gè)環(huán)境傳感器的數(shù)據(jù)均經(jīng)由無(wú)線網(wǎng)狀網(wǎng)絡(luò)被收集,并進(jìn)入中央人工智能(AI)引擎 借助復(fù)雜的動(dòng)態(tài)控制算法,然后將指令實(shí)時(shí)發(fā)送到數(shù)據(jù)中心站點(diǎn)的冷卻系統(tǒng),制定旨在優(yōu)化性能績(jī)效的決策。
在不久的將來(lái),我們可以期待更多的DCIM供應(yīng)商、托管服務(wù)和云服務(wù)提供商擁有自主研發(fā)的工具,進(jìn)而將機(jī)器學(xué)習(xí)和其他形式的AI人工智能整合到管理系統(tǒng)中。從孤立的企業(yè)本地部署DCIM軟件轉(zhuǎn)移到基于云的數(shù)據(jù)中心管理即服務(wù)(DMaaS)工具(來(lái)自多個(gè)站點(diǎn)的數(shù)據(jù)將匯總在云中)也應(yīng)該有助于加速這一過(guò)程。
從電子表格到AI的漫長(zhǎng)過(guò)程
但是,盡管人們會(huì)很容易陷入又人工智能所帶來(lái)的令人興奮且具有顛覆破壞性的潛力,但數(shù)據(jù)中心業(yè)界當(dāng)前最為重要的則是亟待反思大多數(shù)數(shù)據(jù)中心將如何繼續(xù)設(shè)計(jì)、構(gòu)建和運(yùn)行的這一嚴(yán)峻的現(xiàn)實(shí)問(wèn)題。
事實(shí)上,數(shù)據(jù)中心的許多管理過(guò)程 特別是在基礎(chǔ)設(shè)施管理方面 仍然嚴(yán)重的依賴于傳統(tǒng)的設(shè)備和人工手動(dòng)操作。例如,正如我們以前所強(qiáng)調(diào)的那樣,盡管DCIM工具已經(jīng)存在了將近十年了,但大量的數(shù)據(jù)中心運(yùn)營(yíng)商們?nèi)匀粚?duì)該技術(shù)持懷疑的態(tài)度。多達(dá)50%的數(shù)據(jù)中心站點(diǎn)(可能是那些較小型的終端站點(diǎn))仍然依靠可信但不太智能的建筑管理工具以及電子表格,書面文檔和其他手動(dòng)流程來(lái)運(yùn)行其基礎(chǔ)設(shè)施。
打造數(shù)字化
盡管整個(gè)數(shù)據(jù)中心業(yè)界已經(jīng)看到了相關(guān)軟件工具 包括一些DCIM軟件以及專業(yè)計(jì)算機(jī)維護(hù)管理系統(tǒng)(CMMS) 獲得了長(zhǎng)足的發(fā)展,可以用以幫助管理和自動(dòng)化數(shù)據(jù)中心的重要管理程序的應(yīng)用程序。但事實(shí)上,所謂的操作和維護(hù)(或者說(shuō)O M),其實(shí)踐方案在紙質(zhì)文檔中或者說(shuō)在設(shè)備工作人員的負(fù)責(zé)人看來(lái),仍然是常規(guī)性的。
在數(shù)據(jù)中心運(yùn)營(yíng)商們開始充分利用先進(jìn)的支持AI的管理工具的潛在優(yōu)勢(shì)之前,他們還將需要解決更為智能化的操作方面的問(wèn)題。這些包括:部署企業(yè)本地或基于云的DCIM工具,用于資產(chǎn)管理和環(huán)境監(jiān)控。這個(gè)監(jiān)控和管理層將需要及時(shí)的到位,然后才能執(zhí)行一些更復(fù)雜的AI操作。
安裝更多的傳感器和儀表。包括聲學(xué)和振動(dòng)裝置 以便能夠密切監(jiān)測(cè)數(shù)據(jù)中心的溫度、濕度、電能質(zhì)量和其他指標(biāo)。機(jī)器學(xué)習(xí)工具將需要越來(lái)越多的數(shù)據(jù)。
更好地協(xié)調(diào)IT和設(shè)施團(tuán)隊(duì)(由DCIM軟件支持),以便更全面地管理數(shù)據(jù)中心基礎(chǔ)設(shè)施。
盡可能數(shù)字化和自動(dòng)化許多以前由人工手動(dòng)操作的流程和程序。
數(shù)據(jù)中心工作人員們經(jīng)歷了什么?
關(guān)于廣泛采用基于人工智能的數(shù)據(jù)中心管理的探討中,另外一個(gè)顯而易見(jiàn)的話題是:其將對(duì)于數(shù)據(jù)中心現(xiàn)有的設(shè)施和IT人員帶來(lái)怎樣的影響?正如我們?cè)鴱?qiáng)調(diào)過(guò)的那樣,數(shù)據(jù)中心業(yè)界將朝著遠(yuǎn)程無(wú)人值守管理( Lights-out )的趨向發(fā)展,由此,IT和一些設(shè)施基礎(chǔ)設(shè)施的管理會(huì)是自動(dòng)化的,并且是遠(yuǎn)程執(zhí)行的。隨著AI工具進(jìn)一步變得更加發(fā)達(dá),這個(gè)過(guò)程可能會(huì)進(jìn)一步加劇,并擴(kuò)散到更多類型的站點(diǎn)。
任何一處數(shù)據(jù)中心設(shè)施的現(xiàn)場(chǎng)工作人員的數(shù)量都將不可避免地繼續(xù)減少。但并不是總體上造成大面積的員工失業(yè),更多的操作運(yùn)營(yíng)人員可能會(huì)為服務(wù)型公司工作,如從事設(shè)施管理服務(wù),支持多家運(yùn)營(yíng)商和數(shù)據(jù)中心站點(diǎn)。
機(jī)器是否會(huì)崛起?
對(duì)于關(guān)于人工智能的潛在好處,幾乎每一個(gè)與此相關(guān)的故事都有涉及。也存在著某些警告 其通常是通過(guò)科幻書籍和電影 機(jī)器橫行,甚至威脅我們?nèi)祟惖纳?。?duì)于數(shù)據(jù)中心這個(gè)世界來(lái)說(shuō),這可能有點(diǎn)牽強(qiáng)附會(huì),但是谷歌公司發(fā)現(xiàn),AI系統(tǒng)所提供的答案和行動(dòng)措施可能并不總是能夠完美的符合最初的預(yù)期。
谷歌的算法就提高數(shù)據(jù)中心站點(diǎn)效率達(dá)成了一個(gè)非常簡(jiǎn)單和準(zhǔn)確的結(jié)論:
關(guān)于實(shí)現(xiàn)最大的節(jié)能,該模式的第一個(gè)建議是:關(guān)閉整個(gè)數(shù)據(jù)中心設(shè)施。嚴(yán)格來(lái)說(shuō),這并不是不準(zhǔn)確的,但其實(shí)也不是特別有用。
因此,考慮到潛在的意外后果,為人工智能驅(qū)動(dòng)的管理做好準(zhǔn)備可能會(huì)是一個(gè)緩慢而謹(jǐn)慎的過(guò)程,需要大量的基礎(chǔ)性工作,可能并不是一件壞事。
文章編輯:CobiNet(寧波)
本公司專注于電訊配件,銅纜綜合布線系列領(lǐng)域產(chǎn)品研發(fā)生產(chǎn)超五類,六類,七類線,屏蔽模塊,配線架及相關(guān)模塊配件的研發(fā)和生產(chǎn)。
?2016-2019寧波科博通信技術(shù)有限公司版權(quán)所有浙ICP備16026074號(hào)