亚洲成人一区二区久久-97精品久久人妻人人搡人人玩-亚洲黄色mv在线观看-欧美三级不卡在线视频

當(dāng)前位置:首頁(yè) > 最新資訊 > 行業(yè)資訊

加速AI開發(fā),企業(yè)如何利用MLOps提升生產(chǎn)效率?

企業(yè)第一次部署人工智能和構(gòu)建機(jī)器學(xué)習(xí)項(xiàng)目的時(shí)候,往往把重點(diǎn)放在理論上。那么有沒有一種模型,可以提供必要的結(jié)果?如果有,我們又該如何構(gòu)建和訓(xùn)練這種模型呢?

根據(jù)IDC的數(shù)據(jù)顯示,部署人工智能或者機(jī)器學(xué)習(xí)解決方案平均需要長(zhǎng)達(dá)9個(gè)多月的時(shí)間。主要是因?yàn)閿?shù)據(jù)科學(xué)家用來打造這些概念證明的工具,通常不能很好地轉(zhuǎn)化為生產(chǎn)系統(tǒng)。IDC分析師SriramSubramanian說:“我們將研發(fā)的過程所需的時(shí)間稱為‘模型速度’,即從開始到結(jié)束需要多長(zhǎng)時(shí)間。”

企業(yè)可以利用MLOps解決上述問題。MLOps(Machine Learning Operations)是一組最佳實(shí)踐、框架和工具,可以幫助企業(yè)管理數(shù)據(jù)、模型、部署、監(jiān)控,以及其他利用理論概念驗(yàn)證AI系統(tǒng)并使之奏效的方方面面。

Subramanian進(jìn)一步解釋,“MLOps將模型速度縮短到幾周——有時(shí)甚至是幾天,就像使用DevOps加快應(yīng)用構(gòu)建的平均時(shí)間一樣,這就是為什么你需要MLOps。”企業(yè)通過采用MLOps可以構(gòu)建更多模型、更快地創(chuàng)新、應(yīng)對(duì)更多的使用場(chǎng)景。“MLOps的價(jià)值定位很明確。”

據(jù)IDC預(yù)測(cè),到2024年將有60%的企業(yè)使用MLOps來實(shí)施他們的機(jī)器學(xué)習(xí)工作流。Subramanian說,當(dāng)他們對(duì)受訪者調(diào)查采用人工智能和機(jī)器學(xué)習(xí)的挑戰(zhàn)時(shí),最主要的障礙之一就是缺少M(fèi)LOps,僅次于成本。

在本文中,我們研究了MLOps是什么,如何演變的,以及企業(yè)組織需要完成和牢記什么,才能充分利用這種新興的人工智能操作方法。

MLOps的演進(jìn)

幾年前,當(dāng)Eugenio Zuccarelli首次開始構(gòu)建機(jī)器學(xué)習(xí)項(xiàng)目的時(shí)候,MLOps還只是一組最佳實(shí)踐。從那時(shí)起,Zuccarelli一直在多家企業(yè)從事人工智能項(xiàng)目,包括醫(yī)療和金融服務(wù)領(lǐng)域的企業(yè),他看到,隨著時(shí)間的推移MLOps開始發(fā)展到包含了各種工具和平臺(tái)。

如今,MLOps為人工智能操作提供了一個(gè)相當(dāng)強(qiáng)大的框架,Zuccarelli說,他現(xiàn)在是CVS Health的創(chuàng)新數(shù)據(jù)科學(xué)家,他提到了之前從事的一個(gè)項(xiàng)目,該項(xiàng)目旨在創(chuàng)建一個(gè)可以預(yù)測(cè)不良結(jié)果的應(yīng)用,例如再入院或疾病進(jìn)展。

“我們正在探索數(shù)據(jù)集和模型,并與醫(yī)生進(jìn)行溝通找出最佳模型所具備的特征。但要使這些模型真正有用,還需要讓用戶真正地用起這些模型。”

這意味著要打造一個(gè)可靠的、快速且穩(wěn)定的移動(dòng)應(yīng)用,后端有一個(gè)通過API連接的機(jī)器學(xué)習(xí)系統(tǒng)。他說:“如果沒有MLOps,我們將無法確保這一點(diǎn)。”

他的團(tuán)隊(duì)使用H2O MLOps平臺(tái)和其他工具為模型創(chuàng)建了健康儀表板。“你肯定不希望模型發(fā)生重大變化,也不想引入偏見。健康儀表板讓我們能夠了解系統(tǒng)是否發(fā)生了變化。”

通過使用MLOps平臺(tái)還可以對(duì)生產(chǎn)系統(tǒng)進(jìn)行更新。他說:“在不停止應(yīng)用工作的情況下?lián)Q出文件是非常困難的。而MLOps可以在生產(chǎn)進(jìn)行中、以系統(tǒng)影響最小的情況下?lián)Q出系統(tǒng)。”

他說,MLOps平臺(tái)隨著逐漸成熟將會(huì)加速整個(gè)模型開發(fā)的過程,因?yàn)槠髽I(yè)不必為每個(gè)項(xiàng)目都重新發(fā)明框架。數(shù)據(jù)管道管理功能對(duì)于人工智能的實(shí)施也至關(guān)重要。

“如果我們有多個(gè)需要相互通信的數(shù)據(jù)源,這時(shí)候MLOps就可以發(fā)揮作用了。你希望流入機(jī)器學(xué)習(xí)模型的所有數(shù)據(jù)都是一致的且高質(zhì)量的。就像那句話說的,垃圾進(jìn),垃圾出。如果模型的信息很差,那么預(yù)測(cè)本身就會(huì)很差。”

MLOps的基礎(chǔ):一個(gè)不斷變化中的目標(biāo)

但不要認(rèn)為,僅僅因?yàn)橛心敲炊嗫捎玫钠脚_(tái)和工具,就忽略了MLOps的核心原則。剛開始使用MLOps的企業(yè)應(yīng)該記住,MLOps的核心是在數(shù)據(jù)科學(xué)和數(shù)據(jù)工程之間建立牢固的聯(lián)系。

Zuccarelli說:“為了確保MLOps項(xiàng)目的成功,你需要數(shù)據(jù)工程師和數(shù)據(jù)科學(xué)家是在同一個(gè)團(tuán)隊(duì)內(nèi)工作的。”

此外,防止偏見、確保透明度、提供可解釋性以及支持道德平臺(tái)所必需的工具,都還在開發(fā)之中,“這方面肯定還需要做很多工作,因?yàn)檫@是一個(gè)非常新的領(lǐng)域。”

因此,如果沒有一個(gè)完整的交鑰匙型解決方案可供采用,企業(yè)就必須非常了解如何讓MLOps有效地實(shí)施人工智能的方方面面。這就意味著,要廣泛地培養(yǎng)專業(yè)技能,技術(shù)咨詢公司Insight的人工智能團(tuán)隊(duì)國(guó)家實(shí)踐經(jīng)理Meagan Gentry這樣表示。

MLOps涵蓋了從數(shù)據(jù)收集、驗(yàn)證和分析、到管理機(jī)器資源和追蹤模型性能的整個(gè)范疇,有很多輔助工具是可以部署在本地、云端或者在邊緣的,這些工具有的是開源的,有的是專屬的。

但掌握技術(shù)只是其中一個(gè)方面,MLOps還借鑒了DevOps的敏捷方法和迭代開發(fā)的原則,Gentry說。此外,和任何敏捷相關(guān)的領(lǐng)域一樣,溝通是至關(guān)重要的。

“每個(gè)角色的溝通都是很重要的,數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師之間的溝通,和DevOps的溝通,以及和整個(gè)IT團(tuán)隊(duì)的溝通。”

對(duì)于剛起步的公司來說,MLOps可能是令人困惑的,它有很多一般性原則,有幾十家相關(guān)廠商,甚至還有非常多的開源工具集。

“這時(shí)候會(huì)遇到各種陷阱,”Capgemini Americas企業(yè)架構(gòu)高級(jí)經(jīng)理Helen Ristov說。“其中很多都還在開發(fā)中,現(xiàn)在還沒有一套正式的指導(dǎo)方針,就像DevOps一樣,這還是一項(xiàng)新興技術(shù),指導(dǎo)方針和相關(guān)政策需要一定時(shí)間才能推出。”

Ristov建議,企業(yè)應(yīng)該從數(shù)據(jù)平臺(tái)開始他們的MLOps之旅。“也許他們有數(shù)據(jù)集,但是這些數(shù)據(jù)集是在不同地方的,沒有一個(gè)統(tǒng)一的環(huán)境。”

她說,企業(yè)不需要將所有數(shù)據(jù)轉(zhuǎn)移到一個(gè)平臺(tái)上,但確實(shí)需要一種方法從不同的數(shù)據(jù)源中引入數(shù)據(jù),不同的應(yīng)用,情況也各不相同。例如,數(shù)據(jù)湖非常適合那些以高頻次進(jìn)行大量分析、低成本存儲(chǔ)的企業(yè)。MLOps平臺(tái)通常有用于構(gòu)建和管理數(shù)據(jù)管道并跟蹤不同版本的訓(xùn)練數(shù)據(jù)工具,但這并不是一勞永逸的。然后是模型創(chuàng)建、版本控制、日志記錄、衡量功能集、管理模型本身等其他方面。

“其中涉及大量的編碼工作,”Ristov說,建立一個(gè)MLOps平臺(tái)可能需要數(shù)月時(shí)間,而且在集成方面,平臺(tái)供應(yīng)商還有很多的工作要做。

“這些不同方向還有很大的發(fā)展空間,很多工具還在開發(fā)之中,生態(tài)系統(tǒng)非常龐大,人們只是選擇他們所需的東西。MLOps還處于‘青春期’,大多數(shù)企業(yè)組織仍在尋找最理想的配置。”

MLOps的市場(chǎng)格局

IDC的Subramanian表示,MLOps市場(chǎng)規(guī)模預(yù)計(jì)將從2020年的1.85億美元增長(zhǎng)到2025年約7億美元,但這個(gè)市場(chǎng)也有可能被嚴(yán)重低估了,因?yàn)镸LOps產(chǎn)品通常與更大的平臺(tái)捆綁在一起。他說,到2025年MLOps市場(chǎng)的真實(shí)規(guī)??赡艹^20億美元。

Subramanian說,MLOps廠商供應(yīng)商往往分為三大類,首先是大型云提供商,例如AWS、Azure和Google Cloud,這種廠商是把MLOps功能作為一項(xiàng)服務(wù)提供給客戶。

第二類是機(jī)器學(xué)習(xí)平臺(tái)廠商,例如DataRobot、Dataiku、Iguazio等。

“第三類是過去所說的數(shù)據(jù)管理廠商,例如Cloudera、SAS和DataBricks等等。他們的優(yōu)勢(shì)在于數(shù)據(jù)管理能力和數(shù)據(jù)操作,然后擴(kuò)展到機(jī)器學(xué)習(xí)能力,最終延伸到MLOps能力。”

Subramanian說,這三個(gè)領(lǐng)域都呈現(xiàn)出爆炸式增長(zhǎng),能讓MLOps廠商脫穎而出的,是他們能否同時(shí)支持本地環(huán)境和云部署模型,是否能夠?qū)嵤┛尚诺?、?fù)責(zé)任的人工智能,是否即插即用,是否容易擴(kuò)展,這就是體現(xiàn)差異化的方面。”

根據(jù)IDC最近的一項(xiàng)調(diào)查顯示,缺乏實(shí)施負(fù)責(zé)任AI的各種方法,是阻礙人工智能和機(jī)器學(xué)習(xí)普及的三大障礙之一,與缺乏MLOps一起并列第二。造成這種情況很大程度上是因?yàn)槌瞬捎肕LOps別無他選,Gartner人工智能和機(jī)器學(xué)習(xí)研究分析師Sumit Agarwal這樣表示。

“其他方法都是手動(dòng)的,所以,真的沒有其他選擇了。如果你想擴(kuò)展的話,你需要自動(dòng)化。你需要代碼、數(shù)據(jù)以及模型的可追溯性。”

根據(jù)Gartner最近的一項(xiàng)調(diào)查顯示,一個(gè)模型從概念驗(yàn)證到生產(chǎn)所需的平均時(shí)間已經(jīng)從9個(gè)月縮短到7.3個(gè)月。“但是7.3個(gè)月時(shí)間仍然很長(zhǎng),企業(yè)組織有很多機(jī)會(huì)利用MLOps。”

MLOps帶來的企業(yè)文化變革

Genpact公司全球分析負(fù)責(zé)人Amaresh Tripathy表示,實(shí)施MLOps還需要以企業(yè)AI團(tuán)隊(duì)的身份掀起一場(chǎng)文化變革。

“數(shù)據(jù)科學(xué)家給人們的印象通常是一個(gè)瘋狂的科學(xué)家,試圖大海撈針。但實(shí)際上數(shù)據(jù)科學(xué)家是發(fā)現(xiàn)者和探索者,而不是生產(chǎn)小部件的工廠。”企業(yè)經(jīng)常低估自身所需要付出的努力。

“人們能更好地理解工程,對(duì)用戶體驗(yàn)有這樣那樣的要求,但不知道為什么,人們對(duì)部署模型卻完全不同。人們會(huì)假設(shè)所有擅長(zhǎng)測(cè)試環(huán)境的數(shù)據(jù)科學(xué)家自然都會(huì)部署這些模型,或者可以派幾個(gè)IT員工來部署,這是錯(cuò)誤的。人們并不了解他們需要什么。”

很多企業(yè)也并不知道MLOps可能會(huì)給企業(yè)內(nèi)部其他方面帶來哪些連鎖反應(yīng),因此經(jīng)常導(dǎo)致企業(yè)內(nèi)部發(fā)生巨大的變化。

“你可以把MLOps放在呼叫中心,平均響應(yīng)時(shí)間實(shí)際上會(huì)增加,因?yàn)楹?jiǎn)單的事情交給了機(jī)器和人工智能來處理,而交給人類做的事情實(shí)際上需要更長(zhǎng)的時(shí)間,因?yàn)檫@些事情往往更復(fù)雜。所以你需要重新考慮這些工作是什么,你需要什么樣的人,這些人應(yīng)該具備什么樣的技能。”

Tripathy表示,如今,一個(gè)企業(yè)組織中只有不到5%的決策是由算法驅(qū)動(dòng)的,但這種情況正在迅速變化。“我們預(yù)計(jì)未來五年,將有20%到25%的決策是由算法驅(qū)動(dòng)的,我們看到的每一個(gè)統(tǒng)計(jì)數(shù)據(jù)都表明,我們處于人工智能快速擴(kuò)展的拐點(diǎn)上。”

他認(rèn)為,MLOps是關(guān)鍵的一個(gè)部分。如果沒有MLOps,你就無法始終如一地使用人工智能。MLOps是企業(yè)AI規(guī)?;拇呋瘎?。

猜你喜歡