DeepSeek R1的推出加快了大語言模型在生成式人工智能領(lǐng)域的商品化和多極化,使未來數(shù)據(jù)管理戰(zhàn)略的重點(diǎn)轉(zhuǎn)向了人工智能(AI)就緒度和數(shù)據(jù)主權(quán)。Gartner預(yù)測(cè),到2028年,80%的生成式AI(GenAl)業(yè)務(wù)應(yīng)用將在企業(yè)現(xiàn)有的數(shù)據(jù)管理平臺(tái)上開發(fā),從而使部署的復(fù)雜度和交付時(shí)間降低50%。到2028年,50%的AI數(shù)據(jù)管理工作內(nèi)容將是管理數(shù)據(jù)主權(quán)和多極化AI所帶來的偏見,使其至少符合三個(gè)地區(qū)的法規(guī)。
DeepSeek將其R1模型做成開源模型并顯著降低了推理和訓(xùn)練成本,引領(lǐng)了大語言型格局的變革。其實(shí)在DeepSeekR1推出之前,大語言模型的價(jià)格在過去兩年中就已大幅下降。
Gartner高級(jí)研究總監(jiān)顧星宇表示:“這些創(chuàng)新勢(shì)必引發(fā)一波成本和能耗下降,進(jìn)一步壓低大語言模型價(jià)格,加速模型的商品化。這一戰(zhàn)略性舉措不僅使大語言模型更加觸手可及,而且促進(jìn)了AI技術(shù)格局的全球演變。在這種情況下,特定的大語言模型將不再被視為企業(yè)取得GenAl成功的關(guān)鍵差異點(diǎn)。相反,其他企業(yè)難以獲得或復(fù)制的獨(dú)特內(nèi)部數(shù)據(jù)將成為AI之旅成功的唯一競(jìng)爭優(yōu)勢(shì)。”
圖1:企業(yè)數(shù)據(jù) - AI平臺(tái)的價(jià)值金字塔
AI提供商的多極化給各企業(yè)機(jī)構(gòu)帶來了數(shù)據(jù)管理挑戰(zhàn),包括更復(fù)雜的數(shù)據(jù)主權(quán)和合規(guī)要求以及對(duì)影子AI和偏見的數(shù)據(jù)治理。企業(yè)必須積極加強(qiáng)數(shù)據(jù)管理戰(zhàn)略,以降低風(fēng)險(xiǎn)并充分利用AI演進(jìn)動(dòng)態(tài)帶來的機(jī)遇。
模型提供商的多極化需要更加穩(wěn)健和合理的數(shù)據(jù)主權(quán)和合規(guī)管理
作為一家中國公司,DeepSeek利用其特定的訓(xùn)練數(shù)據(jù),滿足了中國及周邊市場(chǎng)特有的語言、文化和監(jiān)管要求。這種方法建立了一個(gè)獨(dú)特的“極點(diǎn)”,使其區(qū)別于美國流行的GPT-4和Gemini,特別是在法律、政治、文化和技術(shù)方面,其中許多與數(shù)據(jù)有關(guān)。這種多極化引起了人們對(duì)AI治理和偏見的擔(dān)憂,特別是在全球政治環(huán)境不確定的情況下。
Gartner研究副總裁孫鑫表示:“多極化生態(tài)系統(tǒng)有助于打破壟斷控制,鼓勵(lì)創(chuàng)新和韌性,但同時(shí)也需要有系統(tǒng)的數(shù)據(jù)管理框架,以及與數(shù)據(jù)生態(tài)系統(tǒng)供應(yīng)商建立強(qiáng)有力的伙伴關(guān)系,以確保符合數(shù)據(jù)合規(guī)和數(shù)據(jù)主權(quán)的要求。”
知識(shí)源與大語言模型的脫鉤已變得至關(guān)重要
一些GenAl的早期采用者已開始咨詢?nèi)绾斡肈eepSeek R1替換現(xiàn)有GenAI應(yīng)用中的大語言模型,這表明他們之前用的與大語言模型緊密耦合的GenAI應(yīng)用正在成為沉沒成本。R1發(fā)布后不到兩周,OpenAl和Google就分別于2025年2月1日和2月5日發(fā)布了最新的大語言模型——o3 mini和Gemini 2.0.企業(yè)不應(yīng)將任何特定大語言模型(包括DeepSeek R1)視為其GenAl計(jì)劃中的永久組成部分。
Gartner高級(jí)研究總監(jiān)方琦表示:“數(shù)據(jù)和分析(D&A)領(lǐng)導(dǎo)者應(yīng)該與AI領(lǐng)導(dǎo)者合作,采用更強(qiáng)健的架構(gòu),將大語言模型和企業(yè)內(nèi)部知識(shí)源慢慢脫鉤。集中管理AI相關(guān)的數(shù)據(jù)戰(zhàn)略有助于減少知識(shí)孤島,從而在AI計(jì)劃規(guī)模擴(kuò)大后提高數(shù)據(jù)治理的效率。”
將無監(jiān)督AI使用作為企業(yè)運(yùn)營的新常態(tài)
AI推理成本的大幅降低,減少了業(yè)務(wù)用戶與企業(yè)數(shù)據(jù)交互的障礙。圍繞DeepSeek的媒體宣傳已經(jīng)導(dǎo)致員工不受管理地使用DeepSeek應(yīng)用(如移動(dòng)設(shè)備和聊天機(jī)器人)。AI正勢(shì)不可擋地涌向業(yè)務(wù)的每一個(gè)角落。在這種新常態(tài)下,以控制為重點(diǎn)的數(shù)據(jù)治理流程正迅速變得過時(shí),并且會(huì)阻礙員工的數(shù)據(jù)驅(qū)動(dòng)型創(chuàng)新。
數(shù)據(jù)編織領(lǐng)域的主動(dòng)元數(shù)據(jù),特別是運(yùn)行時(shí)元數(shù)據(jù)(操作元數(shù)據(jù)和社交元數(shù)據(jù))的管理,是使數(shù)據(jù)管理團(tuán)隊(duì)始終處于企業(yè)數(shù)據(jù)使用前沿的關(guān)鍵方法。Gartner高級(jí)研究總監(jiān)顧星宇表示:“為了應(yīng)對(duì)這些挑戰(zhàn),D&A領(lǐng)導(dǎo)者應(yīng)優(yōu)先考慮有助于跨平臺(tái)輸出和導(dǎo)入元數(shù)據(jù)的工具,從而支持更廣泛的協(xié)調(diào)和優(yōu)化。評(píng)估當(dāng)前的數(shù)據(jù)管理能力對(duì)于支持高級(jí)元數(shù)據(jù)功能,尤其是運(yùn)行時(shí)元數(shù)據(jù)共享和元數(shù)據(jù)標(biāo)準(zhǔn),以確保互操作性。”
擁抱云部署,獲得最佳數(shù)據(jù) - AI平臺(tái)
DeepSeek降低了推理成本,因此可以在各種基礎(chǔ)設(shè)施(包括本地甚至個(gè)人計(jì)算機(jī))上進(jìn)行部署。然而,云數(shù)據(jù)生態(tài)系統(tǒng)提供了獨(dú)特的優(yōu)勢(shì),包括以較低的前期成本試驗(yàn)新數(shù)據(jù)管理技術(shù)的機(jī)會(huì),以及快速適應(yīng)新AI模式的能力。因此,當(dāng)前總體趨勢(shì)仍然傾向于GenAI應(yīng)用的云部署。
在考慮部署涉及內(nèi)部數(shù)據(jù)的GenAl業(yè)務(wù)應(yīng)用時(shí),企業(yè)應(yīng)同時(shí)評(píng)估云部署和本地部署,以確定最適合其需求的方法。
提升數(shù)據(jù)管理團(tuán)隊(duì)的數(shù)據(jù)和AI素養(yǎng),充分利用推理模型
DeepSeek R1仍然會(huì)產(chǎn)生幻覺,但其推理能力使人類能夠以更透明、更高效的方式檢查其輸出內(nèi)容。這意味著,在數(shù)值預(yù)測(cè)、代碼開發(fā)、數(shù)據(jù)工程等重要業(yè)務(wù)流程中,GenAl的采用將逐漸增加,但要經(jīng)過人工審查。
D&A領(lǐng)導(dǎo)者應(yīng)該為這一變化做好準(zhǔn)備,提高數(shù)據(jù)管理專家的技能水平,使其能夠使用由推理模型賦能的AI增強(qiáng)功能。