技術(shù)擴(kuò)散能力在國家技術(shù)力量中非常重要,特別是在AI的背景下。有研究顯示,與美國分散且更利于擴(kuò)散的生態(tài)系統(tǒng)相比,中國的擴(kuò)散能力遠(yuǎn)遠(yuǎn)落后于創(chuàng)新能力——比后者排名低近30位。目前,中國正在計(jì)劃提高擴(kuò)散能力,重要方式是對AI教育進(jìn)行大規(guī)模投資,以培養(yǎng)中端、以工業(yè)為重點(diǎn)的AI勞動(dòng)力。
美國最近在大型語言模型(LLM)和擴(kuò)散模型方面取得了源源不斷的突破。這些成功推動(dòng)了美國風(fēng)險(xiǎn)投資對專注于科技和服務(wù)行業(yè)的生成式AI初創(chuàng)公司的激增,如HarveyAI、Jasper和Runway。美國的這種樂觀情緒與中國相對較慢的AI創(chuàng)業(yè)公司形成了鮮明對比。例如,有分析稱備受關(guān)注的阿里巴巴支持的初創(chuàng)公司零一萬物(01.AI)的語言模型在很大程度上是基于Meta的開源LLaMA基金會(huì)模型。
然而,中國在生成式AI領(lǐng)域的遲緩,可以解釋為政府將工業(yè)應(yīng)用置于服務(wù)業(yè)和傳統(tǒng)知識(shí)工作應(yīng)用之上的戰(zhàn)略優(yōu)先地位。特別是,政府希望通過工業(yè)部門的AI投資來對抗工業(yè)生產(chǎn)力增長的下降,以期擺脫中等收入陷阱。
為此,政府已要求教育部在國內(nèi)的工業(yè)部門推廣尖端的機(jī)器學(xué)習(xí)技術(shù)。因此,中國各大學(xué)開設(shè)了2300多個(gè)AI本科生項(xiàng)目,其中大多數(shù)是專注于工業(yè)應(yīng)用的應(yīng)用AI項(xiàng)目。教育部的AI高等教育包括兩個(gè)目標(biāo):
教育部對應(yīng)用AI高等教育項(xiàng)目的空前投資在于政府認(rèn)識(shí)到大多數(shù)專注于工業(yè)的AI公司面臨的一個(gè)根本問題:構(gòu)建特定行業(yè)的AI解決方案需要耗費(fèi)大量時(shí)間和資金,通常無法通過橫向商業(yè)模式實(shí)現(xiàn)。這個(gè)問題很普遍,因?yàn)槌嘶厥盏壤袠I(yè)(AMP Robotics等成功的西方初創(chuàng)公司已經(jīng)出現(xiàn))之外,大多數(shù)工業(yè)部門都有特定于公司的數(shù)據(jù)基礎(chǔ)設(shè)施。制造公司通常在稱為制造執(zhí)行系統(tǒng)(MES)和監(jiān)控與數(shù)據(jù)采集(SCADA)的軟件系統(tǒng)上運(yùn)行。這些系統(tǒng)往往結(jié)合了內(nèi)部工具和SAP或西門子等傳統(tǒng)供應(yīng)商構(gòu)建的軟件服務(wù)的混亂組合。
因此,為了構(gòu)建一個(gè)可以實(shí)際部署的AI模型,這些不同的系統(tǒng)必須首先通過跨系統(tǒng)的數(shù)據(jù)通道進(jìn)行統(tǒng)一。這項(xiàng)工作的大部分都是定制的,涉及在傳統(tǒng)的、斷開連接的系統(tǒng)之間構(gòu)建強(qiáng)大的數(shù)據(jù)通道的繁瑣過程,這些系統(tǒng)通常來自具有不同數(shù)據(jù)模式的不同提供商。只有完成了這項(xiàng)艱巨的工作,計(jì)算機(jī)視覺模型才能開始訓(xùn)練和部署。即使在這些復(fù)雜的數(shù)據(jù)通道建成后,對AI系統(tǒng)進(jìn)行工業(yè)流程培訓(xùn)也會(huì)帶來自身的挑戰(zhàn):
鑒于工業(yè)企業(yè)使用的產(chǎn)品和流程眾多,每個(gè)模型都必須在公司或產(chǎn)品線的特定系統(tǒng)上進(jìn)行培訓(xùn)。換言之,大規(guī)模、全行業(yè)的多樣性限制了工業(yè)AI解決方案的可擴(kuò)展性。
此外,每當(dāng)一家公司改變流程或轉(zhuǎn)向新產(chǎn)品時(shí),該公司不僅必須建立新的制造流程,還必須重新培訓(xùn)其計(jì)算機(jī)視覺模型——如果這是一個(gè)沒有大量現(xiàn)有培訓(xùn)數(shù)據(jù)的新產(chǎn)品或流程,這通常是一項(xiàng)艱巨的任務(wù)。因此,如果沒有一個(gè)穩(wěn)健的數(shù)據(jù)集來調(diào)整新過程的機(jī)器學(xué)習(xí)算法,制造商往往被迫手動(dòng)測試和生成體能訓(xùn)練數(shù)據(jù),直到模型變得足夠可靠。
在工業(yè)AI領(lǐng)域,由于需要不斷更新、客戶規(guī)模有限以及高昂的前期成本,軟件即服務(wù)(SaaS)公司利潤豐厚的經(jīng)濟(jì)效益不再適用。李開復(fù)的AI產(chǎn)業(yè)初創(chuàng)公司創(chuàng)新奇智(AInnovation),為中鋼國際和建筑巨頭中鐵四號(hào)等工業(yè)企業(yè)開發(fā)AI系統(tǒng)。隨著創(chuàng)新奇智擴(kuò)大其客戶群,它被迫增加軟件支出,部署更多專有的低利潤硬件,導(dǎo)致毛利率從2018年的62.9%暴跌至2020年的29.1%。
由于工業(yè)部門的AI不能通過一刀切的橫向解決方案來采用,該行業(yè)需要一大批新的中級AI人才——比一般的數(shù)據(jù)分析師更熟練,但比ML工程師和研究人員成本更低。中國的AI教育戰(zhàn)略旨在填補(bǔ)這一應(yīng)用AI人才的利基市場,以便每家工業(yè)公司都可以聘請內(nèi)部團(tuán)隊(duì)來構(gòu)建自己的機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施。