當(dāng)新的工具、新模態(tài)、新技術(shù)出現(xiàn)時(shí),望洋興嘆的同時(shí)要學(xué)會(huì)“如何正確去用”。AI的本質(zhì)是讓傳統(tǒng)的行業(yè)有信心落地自己的人工智能,否則人工智能就被妖魔化了。
撰文/雷濤 編輯/趙天宇
雷濤(天云數(shù)據(jù)董事長(zhǎng),博士后工作站企業(yè)導(dǎo)師,中關(guān)村高聚人才,“吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)”獲得者,擁有30多年的IT從業(yè)經(jīng)驗(yàn),于2010年開始對(duì)分布式數(shù)據(jù)和機(jī)器學(xué)習(xí)進(jìn)行產(chǎn)品研發(fā),主導(dǎo)并參與中國移動(dòng)、中國聯(lián)通、工商銀行總部等多個(gè)億級(jí)大型信息化項(xiàng)目規(guī)劃建設(shè)。)
“十月懷胎、一朝分娩”。3月16日,被稱為中國版ChatGPT的百度“文心一言”正式發(fā)布。從現(xiàn)場(chǎng)展示來看,文心一言在回答的準(zhǔn)確性、邏輯性、流暢性都逐漸接近人類水平。而發(fā)布會(huì)后,外界也呈現(xiàn)出褒貶不一的評(píng)價(jià),一時(shí)間成為社會(huì)關(guān)注的熱點(diǎn)。
今年以來,與AI有關(guān)的話題不斷出圈,關(guān)注度爆火:先是ChatGPT引發(fā)全民“聊天熱”,而后是號(hào)稱“最先進(jìn)的人工智能系統(tǒng)”的GPT-4發(fā)布;國內(nèi)大廠則紛紛跟進(jìn)新產(chǎn)品蓄勢(shì)待發(fā)。不管你是否關(guān)注科技新聞,是否使用過“ChatGPT們”,但你一定聽過以下幾種關(guān)于通用AI產(chǎn)品的言論和判斷。
▲3月16日,被稱為中國版ChatGPT的百度“文心一言”正式發(fā)布
極度神話論:通用AI將給人類帶來顛覆性的影響,所有基于認(rèn)知的工作都會(huì)被AI取代,通用AI會(huì)成為電影黑客帝國中的Matrix,變?yōu)闄C(jī)器人用來奴役人類的系統(tǒng)。
嚴(yán)重矮化論,典型的“酸葡萄”心理,認(rèn)為目前通用AI依然不值一提,ChatGPT不過是加強(qiáng)版的搜索引擎,逃脫不了“人工智障”的宿命。
過度悲觀論, 歐美AI屬于精英路線,“出生即王炸”,加上國內(nèi)GPU禁運(yùn)、芯片封鎖、“光刻機(jī)卡脖子”等客觀現(xiàn)狀,認(rèn)為中國AI還沒出生就輸了。
ChatGPT的火爆如同七年前的AlphaGo一樣,AlphaGo并不意味著AI就只能下圍棋,ChatGPT也不意味著AI只能聊天,它們的真實(shí)目標(biāo)都是工程領(lǐng)域。市場(chǎng)之所以會(huì)兩極分化,是因?yàn)闆]有自己的認(rèn)知體系,缺乏對(duì)科技行業(yè)的深刻的了解,看到的、聽到的只能算行業(yè)的冰山一角。作為一名資深產(chǎn)業(yè)從業(yè)者,必須要對(duì)“ChatGPT們”實(shí)現(xiàn)文藝復(fù)興時(shí)的祛魅。
首先,ChatGPT的成功得益于Transformer框架,但Transformer框架不是OpenAI做的。該框架源于2017年的一篇科研論文《Attention is all your need》,目前Hugging Face上Transformer開源框架的模型有13萬多,并且還在持續(xù)增加中。ChatGPT所基于的GPT-3模型在2021年被發(fā)現(xiàn)。Google和Meta處于開源的狀態(tài),因而無論哪家公司去做ChatGPT,其理論基礎(chǔ)都是相同的。GPT-4、文心一言亦或正在路上的國內(nèi)其他大廠產(chǎn)品“存在即合理”。
其次,要把通用AI“去神秘化”,就必須回歸技術(shù)工程的本質(zhì)。大模型只是一個(gè)語言模型,當(dāng)我們拿到大語言模型并不能夠在邏輯上去判斷什么。而在行業(yè)實(shí)踐,工業(yè)也好金融也好,是需要有很深入的邏輯判斷的,而且這些邏輯是在我們?nèi)祟惖闹R(shí)結(jié)構(gòu)里的。如果想把這些知識(shí)結(jié)構(gòu)構(gòu)建成知識(shí)圖譜,成本很高。原來我們可能用一堆歸納方法陳述了一堆邏輯,現(xiàn)在我們可以用聯(lián)結(jié)主義。
舉個(gè)例子來說,中國石化要整理大概 400 多萬篇科技文獻(xiàn),這些科技文獻(xiàn)用來支持企業(yè)測(cè)井、勘測(cè)的相關(guān)業(yè)務(wù)。但這些內(nèi)容專業(yè)化程度很強(qiáng),知識(shí)抽象也無法以簡(jiǎn)單的聊天形式表達(dá)出來。這時(shí)通用AI的作用就體現(xiàn)了,先把幾千篇文檔扔給專業(yè)人員去做語義標(biāo)注,他關(guān)心什么以及什么關(guān)系,用標(biāo)簽用標(biāo)注,然后遷移到4.8億文本數(shù)據(jù)量的大模型上做定義。
再比如說給券商做PNN募集說明要素識(shí)別、國債收益率預(yù)測(cè)、財(cái)務(wù)粉飾模型,都是標(biāo)注、抽取,抽取完了以后的內(nèi)容,再放回結(jié)構(gòu)化的知識(shí)圖譜,快速構(gòu)建知識(shí)圖譜。
▲ 如今GPU板卡不再是算力中心基礎(chǔ)設(shè)施的唯一選擇
最后,算法已經(jīng)迭代,新興的底層算法的邏輯使硬件的計(jì)算環(huán)境發(fā)生變化。在實(shí)測(cè)中,利用商用CPU進(jìn)行DNN訓(xùn)練的速度可以比頂級(jí)GPU訓(xùn)練快15倍,不局限于矩陣乘法的訓(xùn)練方法下,GPU可以被CPU替代。所以GPU禁運(yùn)可能就不是問題了,軟件層面的突破和底層邏輯,其實(shí)可以打破很多邊界。
ChatGPT是信息時(shí)代的產(chǎn)物,它的出現(xiàn)必然會(huì)帶來信息效率的提升,但我們沒有必要對(duì)它進(jìn)行過度解讀。因?yàn)樾畔⒈旧硭嵌鄻有缘?,一旦被你的需求?dǎo)向,就像波粒二象性一樣只能服務(wù)于目標(biāo)。
所以你會(huì)發(fā)現(xiàn),一個(gè)琳瑯滿目的門戶網(wǎng)站,很殘酷地被一個(gè)簡(jiǎn)單的搜索框淘汰掉。甚至更多基于概率方法的算法,開始被先驗(yàn)決定后驗(yàn)的方法所替代,比如淘寶的商品選擇。然而,這也會(huì)帶來另外一個(gè)問題:小概率事件的大概率呈現(xiàn),最后,我們自己把自己編織在一個(gè)文化繭里。
影響喬布斯的有一本書叫《禪與摩托車維修藝術(shù)》,核心講的就是兩個(gè)跨界的連接,所以一定要把理性的思考和感性的追求相平衡。當(dāng)新的工具、新模態(tài)、新技術(shù)出現(xiàn)時(shí),望洋興嘆的同時(shí)要學(xué)會(huì)“如何正確去用”。AI的本質(zhì)是讓傳統(tǒng)的行業(yè)有信心落地自己的人工智能,否則人工智能就被妖魔化了。
出品:科普中央廚房
監(jiān)制:北京科技報(bào) | 北科傳媒
歡迎分享到朋友圈
公眾號(hào)、報(bào)刊等轉(zhuǎn)載
請(qǐng)發(fā)郵件至bjkjbeditor@163.com
未經(jīng)授權(quán)謝絕轉(zhuǎn)載,違者必究