1. “超人”是誰?
最近,ChatGPT在地球村里爆發(fā)啦!沖擊波不小,很“炸”。一時間,ChatGPT成了各類網(wǎng)民追捧的明星。很多小伙伴、特別是像我之流的“科研民工”都在想著體驗一下這個新鮮事物,看看他能不能替自己把科研論文和項目標書給寫嘍。個中原因是ChatGPT太能干啦,簡直就像是一個“超人”!
ChatGPT是英文“Chat Generative Pre-trained Transformer”的簡稱,直接翻譯過來的意思是“聊天生成型預(yù)訓(xùn)練變換模型”。乍一看,不像是“人”。其實,ChatGPT是由人工智能公司OpenAI基于谷歌開發(fā)和訓(xùn)練的變換語言模型,目的是使用人工智能算法中的深度學(xué)習(xí)方法,生成人類可以理解的自然語言,并以對話的方式與真人進行交互。簡單而言,他就是一個“無事不通、無事不曉”的聊天機器人,就像我們說的“萬事通”。
所以,我把他叫做“超人”。如果從其英文名ChatGPT的音譯來近似稱呼的話,不妨叫他“猜不透”——意思嘛,就是猜不透他有多能耐。
2. 他到底有多能耐?
“猜不透”是一種基于人工智能的聊天機器人,可以像跟人聊天一樣跟你聊天。他可以隨時解答你日常生活、工作和學(xué)習(xí)中的大部分問題。他不僅可以靈活自如地應(yīng)對各種主題,而且還擁有超高的情商和智商。“猜不透”在語言智商測試中的測試智商為147,而一般正常人的智商測評分數(shù)在90~110分之間,140以上是屬于非常優(yōu)秀的水平。
這里所說的人工智能嘛,就是一種讓機器可以模擬人類智慧的技術(shù)?!安虏煌浮钡墓ぷ髟硎腔谏疃葘W(xué)習(xí)算法和大規(guī)模數(shù)據(jù)訓(xùn)練的。也就是說,他在訓(xùn)練過程中吸取了大量的語言數(shù)據(jù),并通過內(nèi)部的算法來預(yù)測和生成文本。他是人工智能技術(shù)驅(qū)動的自然語言處理工具,能夠通過學(xué)習(xí)和理解人類的語言來進行對話,真正像人類一樣來聊天交流。他既能完成包括寫代碼、修bug(代碼改錯)、翻譯文獻、寫小說、寫商業(yè)文案、創(chuàng)作菜譜、做作業(yè)、評價作業(yè)、寫論文(“科研民工”們是不是心動顏開了)等一系列常見文字輸出型任務(wù),而且在和用戶對話時,能記住對話的上下文,反應(yīng)非常逼真。
當(dāng)你與“猜不透”進行對話時,他會根據(jù)你的輸入來生成回應(yīng)答案。這些回應(yīng)有時候可能會出乎你的意料,但它們都基于“猜不透”之前所接觸的數(shù)據(jù)和模式。只要你提供的信息符合“猜不透”之前所接觸過的內(nèi)容,他就會給你一個合理的回答??梢哉f,他能幫助我們解決各種問題。叫他“萬事通”,一點也不過分。
3. 他這么能耐,是怎么做到的?
“猜不透”通過吸收大量來自網(wǎng)絡(luò)的內(nèi)容,包括成千上萬的維基百科條目、社交媒體帖子和新聞文章,來學(xué)習(xí)句子、單詞和部分單詞之間的關(guān)系。他的“大腦”里的神經(jīng)網(wǎng)絡(luò)包含至少1750億個參數(shù),為有史以來參數(shù)最多的神經(jīng)網(wǎng)絡(luò)模型。正常人的腦細胞大約有140億~150億個。從我這個“識數(shù)的人”來看,以“猜不透”的1750億對人類的150億,“猜不透”真的比人類的大腦要厲害得多啦?。▽嶋H上并不能這么簡單比較哦)
“猜不透”以模擬人類智慧的方式進行學(xué)習(xí)、交流和創(chuàng)作。這些活動,可分為七個學(xué)習(xí)過程:認識、記憶、試操、熟練、創(chuàng)造、檢驗與保持。也就是說,初始階段是記憶他人的間接經(jīng)驗、模仿他人的行為,然后就會嘗試積累自己的直接經(jīng)驗(可能真實的情況是,更多的是教訓(xùn))、創(chuàng)造自己的知識,并不斷試錯、修正、完善經(jīng)驗知識,形成可以重復(fù)驗證的知識。
創(chuàng)新的前提是學(xué)習(xí)。學(xué)習(xí)就需要有大量的知識供學(xué)習(xí),還需要有很好的記憶力和理解力來學(xué)習(xí);創(chuàng)新則需要豐富的聯(lián)想力和判斷力來完成。
不管是超人“猜不透”還是普通人,上述過程可以歸納為三個要素:知識、算法和算力。
“猜不透”之所以是“超人”,首先就是因為他學(xué)到的知識遠遠超過了一個普通人;他的知識是全人類的知識總和,目前有著超過萬億單詞的人類語言數(shù)據(jù)集。并且,在和人類聊天過程中還在不斷地學(xué)習(xí)、積累新知識。因此,“猜不透”的知識儲備和學(xué)習(xí)能力是驚人的。其次,他利用了各種人工智能算法,這些算法保證了他在處理問題的時候一般不會出錯,也就是說他的思考和處理知識的邏輯性會大大超過普通人。再次,他的算力夠強,這里的算力指的是他處理問題的速度,這個就受到計算機硬件設(shè)備性能的限制了。在算力方面,目前“猜不透”總算力消耗約3640 PF-days(即每秒一千萬億次計算,運行3640個整日),訓(xùn)練成本預(yù)計在500萬美元/次。這僅僅指的是“猜不透”在訓(xùn)練階段消耗的算力。就目前的服務(wù)器處理能力來看,大概是幾十到幾百臺GPU級別的服務(wù)器的體量才能夠?qū)崿F(xiàn),而且需要幾日甚至幾十日的訓(xùn)練。需要7~8個投資規(guī)模30億、算力500P的數(shù)據(jù)中心才能支撐運行。這里的P是指礦機算力的單位,是1PH/s的簡寫;1P約等于每秒1000萬億次的計算速度。而且,聊天嘛,不能我說一句話,等你半天才回應(yīng);運算速度和網(wǎng)絡(luò)傳輸速度都必須足夠快才行??梢?,“猜不透”的算力是非常驚人的。遺憾的是,即使對于人類目前擁有的少數(shù)“超強大腦”來說,“絞盡腦汁”也無法與“猜不透”的算力相媲美。
更可怕的是:“不怕學(xué)霸學(xué)習(xí)好,就怕學(xué)霸好學(xué)習(xí)”(請參看我的微信公眾號“醫(yī)用生物力學(xué)”里的相關(guān)文章)。“猜不透”一直在不停地學(xué)習(xí)和升級。早在2017年,人工智能研究公司OpenAI就發(fā)布了GPT-1,是一個能夠生成人類文本的語言處理模型,其在預(yù)測下一個單詞的任務(wù)中表現(xiàn)出色。2019年,OpenAI發(fā)布了GPT-2模型,其可生成高質(zhì)量的自然語言文本,但因擔(dān)心濫用而未公開全部模型參數(shù)。2020年,OpenAI發(fā)布了GPT-3模型,是當(dāng)時最大的自然語言處理模型,擁有1.75萬億個參數(shù),能夠執(zhí)行各種語言任務(wù),如對話、翻譯、摘要等。2022年12月,一個名為“ChatGPT”的GPT-3.5誕生,他就像一條“鯰魚”攪動了整個市場。在5天之內(nèi)吸引了100萬用戶;然后在2個月內(nèi)吸引了1億用戶。從上線開始算,到達1億用戶,TikTok花了大約9個月,Instagram花了大約兩年半,而ChatGPT只用了60天。2023年3月14日,OpenAI公布了最新版本——GPT-4。GPT-4產(chǎn)生正確回應(yīng)的可能性要比GPT-3.5高出40%,新模型將產(chǎn)生更少的錯誤答案,更少地偏離談話軌道,更少地談?wù)摻稍掝}。長江后浪推前浪,ChatGPT的新版本不斷把舊版本拍到沙灘上。
盡管如此,“猜不透”從出生到成長到現(xiàn)在,畢竟還是個新事物,也就相當(dāng)于人類的嬰幼兒階段,還沒有準備好做任何重要的事情!不過,他一直在不斷進化之中。短期內(nèi)“猜不透”的發(fā)展方向可能成為每一個人的工作、學(xué)習(xí)以及生活的助理,反過來又進一步充實他自身的知識和算法,讓他變得越來越智能、越來越聰明。無法想象,不久的將來,“猜不透”這個“超人”會聰明絕頂而“膨脹”到什么程度?!
4. 面對“超人”,我們能做什么?
如果你把“猜不透”僅僅看成一個用來聊天解悶的網(wǎng)友,那就白白浪費了這個“超人”的超人能耐啦!
“猜不透”不僅給人工智能領(lǐng)域注入了一針強心劑,而且也給我這樣的“科研民工”打上了一針興奮劑。
我就在想啊……
敲黑板,劃重點!
目前的科研創(chuàng)新模式,大致是靠個人或者團隊的比拼而艱苦奮斗來實現(xiàn)的。這其中,人們學(xué)習(xí)知識的過程必然花費很長的時間,僅僅是掌握必要的專業(yè)知識就疲于應(yīng)付了,更別說精通多學(xué)科的復(fù)雜知識了。這就大大限制了科技進步的快速發(fā)展。特別是在面臨“百年未有之大變局”的時候,“我兔”需要解決很多“卡脖子”的重要科學(xué)技術(shù)問題,小眾的力量總是顯得力不從心、難以應(yīng)付。
從認識“猜不透”那一刻起,我想到了一個針對上述問題的解決方案?!安虏煌浮笔莻€匯集全人類智慧的一個“超人”,能不能把“猜不透”拿來做科研呢?咱就是說,“我兔”自己孕育一個親生的“超人”,專門解決科學(xué)研究的“卡脖子”問題。我們這些“科研民工”每天苦哈哈地“挖礦”搞創(chuàng)新,還難有什么成果,不如把各自積累的一點點經(jīng)驗知識(也就是數(shù)據(jù))都交給“超人”,讓他替我們記憶、學(xué)習(xí)、分析、創(chuàng)新。反過來,“超人”可以為每個“科研民工”提供想要的資源和解決方案。要知道,科研的初級階段就是枯燥的、大量的學(xué)習(xí)知識和積累數(shù)據(jù),然后才是創(chuàng)新聯(lián)想和邏輯推理;而人工智能的大部分工作是構(gòu)建數(shù)據(jù)庫,然后才是利用算法進行數(shù)據(jù)處理和分析、得出決策結(jié)果。人機結(jié)合起來,往往能優(yōu)勢互補,發(fā)揮各自更大的潛力,從此開啟科研創(chuàng)新的新模式。
這個“新生兒”的養(yǎng)育,需要每個人的奉獻和努力,更需要國家層面的組織和管理,涉及到政策和技術(shù)層面的頂層設(shè)計。畢竟,這樣一個“超人”會動了絕大多數(shù)人的奶酪。親,你能接受嗎?我想聽到:YES, I DO!
穿過人海,別停下來,趁現(xiàn)在還有期待……