版權歸原作者所有,如有侵權,請聯系我們

我,PPT設計師,AI讓我欲罷不能后,我閉嘴了 | AIGC新職業(yè)觀察

科普中國新媒體
原創(chuàng)
科普中國新媒體官方賬號
收藏

2024年春晚,伴隨著任素汐溫暖繾綣的歌聲,全國人民在觀看了春晚上首支AI視頻?!巴高^窗看一幕童話,枕著光芒的云下,晚風輕輕地吹過她的銀發(fā),他笑著等她一起慢慢走回家”,音樂里一對隨著音樂舞動的男女從青年走向暮年。

2024年中國中央廣播電視總臺春節(jié)聯歡晚會

鮮有人知的是,這樣感動人心的節(jié)目背后,是一個時限不到一個月,且不容出錯的高難度委托。

而 AI實現了這一看起來“不可能完成的任務”。

生成式人工智能技術的飛躍發(fā)展,使人工智能與人的合作達到了前所未有的深度和廣度。當我們不再只是抽象地談論科幻電影中的AI,那么AI早就已經悄悄開始改變著我們工作和生活了。鑒于此,科普中國推出系列對談,與業(yè)內人士聊聊AIGC有關的一切。

你是否好奇春晚作品《枕著光的她》的AI雙人舞是如何實現的?AI怎樣賦能設計師?這段視頻的幕后創(chuàng)作者、PPT設計師阿文在與我們的對談中分享了他的經驗。

他說:第一次用AI時,他完全沒有想到會有今天的光景——“我基本離不開AI了”。

以下是與阿文的對談整理。

圖庫版權圖片,轉載使用可能引發(fā)版權糾紛

AI是怎樣成為我工作的一部分的

Q:請阿文先簡單介紹您的工作。

阿文:我的本職工作是一名發(fā)布會的PPT設計師,我在北京有一家專門做PPT的設計工作室。另外我還是一名AI藝術家。

Q:你是從何時開始關注AIGC的?

阿文: 2022年4月我就開始關注AI了。因為我經常上微博沖浪,當時2022年4月一個叫DiscoDiffusion的工具在微博上流行,我和我身邊很多藝術家和好朋友都在使用。

Q:剛開始試用AIGC時,你對AI繪畫的最大能力是怎么設想的?

阿文:第一印象肯定是很震撼的,2022年的時候誰見過這種敲幾個字就能生成圖像的工具?所以我非常興奮,但當時AI生成圖片的質量還很一般,不夠高清,等DALLE-2出來之后,我才對這個工具有了完全不一樣的看法,覺得“它說不定能用在我們的工作中”,但也完全沒有想到會變成現在這個樣子——我的日常工作基本離不開AI了。至少在靜態(tài)圖像領域,AI是完全可用的狀態(tài)。

Q:AI幫助你做了什么事?

阿文:AI目前起最大作用的是我工作中一個非常重要的環(huán)節(jié)——找設計素材。發(fā)布會經常會做一些超寬屏的設計,但圖庫里很少有十幾米長的屏幕需要用到非常高清的大尺寸圖片素材。以往我們花費大量人工時間去合成大尺寸素材,現在只需要告訴AI,我想要什么尺寸的素材就可以了。

實際上在我主業(yè)做發(fā)布會PPT的工作流里,AI目前占比并不高,大概25%~30%。最近,我開始嘗試一些AI轉繪創(chuàng)作,這里AI在整個工作流中占了80%~90%。

圖庫版權圖片,轉載使用可能引發(fā)版權糾紛

Q:你的創(chuàng)作思路會因為AI的加入而改變嗎?

阿文:我好像變懶了。過去一個創(chuàng)作需求來了后,我會先自己想一下,現在我可能會下意識地先敲幾個關鍵詞喂給AI。相當于,我多了一個超強的助手。

Q:從AI那里獲得的圖,還需要人工改圖嗎?

阿文:一開始我們還需要把AI素材導入PS里“縫縫補補”,目前基本上能一次到位,我們幾乎都不改了。

Q:AI做PPT的工具你嘗試過么?

阿文:其實我們專業(yè)的PPT設計師不太會看得上這種工具生成的效果,也用不到。它更像是上班族應付領導的工作報告模版。

Q:什么時候開始做AI轉繪?

阿文:年初我和海辛老師接到了一個來自春晚節(jié)目組的委托,任素汐唱那首《枕著光的她》時,大屏要用一段雙人舞作為背景視頻投射在舞臺上,想要呈現一對兒男女隨著音樂跳舞,從青年到老年的情景。因為制作周期非常短,不到一個月,如果用傳統路徑做,無論是對兩個舞者做動捕掃描還是建模,都需要花費大量時間。當時春晚節(jié)目組想到用AI的方式看能否在極短的工期內做出“還不錯”的效果。最后我們做到了。

Q:具體怎么實現的?

阿文:執(zhí)行項目過程中,我們遇到了很多挑戰(zhàn)。

比如角色穩(wěn)定性問題。節(jié)目的設計是雙人舞三個階段變裝,包括結婚、婚后、老年三個階段。利用AI來實現絲滑的變裝是重要的需求。雙人舞之所以會難做,是因為AI會將兩個角色之間的特征進行混淆,所以經常會出現性別交換等問題。我們試了很多方法,最后利用ControlNettile模型固定下來人物的特征,解決了這個難題。

再比如瓷器材質的實現。我們在SDXL和Civitai開源模型和LoRa的加持下,很快確定選擇了白瓷材質的跳舞小人。但中間遇到了很多問題,就在我們以為得訓練SD1.5的瓷器 LoRa ,我們發(fā)現用一個 “關鍵詞” 就可以解決材質問題。除了關鍵詞以外,我們還發(fā)現了一個叫 IP-Adapter 的插件,可以用一張參考圖來引導AI生成指定材質效果。

另一個難題是換裝穩(wěn)定性測試,我們首先在PR里對齊了剪輯,在生成時通過prompttravel的方式(不同關鍵幀描述不同的內容)達到了節(jié)目組滿意的效果。

圖庫版權圖片,轉載使用可能引發(fā)版權糾紛

對AI的暢想

Q:現在的AI生成圖像還有哪些升級空間呢?

阿文:AI生成圖像我覺得已經到頭了。

Q:已經到您想象的邊界了嗎?

阿文:反正你任意把兩張圖片放在我面前,我可能已經沒辦法分辨出來哪個是AI(生成的)哪個是真的人創(chuàng)造的。

AI越發(fā)展,我就越分不清,連我們專業(yè)領域的設計師都是如此,那對于大眾來說,AI圖片的質量已經完全足夠了,AI作畫已經nextlevel了。其實對于AI發(fā)展,最高傲的就是我們這個群體,一開始我們大部分人瞧不起AI生成的圖像。就想“AI怎么可能比得上我們親自設計或畫出來的東西?”但越到后面就越會發(fā)現AI生成質量越來越好,當我們試了一下,簡直“欲罷不能”,而且它確實讓你的工作量減少,讓你效率變高了。然后我就慢慢閉嘴了。

不過非要說的話,需要跟ChatGPT這種文字大模型的能力再結合一下,讓文生圖模型能更好地理解“人話”。

現在我會比較多地做AI轉繪,做出偏油畫風的那種風格。比如說把上海場街景變成梵高里某幅名畫里的場景。

Q:AI能替代什么工作,以及什么是不能替代的?

阿文:重復勞動的肯定會被替代。比如你以前的工作每天都在摳圖,每做著跟創(chuàng)意毫無關系的工作,那你絕對會被替代。它替代不了的話肯定是一些比較軟的能力,比如創(chuàng)意。這樣的工種我覺得完全是沒辦法替代的,而且越到后面越拼的就是你個人的審美,你個人的內容審美或者設計審美,都會影響你最后的圖像作品。而目前AI它只能隨機帶來一些靈感,但是人類它是可以很主觀地輸出自己的審美,這是不能替代的。

我觀察到一個比較有意思的現象,兩年前一些外行去挑釁畫師,挑釁那些游戲原畫,挑釁設計師,說你們馬上就要失業(yè)了。但是兩年后的今天,你會發(fā)現OPENART社區(qū)里前十名的居然大部分是游戲原畫師和設計師。AI作畫最后爬向了金字塔頂頂尖,站在頂點的還是那群專業(yè)的人。

Q:你對AIGC的從業(yè)者有哪些建議?

阿文:不要太有被落下的焦慮。這個世界上每天每天都有新技術出現,根據我這大半年的觀察,等大家試用完之后撿漏,測試那個效果最好的工具,這樣才是一個高效的方式。

Q:你覺得AI能創(chuàng)造新職業(yè)嗎?

阿文:肯定會有的。但是目前來說,用AI比較多的是傳統設計師轉崗的。

Q:你覺得AI未來的天花板會是像人一樣嗎?還是說AI會有另一個發(fā)展方向?

阿文:我覺得他會超越人,因為AI光是知識儲備就已經遠超每一個人類了,甚至它可能是人類知識的總和。關鍵就回到了AI怎么去利用知識,我覺得AI超越人類可能只是時間問題。

Q:可以推薦大家一些您發(fā)現的AIGC有趣玩法嗎?

阿文:我用過最好用的AI翻譯插件是沉浸式翻譯,它能一鍵把所有外語網頁內容變成雙語翻譯,而且背后是大語言模型,翻譯特別精準;還推薦所有編程小白試試cursor,零代碼基礎也能寫網站寫應用!另外,我還想分享有一個想深度玩轉AIGC的朋友一款最應該入門的AI工具:comfyUI,入門之后,所有開源技術都是你的插件。

Q:最后你還有什么想分享的么?

阿文:我很想說,其實中國在AI領域的成就非常可怕,十分厲害。全世界范圍內,媒體們太過渲染國外大公司的模型能力了,忽略了那些低調卻閃閃發(fā)光的中國團隊。

其實開源社區(qū)里,至少在AI繪畫、AI視頻領域,有90%的組件是華人或者中國團隊寫出來的:LCM、AnimateDiff、instantID、IPadapter、LivePortrait等等等,更別說可靈了。其實外國開源社區(qū)是對中國團隊是非常敬畏的,但中國團隊一直很低調,在國內很少出圈,所以很多人總覺得中國的AI技術不行,打不過國外,其實在我看來完全不是!

策劃制作

作者丨凍頂烏龍 科普創(chuàng)作者

受訪對象丨Simon阿文 AbleSlide聯合創(chuàng)始人,AI藝術家

審核丨于旸 騰訊玄武實驗室負責人

內容資源由項目單位提供