“AI繪畫會(huì)替代掉大部分從業(yè)者。”
在各種Diffusion模型掀起一波又一波AI作畫輿論高潮的當(dāng)下,世界圍棋冠軍柯潔如是說(shuō)。
而作為經(jīng)歷過(guò)被AI打敗、吐槽“受夠了AI圍棋”的他,在看到AI“入侵”繪畫行業(yè)后,更是將二者做了個(gè)比較:
圍棋從某種角度上來(lái)解讀的話,生存環(huán)境要比繪畫好一些。
如此一番言論,著實(shí)引來(lái)了不小的圍觀,畢竟正如網(wǎng)友所言,“初代AI受害者現(xiàn)身說(shuō)法”。
柯潔何出此言?
很簡(jiǎn)單,因?yàn)锳I作畫這事最近著實(shí)有點(diǎn)太火了。
從谷歌家的Imagen、OpenAI出的DALL·E系列開(kāi)始,它們便成為了網(wǎng)友們整活熱捧的AI內(nèi)容生成神器。
加之后來(lái)基于diffusion模型衍生的各種“新玩法”:Disco Diffushion、Stable Diffusion……“AI繪畫”一下子更大范圍地轟入大眾的視野。
而且與之相關(guān)的種種輿論消息也是不斷。
例如一位小哥用AI繪畫工具M(jìn)idjourney生成的作品拿下藝術(shù)比賽一等獎(jiǎng),主辦方還照常頒獎(jiǎng)了,直接惹怒人類藝術(shù)家。
或許正因如此,柯潔在直播開(kāi)場(chǎng)中也介紹說(shuō)“我最近一直在觀察AI繪畫”:我沒(méi)有過(guò)多關(guān)注AI繪畫本身的能力,因?yàn)槲覍?duì)它的能力不會(huì)有任何懷疑。
但AI繪畫并不是什么新鮮的事情,我最早接觸它已經(jīng)是2年前的事情了。
當(dāng)時(shí)柯潔的朋友跟他提及AI繪畫有多么多么厲害,不過(guò)那時(shí)的他還是對(duì)此打了一個(gè)問(wèn)號(hào)——
這東西能商業(yè)嗎?好像沒(méi)有什么前景啊?
結(jié)果現(xiàn)在的事實(shí)卻是,大量資本正在涌入AI繪畫。
正如前不久Stable Diffusion背后公司Stability AI曝出再融資1億美元的消息,直接在圈里炸開(kāi),更是讓它的估值飆升至10億美元。
不過(guò)讓柯潔覺(jué)得非常搞笑的一點(diǎn),還是相關(guān)從業(yè)者對(duì)AI的認(rèn)知和言論:有些人認(rèn)為,我學(xué)美術(shù)不是為了賺錢的,是為了夢(mèng)想和價(jià)值。
對(duì)抱有這種想法的從業(yè)者,柯潔給予了肯定:“牛逼”。與此同時(shí),柯潔也發(fā)表了不一樣的看法:但對(duì)于一些“俗人”來(lái)講,一個(gè)行業(yè)的滅亡就是從沒(méi)有利潤(rùn)空間開(kāi)始的。
大部分人還是要通過(guò)繪畫、美術(shù)來(lái)吃飯賺錢的呀。很多人還是會(huì)覺(jué)得市場(chǎng)沒(méi)有需求,我學(xué)它做什么呢?
然后柯潔對(duì)于前者“夢(mèng)想價(jià)值論”的發(fā)言者,再次用“搞笑”來(lái)形容,并表示:扶戈威武士,我都自嘆不如。
在柯潔看來(lái),圍棋都是必須要商業(yè)化的,唯有如此,行業(yè)才能得以持續(xù)。
至于“AI繪畫是否會(huì)替代人類”這個(gè)問(wèn)題,柯潔也在直播中給出了他的觀點(diǎn):不可能完全替代,但會(huì)替代掉大部分從業(yè)者。
而且替代程度和圍棋還不太一樣。圍棋是具備競(jìng)技和文化屬性的,美術(shù)雖然也有文化屬性,但缺乏競(jìng)技屬性。
圍棋的生存環(huán)境要比繪畫好一些。
一石激起千層浪
柯潔的一番言論,確實(shí)引發(fā)了網(wǎng)友們的熱議。
對(duì)于“AI繪畫”和“AI圍棋”這兩件事情來(lái)說(shuō),貼吧網(wǎng)友給出了一點(diǎn)不同之處:
AI圍棋目的是贏你,讓你不爽。
而AI繪畫為你服務(wù),讓你感覺(jué)獨(dú)一無(wú)二,讓你爽。
也有網(wǎng)友贊同柯潔的觀點(diǎn),認(rèn)為“畫師可比棋手慘太多了”:
棋手參加的是體育競(jìng)技,只需要在比賽層面上禁掉AI棋手就永遠(yuǎn)有飯吃。
畫師就不一樣了,那是商稿產(chǎn)出,一旦AI能低成本滿足商稿需求那對(duì)應(yīng)的畫師必定會(huì)沒(méi)飯吃。
知乎博主“zpeng”在看完柯潔的直播后認(rèn)為,“他想回答的意思是資本很喜歡AI畫畫這件事”。
而后他對(duì)于諸如Stability.AI這樣的公司,如何通過(guò)AI繪畫來(lái)盈利發(fā)表了他的看法(以下觀點(diǎn)內(nèi)容經(jīng)過(guò)授權(quán))。
其實(shí)做生成圖片的大佬還有DallE2和Imagen這兩家。它們分別是微軟家的OpenAI和谷歌家的DeepMind的團(tuán)隊(duì)弄出來(lái)的。
國(guó)內(nèi)微軟的nuwa也很棒,可以將清明上河圖擴(kuò)展。同期華為、百度都在做中文的生成模型。
我想大家也很清楚,這些團(tuán)隊(duì)的科學(xué)家的價(jià)錢都不低。聊完資本對(duì)于生成圖這種東西的態(tài)度,再說(shuō)說(shuō)游戲公司。
這段時(shí)間有一些團(tuán)隊(duì)帶著它們的需求和我溝通,我大概羅列如下:
對(duì)于舊圖優(yōu)化渲染;
原畫轉(zhuǎn)3D視圖;
對(duì)于場(chǎng)景設(shè)計(jì)自動(dòng)化;
對(duì)于不同陣營(yíng)的設(shè)計(jì)語(yǔ)言(文案在構(gòu)思新角色)統(tǒng)一化;
其他還有一些,但我基本沒(méi)看到說(shuō)直接用說(shuō)取代工作的,而更多是賦能。
這是某游戲公司照片的算法工程師:
工作職責(zé)之一就是“風(fēng)格遷移”。其實(shí)深度網(wǎng)絡(luò)算法這塊就是,它可能不work,但你融資的時(shí)候沒(méi)有和有差別就很大。
最后聊一聊學(xué)術(shù)圈。谷歌團(tuán)隊(duì)最近剛發(fā)的imagic方法:
很多團(tuán)隊(duì)在不停提升方法,對(duì)其可以落地的部分進(jìn)行設(shè)計(jì)、優(yōu)化甚至升級(jí)。
之前我看到很多人說(shuō)的一個(gè)觀點(diǎn)“現(xiàn)在AI本身方向就是錯(cuò)的”。對(duì)此我并不反對(duì),最近幾年很多文章都在說(shuō)其實(shí)全連接層和卷積層效果基本一樣。
我們從現(xiàn)在時(shí)間節(jié)點(diǎn)往前看,很多方法確實(shí)存在缺陷,甚至錯(cuò)誤,時(shí)間線回到1980年那會(huì)“神經(jīng)網(wǎng)絡(luò)”就等于“垃圾”,再出山時(shí)候還要換馬甲成“深度網(wǎng)絡(luò)“。
但正是因?yàn)檫@些不夠“完美的”模型才推動(dòng)了整個(gè)行業(yè)發(fā)展、軟硬件技術(shù)的堆積、吸引大量人才進(jìn)入才能讓我們找到最優(yōu)解。
如果一個(gè)行業(yè)連試錯(cuò)的人都沒(méi)有,那才是最悲哀的。
柯潔其實(shí)想表達(dá)的應(yīng)該是,當(dāng)大量資本愿意投入到“圖像生成”領(lǐng)域,那么更多的科學(xué)家、技術(shù)人員都會(huì)被吸引過(guò)去。人力、財(cái)力都都堆積起來(lái),會(huì)出現(xiàn)什么誰(shuí)說(shuō)的好呢?
……
而對(duì)于柯潔提及的AI繪畫商業(yè)化,在量子位智庫(kù)的《AIGC/AI生成內(nèi)容產(chǎn)業(yè)展望報(bào)告》中也有過(guò)分析。
我國(guó)的AIGC行業(yè)尚未建立起明確的變現(xiàn)方式。以寫作機(jī)器人、自動(dòng)配音等場(chǎng)景為例,大部分產(chǎn)品仍處在免費(fèi)試用的流量吸引階段,收費(fèi)空間相對(duì)較小。
此外,多家公司提及,由于服務(wù)B端客戶時(shí)話語(yǔ)權(quán)弱,會(huì)考慮向2B2C領(lǐng)域、 乃至直接2C領(lǐng)域延展。
但作為工具,能否在互聯(lián)網(wǎng)流量相對(duì)穩(wěn)定的前提下有效接觸C端用戶,設(shè)計(jì)好產(chǎn)品轉(zhuǎn)化路徑,依舊是一項(xiàng)挑戰(zhàn)。
而從國(guó)外AI繪畫的變現(xiàn)方式來(lái)看,主要是按產(chǎn)出內(nèi)容量收費(fèi)。
包括DALL·E、Deep Dream Generator等AI圖像生成平臺(tái)大多按照?qǐng)D像張數(shù)收費(fèi)。
One More Thing
對(duì)于AI繪畫這事,還有一個(gè)比較有意思的事情。
吳恩達(dá)老師最近在知乎發(fā)表了一個(gè)標(biāo)題較為驚悚的來(lái)信——《人類和鬼魂都在使用AI?!》,談了談他對(duì)AI生成藝術(shù)的看法。
親愛(ài)的朋友們:
人工智能每年都會(huì)帶來(lái)驚人的進(jìn)步。但是,隨著萬(wàn)圣節(jié)的臨近,物質(zhì)世界和幽靈世界之間的面紗被緩緩揭開(kāi),我們看到,鬼魂世界也和人類世界一樣利用了這些發(fā)展。
正如我在上周的來(lái)信中所寫的,prompt engineering(提示詞工程)——即編寫文本提示以使AI模型生成所需輸出的藝術(shù),是一個(gè)主要的新趨勢(shì)。你知道日語(yǔ)中的“提示”一詞——呪文——也意味著咒語(yǔ)或咒語(yǔ)?(向自然語(yǔ)言處理開(kāi)發(fā)人員Paul O’Leary McCann致敬。)使用DALL·E 2或Stable Diffusion等模型生成圖像的過(guò)程確實(shí)像是施了一個(gè)魔法(更不用說(shuō)這些程序明顯有能力讓帕勃羅·畢加索等已故藝術(shù)家“復(fù)活”),所以日本的人工智能從業(yè)者可能會(huì)有所收獲。
一些人工智能公司正在試圖復(fù)活逝者。初創(chuàng)公司HereAfter AI生產(chǎn)的聊天機(jī)器人在講話、聲音和外觀上都像你許久不見(jiàn)的曾祖母。當(dāng)然,這只是一個(gè)模擬,目的是幫助生者與已故親人取得某種“聯(lián)系”。根據(jù)我從無(wú)數(shù)僵尸電影中學(xué)到的,當(dāng)談到復(fù)活逝者時(shí),我確信沒(méi)有什么會(huì)出錯(cuò)。
我更關(guān)心的是那些似乎決心創(chuàng)造恐怖生物的人工智能研究人員。想想最近對(duì)transformer的大量研究。每個(gè)transformer都用到了多頭關(guān)注。什么時(shí)候開(kāi)始有“多個(gè)頭”是自然的了?研究人員正在潛入我們的電腦中,每個(gè)人都在為這項(xiàng)新技術(shù)而歡呼!如果說(shuō)我們對(duì)transformer有一點(diǎn)了解的話,那就是事情并不像最初看到的那樣簡(jiǎn)單。
今年也是從掩碼輸入中學(xué)習(xí)的一年,掩碼自動(dòng)編碼器、MaskGIT和MaskViT等方法在困難任務(wù)中取得了出色的表現(xiàn)。所以,如果你戴上萬(wàn)圣節(jié)面具,那么你就支持了人工智能進(jìn)步背后的一個(gè)關(guān)鍵想法。
不給糖就搗蛋!
吳恩達(dá)
參考鏈接:
[1]https://www.zhihu.com/question/561728839
[2]https://www.bilibili.com/video/BV1eG411E7nK/
[3]https://www.bilibili.com/video/BV1A84y167iA/
[4]https://zhuanlan.zhihu.com/p/577811634?utm_medium=social&utm_oi=740325373283172352&utm_psn=1569266197987741696&utm_source=wechat_session
文章來(lái)源:快科技