首頁(yè)>資訊 >
別管它們叫“AI 畫(huà)手”了,AI 連手都畫(huà)不好 2023-03-14 20:48:07  來(lái)源:36氪

前段時(shí)間,人類(lèi)藝術(shù)家們?cè)?Instagram 上發(fā)起#artbyhumans運(yùn)動(dòng),抵制 AI 作畫(huà),“影響藝術(shù)家收入”、“AI 在藝術(shù)作品里抓取再拼貼”……不知當(dāng)他們看完 AI 畫(huà)出來(lái)的手后,會(huì)不會(huì)稍微松口氣?

AI 畫(huà)“手”|Medium


(相關(guān)資料圖)

因?yàn)橄胂罅蛣?chuàng)造力,AI 被吹捧上天,但不可忽視的是,它們畫(huà)出來(lái)的手如此笨拙、怪異,像驚悚電影里的道具。

網(wǎng)上流傳著這樣的梗圖,調(diào)侃 AI 的繪畫(huà)功底。

“怎么辨別這是 AI 畫(huà)的?看手就行了?!保黅witter

那么,為什么 AI 畫(huà)不好手?

有一說(shuō)一,手是真的很難畫(huà)啊!

別說(shuō) AI,人類(lèi)自己都不一定能把手畫(huà)明白。

荷蘭藝術(shù)家埃舍爾(M.C. Escher)在 1948 年創(chuàng)作過(guò)一幅石版畫(huà),名字就叫 Drawing Hands(畫(huà)手)。畫(huà)面中,兩只手通過(guò)畫(huà)筆彼此相連,“一只手創(chuàng)造了另一只,而另一只又創(chuàng)造了第一只”,這種矛盾恰恰表達(dá)出了:人們想要描繪出兩只動(dòng)態(tài)的手有多難。

Drawing Hands|Wikipedia

如果再搜一搜,你會(huì)發(fā)現(xiàn)“畫(huà)不好手”是一個(gè)困擾全球畫(huà)師的難題。插畫(huà)家 Anna Daviscourt 寫(xiě)道:“畫(huà)手是最有表現(xiàn)力,最復(fù)雜,解剖學(xué)程度精細(xì)的工程。”

還有人把問(wèn)題拋給了 AI 的“自家人”——ChatGPT。

ChatGPT 答道:“手是由許多小骨頭、肌肉和肌腱組成的,所有這些都必須被準(zhǔn)確描繪出來(lái)才行。此外,手的位置也很難表達(dá),因?yàn)樗鼈儾粩嘣谶\(yùn)動(dòng)狀態(tài)中。因?yàn)檫@些困難,許多藝術(shù)家發(fā)現(xiàn),手部繪畫(huà)是他們技藝中最令人沮喪和最具挑戰(zhàn)性的方面之一?!?/p>

ChatGPT 的解答

手的復(fù)雜性不僅僅在于它本身就有很多個(gè)關(guān)節(jié)、折痕等微小卻關(guān)鍵的細(xì)節(jié),還在于手每動(dòng)一下,原有的關(guān)節(jié)都會(huì)變得不同。

有人還真數(shù)過(guò),從手指的長(zhǎng)寬度,到掌骨與腕關(guān)節(jié),一只手大概就有 30 個(gè)幾何變化點(diǎn),這還不包括手掌的陰影與褶皺的變化。

圖源:GIPHY

如果你仔細(xì)觀察的話(huà),會(huì)發(fā)現(xiàn)大多數(shù)卡通人物的手都只有 4 個(gè)指頭(三個(gè)手指和一個(gè)大拇指),因?yàn)樵趧?dòng)畫(huà)流程制作繁復(fù)的早期,少畫(huà)一根手指省時(shí)省力,還省錢(qián)!迪士尼曾透露過(guò),少畫(huà) 1 根手指為公司節(jié)省過(guò)上百萬(wàn)美金。

比起面部,手并沒(méi)有那么多可供 AI 學(xué)習(xí)的樣本

AI 在“創(chuàng)造”藝術(shù)時(shí)并沒(méi)有邏輯思維,它并不知道這里或者那里“應(yīng)該”有什么,只能先接收人類(lèi)的指令,再與系統(tǒng)內(nèi)的訓(xùn)練庫(kù)進(jìn)行比照,用生成的圖像盡可能回答“what is this”(這是什么),而非“why is this”(為什么是這個(gè))。

所以,你要想生成更加精準(zhǔn)的圖像,比如一頭栩栩如生的小豬,就要給 AI 足夠具體的指令。

指定提示詞前后,AI 畫(huà)出的小豬對(duì)比|itpedia

但這還遠(yuǎn)遠(yuǎn)不夠,人們要想 AI 畫(huà)得精準(zhǔn),還要提供足夠豐富的真實(shí)圖像標(biāo)注,讓 AI 學(xué)習(xí)。

手這個(gè)復(fù)雜幾何形狀,意味著沒(méi)有通用的線(xiàn)條或形狀集合,可供 AI 識(shí)別手。所以,AI 必須結(jié)合許多不同的形狀、組合來(lái)畫(huà)出令人信服的手。

為什么 AI 總是把手畫(huà)殘,恰恰是因?yàn)闆](méi)有充足的參照物。

知乎上有網(wǎng)友這樣解答:“一張圖片上,手往往占的面積很小,經(jīng)常被遮擋和半遮擋,導(dǎo)致手部所占像素較少細(xì)節(jié)不夠。而且,手部的標(biāo)注是要準(zhǔn)確標(biāo)注手掌、拇指、食指、中指、無(wú)名指和小拇指才可以,這部分的工作算法很難自動(dòng)化,需要人類(lèi)來(lái)完成,這就大大增加了成本?!?/p>

一只手,應(yīng)該被正確標(biāo)注出的部分(右上)|知乎

這可不是極個(gè)別情況,如果把人類(lèi)的臉變成像手一樣復(fù)雜的動(dòng)態(tài)結(jié)構(gòu),AI 也同樣畫(huà)不明白。

在我們的臉上,唯一能活動(dòng)的關(guān)節(jié)是顳頜關(guān)節(jié),在一些二次元作品中,還常常弱化這個(gè)關(guān)節(jié)的存在。但如果我們的面部變得足夠“靈活”,比如,鼻子可伸縮,舌頭能打結(jié),那 AI 肯定也會(huì)犯難。

還有一個(gè)讓“AI 畫(huà)不好手”傳播開(kāi)來(lái)的原因,那就是:手一旦畫(huà)錯(cuò),真的是很明顯?。?/strong>

如果 AI 創(chuàng)造了一個(gè)比例不太對(duì)的肩膀,我們一般不會(huì)注意到畫(huà)面中這個(gè)人的肩膀窄了百分之五。但如果他們的拇指、食指、中指、無(wú)名指和小指都比平均水平小一點(diǎn),那就容易顯得奇怪了。

這是受到人的固有感知影響。心理學(xué)有一個(gè)理論叫做“撒切爾效應(yīng)”,1980 年由約克大學(xué)心理學(xué)教授彼得·湯普提出,當(dāng)時(shí)他以撒切爾夫人的畫(huà)像作例。

撒切爾效應(yīng)|Wikipedia

我們第一眼能看出什么?右圖的眼睛與嘴巴被上下顛倒了。你需要更仔細(xì)才能看出,左圖的五官實(shí)際上也是錯(cuò)位的。

也就是說(shuō),錯(cuò)位發(fā)生在正立的臉上很容易露餡,但發(fā)生在倒立的臉上就能騙過(guò)人。因?yàn)槲覀兤饺绽锖茈y見(jiàn)到倒立的臉,難以形成固有認(rèn)知,所以在你把屏幕旋轉(zhuǎn)過(guò)來(lái)之前,很難看出不同。

而我們對(duì)手部太熟悉了,感知格外敏感。

AI 創(chuàng)作的“手”|Gagadget

教會(huì) AI 畫(huà)手,有啥方法嗎?

不得不說(shuō),人類(lèi)在提升 AI 畫(huà)技方面,也是“卷”得孜孜不倦。

今年初,一個(gè)叫“ControlNet”的新 AI 插件在 GitHub 上爆火,如今已收獲超過(guò) 10k 星。

簡(jiǎn)單來(lái)說(shuō),這個(gè)插件通過(guò)給 Stable Diffusion 這樣的 AI 作畫(huà)模型增加一個(gè)額外輸入,來(lái)優(yōu)化生成的細(xì)節(jié),相當(dāng)于給 AI 創(chuàng)作加了一層 buff。

效果的確比之前過(guò)于抽象的手部創(chuàng)作靠譜了些,但如果仔細(xì)看的話(huà),你還是會(huì)發(fā)現(xiàn)……咦,怎么一共有 6 個(gè)手指?

點(diǎn)開(kāi)放大,數(shù)數(shù)一共幾個(gè)手指|Github

也有一些比較取巧的方法。比如,有人傳授經(jīng)驗(yàn):要想讓 AI 畫(huà)出一只正常的手,你只需要告訴它“mittens”(手套)這一個(gè)詞,往往在有手套的圖片中,五個(gè)手指根根分明,且沒(méi)有什么特殊的手勢(shì)。

一雙手套|Gagadget

或者告訴它“結(jié)婚戒指”、“指甲油”這兩個(gè)詞。AI 往往就能搜索到很多高清的手部照片,降低畫(huà)殘概率。

戒指或指甲油|Gagadget

說(shuō)到底,這些都屬于一些幫助 AI 偷懶的小技巧,要論畫(huà)手的真實(shí)力,AI 還是咱們?nèi)祟?lèi),都得好好學(xué)習(xí)??!

參考文獻(xiàn)

[1] https://www.thepaper.cn/newsDetail_forward_21992745

[2]https://www.pingwest.com/a/191335#:~:text=%E5%85%B3%E4%BA%8E%E8%BF%99%E4%B8%80%E7%82%B9%EF%BC%8C%E8%91%97%E5%90%8D%E7%9A%84,%E4%BA%BA%E4%BB%AC%E7%9C%8B%E5%BE%97%E6%9B%B4%E6%B8%85%E6%A5%9A%E3%80%82

[3]https://www.sciencefocus.com/future-technology/why-ai-generated-hands-are-the-stuff-of-nightmares-explained-by-a-scientist/

[4]https://bootcamp.uxdesign.cc/how-to-draw-hands-with-an-ai-image-generator-776ce3a814fe

一個(gè)AI

關(guān)鍵詞:

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片