藝術(shù)創(chuàng)作中的人工智能生成方式研究
引言
人工智能(Artificial Intelligence),是智能學(xué)科重要的組成部分,在機(jī)器人、語(yǔ)言識(shí)別、圖像識(shí)別、自然語(yǔ)言處理、專家系統(tǒng)、機(jī)器學(xué)習(xí),計(jì)算機(jī)視覺(jué)等方面都有著深遠(yuǎn)的發(fā)展。在發(fā)展的過(guò)程中,取得了一系列突破,其中有關(guān)于人工智能生成內(nèi)容,也就是AIGC,更是引起了非常廣泛的關(guān)注。而藝術(shù)是對(duì)人類心理活動(dòng)的映射,無(wú)論任何藝術(shù)作品的完成都離不開(kāi)人類的藝術(shù)思維。
文章初步要概括藝術(shù)思維的概念與分類,分析生成式人工智能,探討藝術(shù)思維與人工智能中生成式人工智能在藝術(shù)領(lǐng)域中的關(guān)系,以及對(duì)未來(lái)進(jìn)行展望。
一、人類藝術(shù)思維的概念與分類
藝術(shù)思維所指的就是現(xiàn)代藝術(shù)家在進(jìn)行藝術(shù)創(chuàng)作時(shí)經(jīng)常使用的思維方式,具有很強(qiáng)的概括作用。對(duì)客觀世界在感性的技術(shù)上進(jìn)行學(xué)習(xí)、概括、推理以及歸納。在創(chuàng)作時(shí)主要依靠的除了高超的藝術(shù)技能外,最重要就是藝術(shù)思維的把握。
(一)形象思維
形象思維是藝術(shù)創(chuàng)作的主要思維方式,以直觀形象和表象為支柱的思維過(guò)程。藝術(shù)家在認(rèn)識(shí)世界的過(guò)程中,對(duì)于客觀事物的表象進(jìn)行了解和取舍。在對(duì)生活累積感受和在大腦中進(jìn)行有選擇的存儲(chǔ)后,結(jié)合人成長(zhǎng)過(guò)程中所形成的感性判斷,來(lái)進(jìn)行手段形式的選擇,創(chuàng)造出符合思維的一種視覺(jué)形象。
(二)抽象思維
抽象思維又名邏輯思維,通常情況下會(huì)運(yùn)用語(yǔ)言、符號(hào)、理論、概念、數(shù)字等抽象材料來(lái)完成活動(dòng)實(shí)踐。形象思維偏向于本元,無(wú)論人在發(fā)展中如何變化,形象思維都如同根一樣扎根在人的大腦中。而抽象思維則如同枝蔓一樣,在成長(zhǎng)過(guò)程里不斷的被外界所影響,從而進(jìn)行學(xué)習(xí)與變化,發(fā)展出的一種工具性思維方式。
(三)靈感思維
靈感思維在藝術(shù)方面里體現(xiàn)在藝術(shù)創(chuàng)作過(guò)程中,大腦里會(huì)突然涌現(xiàn)出靈感的一種思維過(guò)程。這一現(xiàn)象的產(chǎn)生正是因?yàn)槿说拇竽X皮層處于高度興奮時(shí)的一種狀態(tài),從而迸發(fā)出來(lái)的想法,即憑直覺(jué)領(lǐng)悟事情的本質(zhì)。
“靈感”一詞最早源自于希臘,柏拉圖在德謨克里特、蘇格拉底闡釋的基礎(chǔ)上,將靈感說(shuō)系統(tǒng)化、理論化,引用到文學(xué)創(chuàng)作里。他認(rèn)為詩(shī)人創(chuàng)作的優(yōu)秀詩(shī)歌靠的是神賜予的靈感而不是技藝。古希臘哲學(xué)家德謨克利特曾說(shuō):“一位詩(shī)人以熱情并在神圣的靈感之下所作成的一切詩(shī)句,當(dāng)然是美的”。這更加說(shuō)明了靈感思維在藝術(shù)創(chuàng)作中屬于創(chuàng)新的核心。
二、生成式人工智能的發(fā)展及特征
生成式人工智能是一種利用復(fù)雜的算法、模型和規(guī)則。生成模型不僅可以學(xué)習(xí)輸入和輸出之間的關(guān)系,還學(xué)習(xí)了生成輸入數(shù)據(jù)的過(guò)程。它可以分析不同數(shù)據(jù)的關(guān)系來(lái)生成新的樣本。生成式人工智能的出現(xiàn)凝聚了人類社會(huì)的智慧,并且也會(huì)對(duì)我們社會(huì)產(chǎn)生一定的反作用。
(一)生成式人工智能的發(fā)展歷程
生成式模型在人工智能領(lǐng)域有著悠久的歷史。隱馬可夫模型是一連串事件接續(xù)發(fā)生的機(jī)率,用以探索看不到的世界,現(xiàn)象和事實(shí)的數(shù)學(xué)工具,而高斯混合模型可以用高斯概率密度函數(shù)(正態(tài)分布曲線)精確地量化事物。這兩個(gè)模型在上個(gè)世紀(jì)50年代被開(kāi)發(fā)出來(lái),生成了序列數(shù)據(jù),比如語(yǔ)音或時(shí)間序列。
神經(jīng)網(wǎng)絡(luò)(Neural Network)也被稱為人工神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)算法的核心。靈感來(lái)源于人腦內(nèi)部的神經(jīng)元,模仿生物神經(jīng)元之間相互傳遞信號(hào)的方式,從而達(dá)到學(xué)習(xí)經(jīng)驗(yàn)的目的。神經(jīng)網(wǎng)絡(luò)在1943年被提出,這個(gè)神經(jīng)元模型開(kāi)啟了人類研究生物神經(jīng)網(wǎng)絡(luò)的篇章。
生成式人工智能與藝術(shù)領(lǐng)域的新結(jié)合則是在1971年,加州大學(xué)圣地亞哥分校的科恩教授進(jìn)行機(jī)械臂的繪畫(huà)嘗試,這是最早的AI繪畫(huà)實(shí)踐。在之后的時(shí)間里,人類探索出了VAE和GAN,圖像生成后面的發(fā)展,很大程度是建立在這兩個(gè)模型之上。而現(xiàn)如今,因?yàn)?/span>GAN模型在生成器和判別器上的缺陷,加州大學(xué)伯克利分校的學(xué)者提出去噪擴(kuò)散模型DDPM,衍生出近幾年關(guān)注度極高的繪圖網(wǎng)站DALL-E2,Stable Diffusion,Midjourney和NovelAI等等。
(二)生成式人工智能的基本特征
1. 隨機(jī)性與視覺(jué)一致性
藝術(shù)家在構(gòu)建生成式算法時(shí),雖然可以設(shè)定圖形紋理、顏色配比、對(duì)稱性等參數(shù)。算法的隨機(jī)性會(huì)讓每一件作品都不一樣,但是整個(gè)體系的作品也會(huì)具有視覺(jué)表達(dá)的整體一致性。以Midjourney舉例,2022年7月12日上線。只需要用戶輸入文本就可以得到需要的圖像。而用戶輸入提示詞后,系統(tǒng)會(huì)生成4張圖片。這四張圖片風(fēng)格統(tǒng)一,細(xì)節(jié)各不相同。在用戶輸入更改風(fēng)格的提示詞后,系統(tǒng)依舊生成另外四張其他系列的圖像。
2. 高效率和易迭代
相比于傳統(tǒng)的藝術(shù)創(chuàng)作需要從藝術(shù)體驗(yàn)、藝術(shù)構(gòu)思再到藝術(shù)創(chuàng)作等長(zhǎng)周期的活動(dòng)來(lái)看。生成式人工智能往往可以跨過(guò)藝術(shù)體驗(yàn)和創(chuàng)作等步驟。藝術(shù)創(chuàng)作者僅需要藝術(shù)構(gòu)思,即從傳統(tǒng)藝術(shù)主體創(chuàng)作者,轉(zhuǎn)變?yōu)樗囆g(shù)創(chuàng)作系統(tǒng)的架構(gòu)著。在完成生成系統(tǒng)程序的建構(gòu)后,就可以重復(fù)的去使用。除了可以設(shè)置主體風(fēng)格,還可以將程序遷移到不同的生成藝術(shù)作品創(chuàng)作中結(jié)合使用。
三、藝術(shù)思維與生成式人工智能的關(guān)系
從仿生學(xué)的角度來(lái)看,生成式人工智能主要依賴的模型——神經(jīng)網(wǎng)絡(luò)模型,與人腦神經(jīng)元有著密不可分的關(guān)系。人工智能的大腦就是一臺(tái)高智能的計(jì)算機(jī),來(lái)模仿人腦的活動(dòng)內(nèi)容,并且針對(duì)于人類日常生活中的一些習(xí)慣與活動(dòng)來(lái)進(jìn)行規(guī)律的總結(jié)。
每個(gè)人的人腦都由數(shù)十億的神經(jīng)元構(gòu)成,是神經(jīng)系統(tǒng)最基本的結(jié)構(gòu)和功能單位,中間由細(xì)胞體作為獨(dú)立的個(gè)體,周?chē)耐黄鸩糠謱⒚總€(gè)神經(jīng)元進(jìn)行連接。區(qū)別于人類神經(jīng)元的分布規(guī)律錯(cuò)綜復(fù)雜,神經(jīng)網(wǎng)絡(luò)的神經(jīng)元按照一定的規(guī)則連接起來(lái),形成了一個(gè)神經(jīng)網(wǎng)絡(luò),每一排的神經(jīng)元需要通過(guò)訓(xùn)練,來(lái)下發(fā)不同的任務(wù)。
了解了有關(guān)于人類神經(jīng)元和神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的異同,同比到藝術(shù)視角下,二者依舊有著千絲萬(wàn)縷的聯(lián)系。從一般意義來(lái)講,傳統(tǒng)對(duì)于藝術(shù)的創(chuàng)作過(guò)程可以分為三類。即清代畫(huà)家鄭板橋總結(jié)歸納的“眼中之竹、胸中之竹和手中之竹”分別對(duì)應(yīng)了藝術(shù)體驗(yàn)、藝術(shù)構(gòu)思和藝術(shù)表現(xiàn)。
(一)藝術(shù)體驗(yàn)與數(shù)據(jù)采集
藝術(shù)體驗(yàn)是整個(gè)創(chuàng)作過(guò)程的第一步,是一切藝術(shù)創(chuàng)作的前提和基礎(chǔ)。在實(shí)際的藝術(shù)創(chuàng)作中,藝術(shù)家需要對(duì)想表達(dá)的作品進(jìn)行地域性的深入了解,才能創(chuàng)作出一幅真正具有地方或是種族特色的藝術(shù)作品。
徐悲鴻的馬十分經(jīng)典,不同形態(tài)的馬通過(guò)水墨簡(jiǎn)單勾勒就能傳達(dá)出神韻。正是因?yàn)樗ㄟ^(guò)與馬在實(shí)際的觀察與寫(xiě)生,才能夠?qū)τ隈R的形態(tài)、肌肉以及生活中的習(xí)性了如指掌。
而生成式人工智能想要進(jìn)行精確的圖像生成,自然而然地就需要前期對(duì)于數(shù)據(jù)的大量采集。從而獲取高質(zhì)量、多樣性和豐富性的數(shù)據(jù),以滿足人工智能算法和模型的需求。其中主要依賴于圖像數(shù)據(jù)采集和語(yǔ)音數(shù)據(jù)采集等等。
使用圖像采集需要選擇多分辨率和類型的圖像進(jìn)行獲取。為了保證數(shù)據(jù)質(zhì)量,采集前需要對(duì)所有圖像進(jìn)行簡(jiǎn)單的字符串或文本標(biāo)注。2021年1月OpenAI使用了大約120億的參數(shù)量對(duì)其進(jìn)行訓(xùn)練,可以應(yīng)用于任意的視覺(jué)分類任務(wù)。與同時(shí)期的其他競(jìng)爭(zhēng)者拉開(kāi)差距。數(shù)據(jù)采樣越多,就意味著可以匹配越多的視覺(jué)分類,在選擇上就可以找到更加準(zhǔn)確的數(shù)據(jù)庫(kù)。
(二)藝術(shù)構(gòu)思與模型架構(gòu)
藝術(shù)構(gòu)思則是藝術(shù)創(chuàng)作的第二部,在完成了藝術(shù)體驗(yàn)后。藝術(shù)家需要將腦中對(duì)于最終想法來(lái)進(jìn)行和施行的方案?;谏钪械乃夭膩?lái)改造創(chuàng)作,將零散的碎片拼湊出完整的視覺(jué)形象。實(shí)現(xiàn)自己對(duì)于審美價(jià)值的藝術(shù)意象。
藝術(shù)構(gòu)思大體可以分為三個(gè)階段,具體進(jìn)行時(shí)各階段的區(qū)分不是絕對(duì)的。以美國(guó)著名大地藝術(shù)家羅伯特·史密森創(chuàng)作的《螺旋形的防波堤》舉例。首先藝術(shù)家要在生活中因?yàn)槟骋粋€(gè)人、事、物的觸發(fā)從而產(chǎn)生表現(xiàn)欲望,而該作品所處18世紀(jì)中期,工業(yè)文明盛行。藝術(shù)家認(rèn)為工業(yè)文明帶來(lái)了很多負(fù)面的結(jié)果,所以他想通過(guò)大地藝術(shù)來(lái)完成一場(chǎng)人與自然的對(duì)話。第二階段為對(duì)需要加工的材料進(jìn)行選擇、提煉,重新排列組合,讓藝術(shù)作品的雛形在腦海中愈發(fā)清晰。《螺旋形的防波堤》的構(gòu)思以一個(gè)大型的螺旋狀來(lái)表達(dá)湖水的流動(dòng)與大自然的“鬼斧神工”。 第三階段則需要一些靈感,從而讓大腦處于活躍的狀態(tài),把已具雛形的藝術(shù)意象進(jìn)一步具體、生動(dòng)、典型化,使之成為栩栩如生的藝術(shù)形象。
人腦新皮質(zhì)的皮質(zhì)柱的神經(jīng)元結(jié)構(gòu)是微小的柱狀體,且結(jié)構(gòu)是不變的,通過(guò)大腦新皮質(zhì)中約50萬(wàn)個(gè)皮質(zhì)柱,我們可以在大腦中儲(chǔ)存大量的信息,作為功能列表存儲(chǔ)起來(lái),形成知識(shí)的“模塊”。當(dāng)我們需要使用的時(shí)候,我們可以將各“模塊”自由組合,通過(guò)學(xué)習(xí)能力,將舊知識(shí)運(yùn)用于新的經(jīng)驗(yàn)上,在這一點(diǎn)上,人工智能大腦是還需要學(xué)習(xí)和進(jìn)步的。
生成式人工智能在收集大量數(shù)據(jù)后,大多數(shù)網(wǎng)站依靠著Transformer的模型架構(gòu)來(lái)對(duì)數(shù)據(jù)進(jìn)行梳理和擺放。在其核心位置,Transformer模型由編碼器和解碼器兩個(gè)模塊進(jìn)行組合。完整的Transformer模型通過(guò)將多個(gè)編碼器和解碼器層堆疊在一起來(lái)構(gòu)建。每個(gè)層獨(dú)立處理輸入序列,使模型能夠?qū)W習(xí)分層表示并捕獲數(shù)據(jù)中的復(fù)雜模式。編碼器將其輸出傳遞給解碼器,后者根據(jù)輸入生成最終的輸出序列。
人腦的藝術(shù)構(gòu)思雖然較比人工智能更為隨意,但二者都需要對(duì)所處容量的數(shù)據(jù)做出內(nèi)容與數(shù)量的選擇。一味的以多來(lái)取勝并不可靠,反而會(huì)影響最終效果的呈現(xiàn)。
(三)藝術(shù)表現(xiàn)與圖像生成
經(jīng)過(guò)藝術(shù)體驗(yàn)與藝術(shù)構(gòu)思前兩個(gè)步驟,想要將藝術(shù)家腦中的想法付諸于實(shí)踐的落實(shí)活動(dòng),將藝術(shù)意象物態(tài)化就是藝術(shù)表現(xiàn)。藝術(shù)表現(xiàn)需要運(yùn)用手段與技巧,來(lái)將前面的藝術(shù)體驗(yàn)與構(gòu)思進(jìn)行捏合與實(shí)踐,完成藝術(shù)意象物態(tài)化。本質(zhì)上是一種審美表現(xiàn)活動(dòng)。如同梵高所繪畫(huà)的《星月夜》,無(wú)論是從個(gè)人經(jīng)歷還是藝術(shù)構(gòu)思,最終所以色調(diào)和極其具有藝術(shù)風(fēng)格的線條,表達(dá)出了他希望通過(guò)自己身邊的事物去描繪他內(nèi)心的想法。希望大家通過(guò)畫(huà)去了解他當(dāng)時(shí)處境是多么的艱難,但他依然在努力的向上生長(zhǎng)造作,直到死去。
而目前生成式人工智能普遍依賴于擴(kuò)散模型來(lái)進(jìn)行圖像的生成。用戶只需要在界面輸入關(guān)鍵詞,系統(tǒng)就會(huì)在數(shù)據(jù)庫(kù)中進(jìn)行相關(guān)文本與圖像的連接,生成更加真實(shí)和更加準(zhǔn)確的畫(huà)像。以最新生成式人工智能的成果Sora舉例,通過(guò)文本指令,Sora 可以直接輸出長(zhǎng)達(dá) 60 秒的視頻,并且包含高度細(xì)致的背景、復(fù)雜的多角度鏡頭,以及富有情感的多個(gè)角色。通過(guò)觀察大量數(shù)據(jù),系統(tǒng)學(xué)會(huì)了許多關(guān)于世界的物理規(guī)律。但也在一些個(gè)別情況下會(huì)超出電腦的運(yùn)算范圍,出現(xiàn)不合邏輯的漏洞,例如多跟手指或者是平地起高樓的情況。
有趣的是和人類不同,人類可以在藝術(shù)實(shí)踐中感受到與設(shè)想不足之初并加以改善。但是在人工智能眼里,一切還沒(méi)有完善的程序內(nèi)所做出的決策都是正確的,往往會(huì)產(chǎn)生出錯(cuò)誤中的藝術(shù)。人之所以有思維,就是人可以自我的判斷一種情況的錯(cuò)誤,是不是可以變成另一種情況的正確。人工智能的極限就是自我意識(shí)。如果它認(rèn)為自己的漏洞是一種創(chuàng)新的話,那某種意義上來(lái)講他們也擁有著所謂的創(chuàng)新藝術(shù)思維。
四、結(jié)語(yǔ)
事實(shí)上,人類一直在探索關(guān)于知識(shí)與學(xué)習(xí)的奧秘,洞穴之喻(Allegory of the Cave)是柏拉圖在《理想國(guó)》中描述的對(duì)人類知識(shí)的基本想象。而洛克的白板說(shuō)主張人生下來(lái)就是一塊白板,后天的學(xué)習(xí)與經(jīng)驗(yàn)積累讓這張白紙有了內(nèi)容。人工智能就是通過(guò)數(shù)據(jù)的輸入與歸類,來(lái)讓機(jī)器提高它的學(xué)習(xí)能力,而這里的數(shù)據(jù)就是我們?nèi)祟愃傅?/span>“經(jīng)驗(yàn)”。在不斷的學(xué)習(xí)中機(jī)器模仿人類對(duì)于抽象思維和審美創(chuàng)造力。
人工智能作為人類實(shí)踐的產(chǎn)物,目前來(lái)看還只是作為輔佐人類藝術(shù)的工具,沒(méi)有具備真正意義上的主體性。作為客體,技術(shù)可以反推人的審美和生活。有沒(méi)有一種可能技術(shù)會(huì)反推人類發(fā)展出一個(gè)新的視覺(jué)領(lǐng)域和世界和思維空間,到那個(gè)時(shí)候主體與客體會(huì)達(dá)到一種新的平衡與統(tǒng)一。
從藝術(shù)思維到生成式人工智能,我們領(lǐng)略到了人腦與機(jī)器之間的關(guān)聯(lián)。通過(guò)對(duì)腦神經(jīng)的不斷挖掘與探索,可以優(yōu)化神經(jīng)網(wǎng)絡(luò)模型,為未來(lái)的藝術(shù)領(lǐng)域做出更大的貢獻(xiàn)。在這個(gè)過(guò)程中,我們也可以不斷的克服自身學(xué)習(xí)的局限和缺點(diǎn),提升我們的藝術(shù)思維與方法,激發(fā)人類對(duì)于學(xué)習(xí)活動(dòng)的更多思考,為人類帶來(lái)更加美好的未來(lái)。
文章來(lái)源: 《新美域》 http://m.xwlcp.cn/w/qk/29468.html
欄目分類
- 1《繽紛》雜志 雙月刊 國(guó)家級(jí)藝術(shù)類各項(xiàng)文化事業(yè)類學(xué)術(shù)期刊
- 2論現(xiàn)代主義美術(shù)產(chǎn)生的原因及傳統(tǒng)藝術(shù)的關(guān)系
- 3中國(guó)古詩(shī)詞藝術(shù)歌曲《青玉案 元夕》賞析
- 4虛構(gòu)與差異——淺析真人秀節(jié)目《明星大偵探》的策劃藝術(shù)
- 5從符號(hào)學(xué)角度解讀電影《芳華》
- 6剪輯與人物形象塑造——以電影《這個(gè)殺手不太冷》為例
- 7論我國(guó)傳統(tǒng)戲曲發(fā)展現(xiàn)狀及解決策略
- 8淺析蒙太奇在影視創(chuàng)作中的運(yùn)用
- 9我國(guó)校園音樂(lè)節(jié)發(fā)展現(xiàn)狀及傳播價(jià)值研究
- 10歷史的真實(shí)與銀幕的浪漫——電影《年輕的維多利亞》服裝造型解讀
- 圖書(shū)館紙質(zhì)文獻(xiàn)數(shù)字化存儲(chǔ)平臺(tái)的優(yōu)化設(shè)計(jì)與文件管理方法研究
- 不同紙張?zhí)匦詫?duì)平面性繪畫(huà)效果的影響
- 基于用戶需求的紙質(zhì)圖書(shū)與電子圖書(shū)資源整合與服務(wù)創(chuàng)新
- 北方剪紙的藝術(shù)特征與傳承研究
- 高校美術(shù)教育中非遺剪紙藝術(shù)的融合與實(shí)踐
- 紙質(zhì)檔案信息化管理與傳統(tǒng)管理模式的結(jié)合
- 基于紙張媒介的非遺文化傳播模式創(chuàng)新與實(shí)踐路徑探索
- 數(shù)字化沖擊下高校圖書(shū)館紙質(zhì)圖書(shū)借閱量下降的原因及對(duì)策
- 非遺手工藝高校產(chǎn)學(xué)研教融合模式構(gòu)建研究
- 基于綠色食品牌背景下的云南鮮切花包裝設(shè)計(jì)
- 2025年中科院分區(qū)表已公布!Scientific Reports降至三區(qū)
- 官方認(rèn)定!CSSCI南大核心首批191家“青年學(xué)者友好期刊名單”
- 2023JCR影響因子正式公布!
- 國(guó)內(nèi)核心期刊分級(jí)情況概覽及說(shuō)明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學(xué)者
- 我用了一個(gè)很復(fù)雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問(wèn)題”。
- 重磅!CSSCI來(lái)源期刊(2023-2024版)最新期刊目錄看點(diǎn)分析!全網(wǎng)首發(fā)!
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應(yīng)該熟知的10個(gè)知識(shí)點(diǎn)。
- 注意,最新期刊論文格式標(biāo)準(zhǔn)已發(fā)布,論文寫(xiě)作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學(xué)術(shù)論文編寫(xiě)規(guī)則
- 盤(pán)點(diǎn)那些評(píng)職稱超管用的資源,1,3和5已經(jīng)“絕種”了