您的位置：網(wǎng)站首頁(yè) > 優(yōu)秀論文 > 藝術(shù)論文 > 正文

藝術(shù)創(chuàng)作中的人工智能生成方式研究

作者：賈璐伊來(lái)源：《新美域》日期：2025-03-25人氣：239

引言

人工智能（Artificial Intelligence），是智能學(xué)科重要的組成部分，在機(jī)器人、語(yǔ)言識(shí)別、圖像識(shí)別、自然語(yǔ)言處理、專(zhuān)家系統(tǒng)、機(jī)器學(xué)習(xí)，計(jì)算機(jī)視覺(jué)等方面都有著深遠(yuǎn)的發(fā)展。在發(fā)展的過(guò)程中，取得了一系列突破，其中有關(guān)于人工智能生成內(nèi)容，也就是AIGC，更是引起了非常廣泛的關(guān)注。而藝術(shù)是對(duì)人類(lèi)心理活動(dòng)的映射，無(wú)論任何藝術(shù)作品的完成都離不開(kāi)人類(lèi)的藝術(shù)思維。

文章初步要概括藝術(shù)思維的概念與分類(lèi)，分析生成式人工智能，探討藝術(shù)思維與人工智能中生成式人工智能在藝術(shù)領(lǐng)域中的關(guān)系，以及對(duì)未來(lái)進(jìn)行展望。

一、人類(lèi)藝術(shù)思維的概念與分類(lèi)

藝術(shù)思維所指的就是現(xiàn)代藝術(shù)家在進(jìn)行藝術(shù)創(chuàng)作時(shí)經(jīng)常使用的思維方式，具有很強(qiáng)的概括作用。對(duì)客觀世界在感性的技術(shù)上進(jìn)行學(xué)習(xí)、概括、推理以及歸納。在創(chuàng)作時(shí)主要依靠的除了高超的藝術(shù)技能外，最重要就是藝術(shù)思維的把握。

（一）形象思維

形象思維是藝術(shù)創(chuàng)作的主要思維方式，以直觀形象和表象為支柱的思維過(guò)程。藝術(shù)家在認(rèn)識(shí)世界的過(guò)程中，對(duì)于客觀事物的表象進(jìn)行了解和取舍。在對(duì)生活累積感受和在大腦中進(jìn)行有選擇的存儲(chǔ)后，結(jié)合人成長(zhǎng)過(guò)程中所形成的感性判斷，來(lái)進(jìn)行手段形式的選擇，創(chuàng)造出符合思維的一種視覺(jué)形象。

（二）抽象思維

抽象思維又名邏輯思維，通常情況下會(huì)運(yùn)用語(yǔ)言、符號(hào)、理論、概念、數(shù)字等抽象材料來(lái)完成活動(dòng)實(shí)踐。形象思維偏向于本元，無(wú)論人在發(fā)展中如何變化，形象思維都如同根一樣扎根在人的大腦中。而抽象思維則如同枝蔓一樣，在成長(zhǎng)過(guò)程里不斷的被外界所影響，從而進(jìn)行學(xué)習(xí)與變化，發(fā)展出的一種工具性思維方式。

（三）靈感思維

靈感思維在藝術(shù)方面里體現(xiàn)在藝術(shù)創(chuàng)作過(guò)程中，大腦里會(huì)突然涌現(xiàn)出靈感的一種思維過(guò)程。這一現(xiàn)象的產(chǎn)生正是因?yàn)槿说拇竽X皮層處于高度興奮時(shí)的一種狀態(tài)，從而迸發(fā)出來(lái)的想法，即憑直覺(jué)領(lǐng)悟事情的本質(zhì)。

“靈感”一詞最早源自于希臘，柏拉圖在德謨克里特、蘇格拉底闡釋的基礎(chǔ)上，將靈感說(shuō)系統(tǒng)化、理論化，引用到文學(xué)創(chuàng)作里。他認(rèn)為詩(shī)人創(chuàng)作的優(yōu)秀詩(shī)歌靠的是神賜予的靈感而不是技藝。古希臘哲學(xué)家德謨克利特曾說(shuō)：“一位詩(shī)人以熱情并在神圣的靈感之下所作成的一切詩(shī)句，當(dāng)然是美的”。這更加說(shuō)明了靈感思維在藝術(shù)創(chuàng)作中屬于創(chuàng)新的核心。

二、生成式人工智能的發(fā)展及特征

生成式人工智能是一種利用復(fù)雜的算法、模型和規(guī)則。生成模型不僅可以學(xué)習(xí)輸入和輸出之間的關(guān)系，還學(xué)習(xí)了生成輸入數(shù)據(jù)的過(guò)程。它可以分析不同數(shù)據(jù)的關(guān)系來(lái)生成新的樣本。生成式人工智能的出現(xiàn)凝聚了人類(lèi)社會(huì)的智慧，并且也會(huì)對(duì)我們社會(huì)產(chǎn)生一定的反作用。

（一）生成式人工智能的發(fā)展歷程

生成式模型在人工智能領(lǐng)域有著悠久的歷史。隱馬可夫模型是一連串事件接續(xù)發(fā)生的機(jī)率，用以探索看不到的世界，現(xiàn)象和事實(shí)的數(shù)學(xué)工具，而高斯混合模型可以用高斯概率密度函數(shù)（正態(tài)分布曲線）精確地量化事物。這兩個(gè)模型在上個(gè)世紀(jì)50年代被開(kāi)發(fā)出來(lái)，生成了序列數(shù)據(jù)，比如語(yǔ)音或時(shí)間序列。

神經(jīng)網(wǎng)絡(luò)（Neural Network）也被稱(chēng)為人工神經(jīng)網(wǎng)絡(luò)，是深度學(xué)習(xí)算法的核心。靈感來(lái)源于人腦內(nèi)部的神經(jīng)元，模仿生物神經(jīng)元之間相互傳遞信號(hào)的方式，從而達(dá)到學(xué)習(xí)經(jīng)驗(yàn)的目的。神經(jīng)網(wǎng)絡(luò)在1943年被提出，這個(gè)神經(jīng)元模型開(kāi)啟了人類(lèi)研究生物神經(jīng)網(wǎng)絡(luò)的篇章。

生成式人工智能與藝術(shù)領(lǐng)域的新結(jié)合則是在1971年，加州大學(xué)圣地亞哥分校的科恩教授進(jìn)行機(jī)械臂的繪畫(huà)嘗試，這是最早的AI繪畫(huà)實(shí)踐。在之后的時(shí)間里，人類(lèi)探索出了VAE和GAN，圖像生成后面的發(fā)展，很大程度是建立在這兩個(gè)模型之上。而現(xiàn)如今，因?yàn)?/span>GAN模型在生成器和判別器上的缺陷，加州大學(xué)伯克利分校的學(xué)者提出去噪擴(kuò)散模型DDPM，衍生出近幾年關(guān)注度極高的繪圖網(wǎng)站DALL-E2，Stable Diffusion，Midjourney和NovelAI等等。

（二）生成式人工智能的基本特征

1. 隨機(jī)性與視覺(jué)一致性

藝術(shù)家在構(gòu)建生成式算法時(shí)，雖然可以設(shè)定圖形紋理、顏色配比、對(duì)稱(chēng)性等參數(shù)。算法的隨機(jī)性會(huì)讓每一件作品都不一樣，但是整個(gè)體系的作品也會(huì)具有視覺(jué)表達(dá)的整體一致性。以Midjourney舉例，2022年7月12日上線。只需要用戶輸入文本就可以得到需要的圖像。而用戶輸入提示詞后，系統(tǒng)會(huì)生成4張圖片。這四張圖片風(fēng)格統(tǒng)一，細(xì)節(jié)各不相同。在用戶輸入更改風(fēng)格的提示詞后，系統(tǒng)依舊生成另外四張其他系列的圖像。

2. 高效率和易迭代

相比于傳統(tǒng)的藝術(shù)創(chuàng)作需要從藝術(shù)體驗(yàn)、藝術(shù)構(gòu)思再到藝術(shù)創(chuàng)作等長(zhǎng)周期的活動(dòng)來(lái)看。生成式人工智能往往可以跨過(guò)藝術(shù)體驗(yàn)和創(chuàng)作等步驟。藝術(shù)創(chuàng)作者僅需要藝術(shù)構(gòu)思，即從傳統(tǒng)藝術(shù)主體創(chuàng)作者，轉(zhuǎn)變?yōu)樗囆g(shù)創(chuàng)作系統(tǒng)的架構(gòu)著。在完成生成系統(tǒng)程序的建構(gòu)后，就可以重復(fù)的去使用。除了可以設(shè)置主體風(fēng)格，還可以將程序遷移到不同的生成藝術(shù)作品創(chuàng)作中結(jié)合使用。

三、藝術(shù)思維與生成式人工智能的關(guān)系

從仿生學(xué)的角度來(lái)看，生成式人工智能主要依賴(lài)的模型——神經(jīng)網(wǎng)絡(luò)模型，與人腦神經(jīng)元有著密不可分的關(guān)系。人工智能的大腦就是一臺(tái)高智能的計(jì)算機(jī)，來(lái)模仿人腦的活動(dòng)內(nèi)容，并且針對(duì)于人類(lèi)日常生活中的一些習(xí)慣與活動(dòng)來(lái)進(jìn)行規(guī)律的總結(jié)。

每個(gè)人的人腦都由數(shù)十億的神經(jīng)元構(gòu)成，是神經(jīng)系統(tǒng)最基本的結(jié)構(gòu)和功能單位，中間由細(xì)胞體作為獨(dú)立的個(gè)體，周?chē)耐黄鸩糠謱⒚總€(gè)神經(jīng)元進(jìn)行連接。區(qū)別于人類(lèi)神經(jīng)元的分布規(guī)律錯(cuò)綜復(fù)雜，神經(jīng)網(wǎng)絡(luò)的神經(jīng)元按照一定的規(guī)則連接起來(lái)，形成了一個(gè)神經(jīng)網(wǎng)絡(luò)，每一排的神經(jīng)元需要通過(guò)訓(xùn)練，來(lái)下發(fā)不同的任務(wù)。

了解了有關(guān)于人類(lèi)神經(jīng)元和神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的異同，同比到藝術(shù)視角下，二者依舊有著千絲萬(wàn)縷的聯(lián)系。從一般意義來(lái)講，傳統(tǒng)對(duì)于藝術(shù)的創(chuàng)作過(guò)程可以分為三類(lèi)。即清代畫(huà)家鄭板橋總結(jié)歸納的“眼中之竹、胸中之竹和手中之竹”分別對(duì)應(yīng)了藝術(shù)體驗(yàn)、藝術(shù)構(gòu)思和藝術(shù)表現(xiàn)。

（一）藝術(shù)體驗(yàn)與數(shù)據(jù)采集

藝術(shù)體驗(yàn)是整個(gè)創(chuàng)作過(guò)程的第一步，是一切藝術(shù)創(chuàng)作的前提和基礎(chǔ)。在實(shí)際的藝術(shù)創(chuàng)作中，藝術(shù)家需要對(duì)想表達(dá)的作品進(jìn)行地域性的深入了解，才能創(chuàng)作出一幅真正具有地方或是種族特色的藝術(shù)作品。

徐悲鴻的馬十分經(jīng)典，不同形態(tài)的馬通過(guò)水墨簡(jiǎn)單勾勒就能傳達(dá)出神韻。正是因?yàn)樗ㄟ^(guò)與馬在實(shí)際的觀察與寫(xiě)生，才能夠?qū)τ隈R的形態(tài)、肌肉以及生活中的習(xí)性了如指掌。

而生成式人工智能想要進(jìn)行精確的圖像生成，自然而然地就需要前期對(duì)于數(shù)據(jù)的大量采集。從而獲取高質(zhì)量、多樣性和豐富性的數(shù)據(jù)，以滿足人工智能算法和模型的需求。其中主要依賴(lài)于圖像數(shù)據(jù)采集和語(yǔ)音數(shù)據(jù)采集等等。

使用圖像采集需要選擇多分辨率和類(lèi)型的圖像進(jìn)行獲取。為了保證數(shù)據(jù)質(zhì)量，采集前需要對(duì)所有圖像進(jìn)行簡(jiǎn)單的字符串或文本標(biāo)注。2021年1月OpenAI使用了大約120億的參數(shù)量對(duì)其進(jìn)行訓(xùn)練，可以應(yīng)用于任意的視覺(jué)分類(lèi)任務(wù)。與同時(shí)期的其他競(jìng)爭(zhēng)者拉開(kāi)差距。數(shù)據(jù)采樣越多，就意味著可以匹配越多的視覺(jué)分類(lèi)，在選擇上就可以找到更加準(zhǔn)確的數(shù)據(jù)庫(kù)。

（二）藝術(shù)構(gòu)思與模型架構(gòu)

藝術(shù)構(gòu)思則是藝術(shù)創(chuàng)作的第二部，在完成了藝術(shù)體驗(yàn)后。藝術(shù)家需要將腦中對(duì)于最終想法來(lái)進(jìn)行和施行的方案?；谏钪械乃夭膩?lái)改造創(chuàng)作，將零散的碎片拼湊出完整的視覺(jué)形象。實(shí)現(xiàn)自己對(duì)于審美價(jià)值的藝術(shù)意象。

藝術(shù)構(gòu)思大體可以分為三個(gè)階段，具體進(jìn)行時(shí)各階段的區(qū)分不是絕對(duì)的。以美國(guó)著名大地藝術(shù)家羅伯特·史密森創(chuàng)作的《螺旋形的防波堤》舉例。首先藝術(shù)家要在生活中因?yàn)槟骋粋€(gè)人、事、物的觸發(fā)從而產(chǎn)生表現(xiàn)欲望，而該作品所處18世紀(jì)中期，工業(yè)文明盛行。藝術(shù)家認(rèn)為工業(yè)文明帶來(lái)了很多負(fù)面的結(jié)果，所以他想通過(guò)大地藝術(shù)來(lái)完成一場(chǎng)人與自然的對(duì)話。第二階段為對(duì)需要加工的材料進(jìn)行選擇、提煉，重新排列組合，讓藝術(shù)作品的雛形在腦海中愈發(fā)清晰?！堵菪蔚姆啦ǖ獭返臉?gòu)思以一個(gè)大型的螺旋狀來(lái)表達(dá)湖水的流動(dòng)與大自然的“鬼斧神工”。第三階段則需要一些靈感，從而讓大腦處于活躍的狀態(tài)，把已具雛形的藝術(shù)意象進(jìn)一步具體、生動(dòng)、典型化，使之成為栩栩如生的藝術(shù)形象。

人腦新皮質(zhì)的皮質(zhì)柱的神經(jīng)元結(jié)構(gòu)是微小的柱狀體，且結(jié)構(gòu)是不變的，通過(guò)大腦新皮質(zhì)中約50萬(wàn)個(gè)皮質(zhì)柱，我們可以在大腦中儲(chǔ)存大量的信息，作為功能列表存儲(chǔ)起來(lái)，形成知識(shí)的“模塊”。當(dāng)我們需要使用的時(shí)候，我們可以將各“模塊”自由組合，通過(guò)學(xué)習(xí)能力，將舊知識(shí)運(yùn)用于新的經(jīng)驗(yàn)上，在這一點(diǎn)上，人工智能大腦是還需要學(xué)習(xí)和進(jìn)步的。

生成式人工智能在收集大量數(shù)據(jù)后，大多數(shù)網(wǎng)站依靠著Transformer的模型架構(gòu)來(lái)對(duì)數(shù)據(jù)進(jìn)行梳理和擺放。在其核心位置，Transformer模型由編碼器和解碼器兩個(gè)模塊進(jìn)行組合。完整的Transformer模型通過(guò)將多個(gè)編碼器和解碼器層堆疊在一起來(lái)構(gòu)建。每個(gè)層獨(dú)立處理輸入序列，使模型能夠?qū)W習(xí)分層表示并捕獲數(shù)據(jù)中的復(fù)雜模式。編碼器將其輸出傳遞給解碼器，后者根據(jù)輸入生成最終的輸出序列。

人腦的藝術(shù)構(gòu)思雖然較比人工智能更為隨意，但二者都需要對(duì)所處容量的數(shù)據(jù)做出內(nèi)容與數(shù)量的選擇。一味的以多來(lái)取勝并不可靠，反而會(huì)影響最終效果的呈現(xiàn)。

（三）藝術(shù)表現(xiàn)與圖像生成

經(jīng)過(guò)藝術(shù)體驗(yàn)與藝術(shù)構(gòu)思前兩個(gè)步驟，想要將藝術(shù)家腦中的想法付諸于實(shí)踐的落實(shí)活動(dòng)，將藝術(shù)意象物態(tài)化就是藝術(shù)表現(xiàn)。藝術(shù)表現(xiàn)需要運(yùn)用手段與技巧，來(lái)將前面的藝術(shù)體驗(yàn)與構(gòu)思進(jìn)行捏合與實(shí)踐，完成藝術(shù)意象物態(tài)化。本質(zhì)上是一種審美表現(xiàn)活動(dòng)。如同梵高所繪畫(huà)的《星月夜》，無(wú)論是從個(gè)人經(jīng)歷還是藝術(shù)構(gòu)思，最終所以色調(diào)和極其具有藝術(shù)風(fēng)格的線條，表達(dá)出了他希望通過(guò)自己身邊的事物去描繪他內(nèi)心的想法。希望大家通過(guò)畫(huà)去了解他當(dāng)時(shí)處境是多么的艱難，但他依然在努力的向上生長(zhǎng)造作，直到死去。

而目前生成式人工智能普遍依賴(lài)于擴(kuò)散模型來(lái)進(jìn)行圖像的生成。用戶只需要在界面輸入關(guān)鍵詞，系統(tǒng)就會(huì)在數(shù)據(jù)庫(kù)中進(jìn)行相關(guān)文本與圖像的連接，生成更加真實(shí)和更加準(zhǔn)確的畫(huà)像。以最新生成式人工智能的成果Sora舉例，通過(guò)文本指令，Sora 可以直接輸出長(zhǎng)達(dá) 60 秒的視頻，并且包含高度細(xì)致的背景、復(fù)雜的多角度鏡頭，以及富有情感的多個(gè)角色。通過(guò)觀察大量數(shù)據(jù)，系統(tǒng)學(xué)會(huì)了許多關(guān)于世界的物理規(guī)律。但也在一些個(gè)別情況下會(huì)超出電腦的運(yùn)算范圍，出現(xiàn)不合邏輯的漏洞，例如多跟手指或者是平地起高樓的情況。

有趣的是和人類(lèi)不同，人類(lèi)可以在藝術(shù)實(shí)踐中感受到與設(shè)想不足之初并加以改善。但是在人工智能眼里，一切還沒(méi)有完善的程序內(nèi)所做出的決策都是正確的，往往會(huì)產(chǎn)生出錯(cuò)誤中的藝術(shù)。人之所以有思維，就是人可以自我的判斷一種情況的錯(cuò)誤，是不是可以變成另一種情況的正確。人工智能的極限就是自我意識(shí)。如果它認(rèn)為自己的漏洞是一種創(chuàng)新的話，那某種意義上來(lái)講他們也擁有著所謂的創(chuàng)新藝術(shù)思維。

四、結(jié)語(yǔ)

事實(shí)上，人類(lèi)一直在探索關(guān)于知識(shí)與學(xué)習(xí)的奧秘，洞穴之喻（Allegory of the Cave）是柏拉圖在《理想國(guó)》中描述的對(duì)人類(lèi)知識(shí)的基本想象。而洛克的白板說(shuō)主張人生下來(lái)就是一塊白板，后天的學(xué)習(xí)與經(jīng)驗(yàn)積累讓這張白紙有了內(nèi)容。人工智能就是通過(guò)數(shù)據(jù)的輸入與歸類(lèi)，來(lái)讓機(jī)器提高它的學(xué)習(xí)能力，而這里的數(shù)據(jù)就是我們?nèi)祟?lèi)所指的“經(jīng)驗(yàn)”。在不斷的學(xué)習(xí)中機(jī)器模仿人類(lèi)對(duì)于抽象思維和審美創(chuàng)造力。

人工智能作為人類(lèi)實(shí)踐的產(chǎn)物，目前來(lái)看還只是作為輔佐人類(lèi)藝術(shù)的工具，沒(méi)有具備真正意義上的主體性。作為客體，技術(shù)可以反推人的審美和生活。有沒(méi)有一種可能技術(shù)會(huì)反推人類(lèi)發(fā)展出一個(gè)新的視覺(jué)領(lǐng)域和世界和思維空間，到那個(gè)時(shí)候主體與客體會(huì)達(dá)到一種新的平衡與統(tǒng)一。

從藝術(shù)思維到生成式人工智能，我們領(lǐng)略到了人腦與機(jī)器之間的關(guān)聯(lián)。通過(guò)對(duì)腦神經(jīng)的不斷挖掘與探索，可以?xún)?yōu)化神經(jīng)網(wǎng)絡(luò)模型，為未來(lái)的藝術(shù)領(lǐng)域做出更大的貢獻(xiàn)。在這個(gè)過(guò)程中，我們也可以不斷的克服自身學(xué)習(xí)的局限和缺點(diǎn)，提升我們的藝術(shù)思維與方法，激發(fā)人類(lèi)對(duì)于學(xué)習(xí)活動(dòng)的更多思考，為人類(lèi)帶來(lái)更加美好的未來(lái)。

文章來(lái)源：《新美域》 http://m.xwlcp.cn/w/qk/29468.html

關(guān)鍵字：論文篇論文發(fā)表咨詢(xún)藝術(shù)論文

上一篇：手卷繪畫(huà)形制的時(shí)空表達(dá)研究
下一篇：宋代人物畫(huà)中的形神研究