優(yōu)勝?gòu)倪x擇開(kāi)始,我們是您最好的選擇!—— 中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)
0373-5939925
2851259250@qq.com
我要檢測(cè) 我要投稿 合法期刊查詢

藝術(shù)創(chuàng)作中的人工智能生成方式研究

作者:賈璐伊來(lái)源:《新美域》日期:2025-03-25人氣:115

引言

    人工智能(Artificial Intelligence),是智能學(xué)科重要的組成部分,在機(jī)器人、語(yǔ)言識(shí)別、圖像識(shí)別、自然語(yǔ)言處理、專家系統(tǒng)、機(jī)器學(xué)習(xí),計(jì)算機(jī)視覺(jué)等方面都有著深遠(yuǎn)的發(fā)展。在發(fā)展的過(guò)程中,取得了一系列突破,其中有關(guān)于人工智能生成內(nèi)容,也就是AIGC,更是引起了非常廣泛的關(guān)注。而藝術(shù)是對(duì)人類心理活動(dòng)的映射,無(wú)論任何藝術(shù)作品的完成都離不開(kāi)人類的藝術(shù)思維。

文章初步要概括藝術(shù)思維的概念與分類,分析生成式人工智能,探討藝術(shù)思維與人工智能中生成式人工智能在藝術(shù)領(lǐng)域中的關(guān)系,以及對(duì)未來(lái)進(jìn)行展望。

一、人類藝術(shù)思維的概念與分類

藝術(shù)思維所指的就是現(xiàn)代藝術(shù)家在進(jìn)行藝術(shù)創(chuàng)作時(shí)經(jīng)常使用的思維方式,具有很強(qiáng)的概括作用。對(duì)客觀世界在感性的技術(shù)上進(jìn)行學(xué)習(xí)、概括、推理以及歸納。在創(chuàng)作時(shí)主要依靠的除了高超的藝術(shù)技能外,最重要就是藝術(shù)思維的把握。

形象思維

形象思維是藝術(shù)創(chuàng)作的主要思維方式,以直觀形象和表象為支柱的思維過(guò)程。藝術(shù)家在認(rèn)識(shí)世界的過(guò)程中,對(duì)于客觀事物的表象進(jìn)行了解和取舍。在對(duì)生活累積感受和在大腦中進(jìn)行有選擇的存儲(chǔ)后,結(jié)合人成長(zhǎng)過(guò)程中所形成的感性判斷,來(lái)進(jìn)行手段形式的選擇,創(chuàng)造出符合思維的一種視覺(jué)形象。

抽象思維

抽象思維又名邏輯思維,通常情況下會(huì)運(yùn)用語(yǔ)言、符號(hào)、理論、概念、數(shù)字等抽象材料來(lái)完成活動(dòng)實(shí)踐。形象思維偏向于本元,無(wú)論人在發(fā)展中如何變化,形象思維都如同根一樣扎根在人的大腦中。而抽象思維則如同枝蔓一樣,在成長(zhǎng)過(guò)程里不斷的被外界所影響,從而進(jìn)行學(xué)習(xí)與變化,發(fā)展出的一種工具性思維方式。

靈感思維

靈感思維在藝術(shù)方面里體現(xiàn)在藝術(shù)創(chuàng)作過(guò)程中,大腦里會(huì)突然涌現(xiàn)出靈感的一種思維過(guò)程。這一現(xiàn)象的產(chǎn)生正是因?yàn)槿说拇竽X皮層處于高度興奮時(shí)的一種狀態(tài),從而迸發(fā)出來(lái)的想法,即憑直覺(jué)領(lǐng)悟事情的本質(zhì)。

靈感一詞最早源自于希臘,柏拉圖在德謨克里特、蘇格拉底闡釋的基礎(chǔ)上,將靈感說(shuō)系統(tǒng)化、理論化,引用到文學(xué)創(chuàng)作里。他認(rèn)為詩(shī)人創(chuàng)作的優(yōu)秀詩(shī)歌靠的是神賜予的靈感而不是技藝。古希臘哲學(xué)家德謨克利特曾說(shuō):一位詩(shī)人以熱情并在神圣的靈感之下所作成的一切詩(shī)句,當(dāng)然是美的。這更加說(shuō)明了靈感思維在藝術(shù)創(chuàng)作中屬于創(chuàng)新的核心。

二、生成式人工智能的發(fā)展及特征

生成式人工智能是一種利用復(fù)雜的算法、模型和規(guī)則。生成模型不僅可以學(xué)習(xí)輸入和輸出之間的關(guān)系,還學(xué)習(xí)了生成輸入數(shù)據(jù)的過(guò)程。它可以分析不同數(shù)據(jù)的關(guān)系來(lái)生成新的樣本。生成式人工智能的出現(xiàn)凝聚了人類社會(huì)的智慧,并且也會(huì)對(duì)我們社會(huì)產(chǎn)生一定的反作用。

(一)生成式人工智能的發(fā)展歷程

生成式模型在人工智能領(lǐng)域有著悠久的歷史。隱馬可夫模型是一連串事件接續(xù)發(fā)生的機(jī)率,用以探索看不到的世界,現(xiàn)象和事實(shí)的數(shù)學(xué)工具,而高斯混合模型可以用高斯概率密度函數(shù)(正態(tài)分布曲線)精確地量化事物。這兩個(gè)模型在上個(gè)世紀(jì)50年代被開(kāi)發(fā)出來(lái),生成了序列數(shù)據(jù),比如語(yǔ)音或時(shí)間序列。

神經(jīng)網(wǎng)絡(luò)(Neural Network)也被稱為人工神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)算法的核心。靈感來(lái)源于人腦內(nèi)部的神經(jīng)元,模仿生物神經(jīng)元之間相互傳遞信號(hào)的方式,從而達(dá)到學(xué)習(xí)經(jīng)驗(yàn)的目的。神經(jīng)網(wǎng)絡(luò)在1943年被提出,這個(gè)神經(jīng)元模型開(kāi)啟了人類研究生物神經(jīng)網(wǎng)絡(luò)的篇章。

生成式人工智能與藝術(shù)領(lǐng)域的新結(jié)合則是在1971年,加州大學(xué)圣地亞哥分校的科恩教授進(jìn)行機(jī)械臂的繪畫(huà)嘗試,這是最早的AI繪畫(huà)實(shí)踐。在之后的時(shí)間里,人類探索出了VAEGAN,圖像生成后面的發(fā)展,很大程度是建立在這兩個(gè)模型之上。而現(xiàn)如今,因?yàn)?/span>GAN模型在生成器和判別器上的缺陷,加州大學(xué)伯克利分校的學(xué)者提出去噪擴(kuò)散模型DDPM,衍生出近幾年關(guān)注度極高的繪圖網(wǎng)站DALL-E2,Stable DiffusionMidjourneyNovelAI等等。

(二)生成式人工智能的基本特征

1. 隨機(jī)性與視覺(jué)一致性

藝術(shù)家在構(gòu)建生成式算法時(shí),雖然可以設(shè)定圖形紋理、顏色配比、對(duì)稱性等參數(shù)。算法的隨機(jī)性會(huì)讓每一件作品都不一樣,但是整個(gè)體系的作品也會(huì)具有視覺(jué)表達(dá)的整體一致性。以Midjourney舉例,2022712日上線。只需要用戶輸入文本就可以得到需要的圖像。而用戶輸入提示詞后,系統(tǒng)會(huì)生成4張圖片。這四張圖片風(fēng)格統(tǒng)一,細(xì)節(jié)各不相同。在用戶輸入更改風(fēng)格的提示詞后,系統(tǒng)依舊生成另外四張其他系列的圖像。

2. 高效率和易迭代

相比于傳統(tǒng)的藝術(shù)創(chuàng)作需要從藝術(shù)體驗(yàn)、藝術(shù)構(gòu)思再到藝術(shù)創(chuàng)作等長(zhǎng)周期的活動(dòng)來(lái)看。生成式人工智能往往可以跨過(guò)藝術(shù)體驗(yàn)和創(chuàng)作等步驟。藝術(shù)創(chuàng)作者僅需要藝術(shù)構(gòu)思,即從傳統(tǒng)藝術(shù)主體創(chuàng)作者,轉(zhuǎn)變?yōu)樗囆g(shù)創(chuàng)作系統(tǒng)的架構(gòu)著。在完成生成系統(tǒng)程序的建構(gòu)后,就可以重復(fù)的去使用。除了可以設(shè)置主體風(fēng)格,還可以將程序遷移到不同的生成藝術(shù)作品創(chuàng)作中結(jié)合使用。

三、藝術(shù)思維與生成式人工智能的關(guān)系

從仿生學(xué)的角度來(lái)看,生成式人工智能主要依賴的模型——神經(jīng)網(wǎng)絡(luò)模型,與人腦神經(jīng)元有著密不可分的關(guān)系。人工智能的大腦就是一臺(tái)高智能的計(jì)算機(jī),來(lái)模仿人腦的活動(dòng)內(nèi)容,并且針對(duì)于人類日常生活中的一些習(xí)慣與活動(dòng)來(lái)進(jìn)行規(guī)律的總結(jié)。

每個(gè)人的人腦都由數(shù)十億的神經(jīng)元構(gòu)成,是神經(jīng)系統(tǒng)最基本的結(jié)構(gòu)和功能單位,中間由細(xì)胞體作為獨(dú)立的個(gè)體,周?chē)耐黄鸩糠謱⒚總€(gè)神經(jīng)元進(jìn)行連接。區(qū)別于人類神經(jīng)元的分布規(guī)律錯(cuò)綜復(fù)雜,神經(jīng)網(wǎng)絡(luò)的神經(jīng)元按照一定的規(guī)則連接起來(lái),形成了一個(gè)神經(jīng)網(wǎng)絡(luò),每一排的神經(jīng)元需要通過(guò)訓(xùn)練,來(lái)下發(fā)不同的任務(wù)。

了解了有關(guān)于人類神經(jīng)元和神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的異同,同比到藝術(shù)視角下,二者依舊有著千絲萬(wàn)縷的聯(lián)系。從一般意義來(lái)講,傳統(tǒng)對(duì)于藝術(shù)的創(chuàng)作過(guò)程可以分為三類。即清代畫(huà)家鄭板橋總結(jié)歸納的“眼中之竹、胸中之竹和手中之竹”分別對(duì)應(yīng)了藝術(shù)體驗(yàn)、藝術(shù)構(gòu)思和藝術(shù)表現(xiàn)。

(一)藝術(shù)體驗(yàn)與數(shù)據(jù)采集

藝術(shù)體驗(yàn)是整個(gè)創(chuàng)作過(guò)程的第一步,是一切藝術(shù)創(chuàng)作的前提和基礎(chǔ)。在實(shí)際的藝術(shù)創(chuàng)作中,藝術(shù)家需要對(duì)想表達(dá)的作品進(jìn)行地域性的深入了解,才能創(chuàng)作出一幅真正具有地方或是種族特色的藝術(shù)作品。

徐悲鴻的馬十分經(jīng)典,不同形態(tài)的馬通過(guò)水墨簡(jiǎn)單勾勒就能傳達(dá)出神韻。正是因?yàn)樗ㄟ^(guò)與馬在實(shí)際的觀察與寫(xiě)生,才能夠?qū)τ隈R的形態(tài)、肌肉以及生活中的習(xí)性了如指掌。

而生成式人工智能想要進(jìn)行精確的圖像生成,自然而然地就需要前期對(duì)于數(shù)據(jù)的大量采集。從而獲取高質(zhì)量、多樣性和豐富性的數(shù)據(jù),以滿足人工智能算法和模型的需求。其中主要依賴于圖像數(shù)據(jù)采集和語(yǔ)音數(shù)據(jù)采集等等。

使用圖像采集需要選擇多分辨率和類型的圖像進(jìn)行獲取。為了保證數(shù)據(jù)質(zhì)量,采集前需要對(duì)所有圖像進(jìn)行簡(jiǎn)單的字符串或文本標(biāo)注。20211OpenAI使用了大約120億的參數(shù)量對(duì)其進(jìn)行訓(xùn)練,可以應(yīng)用于任意的視覺(jué)分類任務(wù)。與同時(shí)期的其他競(jìng)爭(zhēng)者拉開(kāi)差距。數(shù)據(jù)采樣越多,就意味著可以匹配越多的視覺(jué)分類,在選擇上就可以找到更加準(zhǔn)確的數(shù)據(jù)庫(kù)。

(二)藝術(shù)構(gòu)思與模型架構(gòu)

藝術(shù)構(gòu)思則是藝術(shù)創(chuàng)作的第二部,在完成了藝術(shù)體驗(yàn)后。藝術(shù)家需要將腦中對(duì)于最終想法來(lái)進(jìn)行和施行的方案?;谏钪械乃夭膩?lái)改造創(chuàng)作,將零散的碎片拼湊出完整的視覺(jué)形象。實(shí)現(xiàn)自己對(duì)于審美價(jià)值的藝術(shù)意象。

藝術(shù)構(gòu)思大體可以分為三個(gè)階段,具體進(jìn)行時(shí)各階段的區(qū)分不是絕對(duì)的。以美國(guó)著名大地藝術(shù)家羅伯特·史密森創(chuàng)作的《螺旋形的防波堤》舉例。首先藝術(shù)家要在生活中因?yàn)槟骋粋€(gè)人、事、物的觸發(fā)從而產(chǎn)生表現(xiàn)欲望,而該作品所處18世紀(jì)中期,工業(yè)文明盛行。藝術(shù)家認(rèn)為工業(yè)文明帶來(lái)了很多負(fù)面的結(jié)果,所以他想通過(guò)大地藝術(shù)來(lái)完成一場(chǎng)人與自然的對(duì)話。第二階段為對(duì)需要加工的材料進(jìn)行選擇、提煉,重新排列組合,讓藝術(shù)作品的雛形在腦海中愈發(fā)清晰。《螺旋形的防波堤》的構(gòu)思以一個(gè)大型的螺旋狀來(lái)表達(dá)湖水的流動(dòng)與大自然的鬼斧神工。 第三階段則需要一些靈感,從而讓大腦處于活躍的狀態(tài),把已具雛形的藝術(shù)意象進(jìn)一步具體、生動(dòng)、典型化,使之成為栩栩如生的藝術(shù)形象。

人腦新皮質(zhì)的皮質(zhì)柱的神經(jīng)元結(jié)構(gòu)是微小的柱狀體,且結(jié)構(gòu)是不變的,通過(guò)大腦新皮質(zhì)中約50萬(wàn)個(gè)皮質(zhì)柱,我們可以在大腦中儲(chǔ)存大量的信息,作為功能列表存儲(chǔ)起來(lái),形成知識(shí)的模塊。當(dāng)我們需要使用的時(shí)候,我們可以將各模塊自由組合,通過(guò)學(xué)習(xí)能力,將舊知識(shí)運(yùn)用于新的經(jīng)驗(yàn)上,在這一點(diǎn)上,人工智能大腦是還需要學(xué)習(xí)和進(jìn)步的。

生成式人工智能在收集大量數(shù)據(jù)后,大多數(shù)網(wǎng)站依靠著Transformer的模型架構(gòu)來(lái)對(duì)數(shù)據(jù)進(jìn)行梳理和擺放。在其核心位置,Transformer模型由編碼器和解碼器兩個(gè)模塊進(jìn)行組合。完整的Transformer模型通過(guò)將多個(gè)編碼器和解碼器層堆疊在一起來(lái)構(gòu)建。每個(gè)層獨(dú)立處理輸入序列,使模型能夠?qū)W習(xí)分層表示并捕獲數(shù)據(jù)中的復(fù)雜模式。編碼器將其輸出傳遞給解碼器,后者根據(jù)輸入生成最終的輸出序列。

人腦的藝術(shù)構(gòu)思雖然較比人工智能更為隨意,但二者都需要對(duì)所處容量的數(shù)據(jù)做出內(nèi)容與數(shù)量的選擇。一味的以多來(lái)取勝并不可靠,反而會(huì)影響最終效果的呈現(xiàn)。

(三)藝術(shù)表現(xiàn)與圖像生成

經(jīng)過(guò)藝術(shù)體驗(yàn)與藝術(shù)構(gòu)思前兩個(gè)步驟,想要將藝術(shù)家腦中的想法付諸于實(shí)踐的落實(shí)活動(dòng),將藝術(shù)意象物態(tài)化就是藝術(shù)表現(xiàn)。藝術(shù)表現(xiàn)需要運(yùn)用手段與技巧,來(lái)將前面的藝術(shù)體驗(yàn)與構(gòu)思進(jìn)行捏合與實(shí)踐,完成藝術(shù)意象物態(tài)化。本質(zhì)上是一種審美表現(xiàn)活動(dòng)。如同梵高所繪畫(huà)的《星月夜》,無(wú)論是從個(gè)人經(jīng)歷還是藝術(shù)構(gòu)思,最終所以色調(diào)和極其具有藝術(shù)風(fēng)格的線條,表達(dá)出了他希望通過(guò)自己身邊的事物去描繪他內(nèi)心的想法。希望大家通過(guò)畫(huà)去了解他當(dāng)時(shí)處境是多么的艱難,但他依然在努力的向上生長(zhǎng)造作,直到死去。

而目前生成式人工智能普遍依賴于擴(kuò)散模型來(lái)進(jìn)行圖像的生成。用戶只需要在界面輸入關(guān)鍵詞,系統(tǒng)就會(huì)在數(shù)據(jù)庫(kù)中進(jìn)行相關(guān)文本與圖像的連接,生成更加真實(shí)和更加準(zhǔn)確的畫(huà)像。以最新生成式人工智能的成果Sora舉例,通過(guò)文本指令,Sora 可以直接輸出長(zhǎng)達(dá) 60 秒的視頻,并且包含高度細(xì)致的背景、復(fù)雜的多角度鏡頭,以及富有情感的多個(gè)角色。通過(guò)觀察大量數(shù)據(jù),系統(tǒng)學(xué)會(huì)了許多關(guān)于世界的物理規(guī)律。但也在一些個(gè)別情況下會(huì)超出電腦的運(yùn)算范圍,出現(xiàn)不合邏輯的漏洞,例如多跟手指或者是平地起高樓的情況。

有趣的是和人類不同,人類可以在藝術(shù)實(shí)踐中感受到與設(shè)想不足之初并加以改善。但是在人工智能眼里,一切還沒(méi)有完善的程序內(nèi)所做出的決策都是正確的,往往會(huì)產(chǎn)生出錯(cuò)誤中的藝術(shù)。人之所以有思維,就是人可以自我的判斷一種情況的錯(cuò)誤,是不是可以變成另一種情況的正確。人工智能的極限就是自我意識(shí)。如果它認(rèn)為自己的漏洞是一種創(chuàng)新的話,那某種意義上來(lái)講他們也擁有著所謂的創(chuàng)新藝術(shù)思維。

四、結(jié)語(yǔ)

事實(shí)上,人類一直在探索關(guān)于知識(shí)與學(xué)習(xí)的奧秘,洞穴之喻(Allegory of the Cave)是柏拉圖在《理想國(guó)》中描述的對(duì)人類知識(shí)的基本想象。而洛克的白板說(shuō)主張人生下來(lái)就是一塊白板,后天的學(xué)習(xí)與經(jīng)驗(yàn)積累讓這張白紙有了內(nèi)容。人工智能就是通過(guò)數(shù)據(jù)的輸入與歸類,來(lái)讓機(jī)器提高它的學(xué)習(xí)能力,而這里的數(shù)據(jù)就是我們?nèi)祟愃傅?/span>經(jīng)驗(yàn)。在不斷的學(xué)習(xí)中機(jī)器模仿人類對(duì)于抽象思維和審美創(chuàng)造力。

人工智能作為人類實(shí)踐的產(chǎn)物,目前來(lái)看還只是作為輔佐人類藝術(shù)的工具,沒(méi)有具備真正意義上的主體性。作為客體,技術(shù)可以反推人的審美和生活。有沒(méi)有一種可能技術(shù)會(huì)反推人類發(fā)展出一個(gè)新的視覺(jué)領(lǐng)域和世界和思維空間,到那個(gè)時(shí)候主體與客體會(huì)達(dá)到一種新的平衡與統(tǒng)一。

從藝術(shù)思維到生成式人工智能,我們領(lǐng)略到了人腦與機(jī)器之間的關(guān)聯(lián)。通過(guò)對(duì)腦神經(jīng)的不斷挖掘與探索,可以優(yōu)化神經(jīng)網(wǎng)絡(luò)模型,為未來(lái)的藝術(shù)領(lǐng)域做出更大的貢獻(xiàn)。在這個(gè)過(guò)程中,我們也可以不斷的克服自身學(xué)習(xí)的局限和缺點(diǎn),提升我們的藝術(shù)思維與方法,激發(fā)人類對(duì)于學(xué)習(xí)活動(dòng)的更多思考,為人類帶來(lái)更加美好的未來(lái)。


文章來(lái)源:  《新美域》   http://m.xwlcp.cn/w/qk/29468.html

網(wǎng)絡(luò)客服QQ: 沈編輯

投訴建議:0373-5939925????投訴建議QQ:

招聘合作:2851259250@qq.com (如您是期刊主編、文章高手,可通過(guò)郵件合作)

地址:河南省新鄉(xiāng)市金穗大道東段266號(hào)中州期刊聯(lián)盟 ICP備案號(hào):豫ICP備2020036848

【免責(zé)聲明】:中州期刊聯(lián)盟所提供的信息資源如有侵權(quán)、違規(guī),請(qǐng)及時(shí)告知。

版權(quán)所有:中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)

關(guān)注”中州期刊聯(lián)盟”公眾號(hào)
了解論文寫(xiě)作全系列課程

核心期刊為何難發(fā)?

論文發(fā)表總嫌貴?

職院?jiǎn)挝话l(fā)核心?

掃描關(guān)注公眾號(hào)

論文發(fā)表不再有疑惑

論文寫(xiě)作全系列課程

掃碼了解更多

輕松寫(xiě)核心期刊論文

在線留言