創(chuàng)建筆畫數(shù)字模式,探索漢字新的字序
漢字是中國人發(fā)明的記錄漢語的文字書寫系統(tǒng),也是世界上唯一被沿用至今的古老文字,在漫長的歷史過程中,人們不斷的創(chuàng)造新的漢字以滿足生產(chǎn)和生活的需要,有的字義也會隨之變化。漢字的詞匯義項眾多,通用假借頻繁,初學(xué)者不易把握字義,因此提供音韻、注解、例句等等的工具書運用而生。
《說文解字》是由東漢文字學(xué)家許慎于公元121年編著而成的,它開創(chuàng)了部首檢字的先河,經(jīng)唐宋明清等幾個朝代都對部首排檢法做過多次的改進。此后的1900多年里,人們一直不斷地探究著更簡易、更合理、更巧妙的漢字排序法……
當前,字典和辭書常用的是音序排列法、部首筆畫排列法、號碼排列法。
1.音序排列法,同音字的排序有分歧,不知讀音的字是無法檢索的。
2.部首排列法,無論在立部還是歸部都未統(tǒng)一。查一個字要分別在部首目錄、檢字表、正文三個區(qū)域?qū)ふ也拍芡瓿伞?/span>
3.筆畫排列法,相同筆畫數(shù)的漢字存在二義性。
4.號碼排列法,筆形和代碼之間沒有理據(jù),規(guī)則比較復(fù)雜,重碼字較多。
現(xiàn)行的排檢法都或多或少的有些缺點,根據(jù)多年的實踐和研究,我們提出一種新的“筆畫形狀數(shù)字模式”。
一、筆畫形狀的數(shù)字模式
現(xiàn)行漢字的筆畫形狀分類方法很多,最常見一種分類是將筆形分為31個,其中包括基本筆形6個和派生筆形25個。
目前,現(xiàn)行的漢字筆畫分類、命名還不統(tǒng)一,有把二三十種筆形歸入“橫、豎、撇、捺、折”五種基本筆畫類型的,還有個別筆形歸類不當?shù)膯栴}(如把“豎鉤”歸入“豎”)。為了呈現(xiàn)內(nèi)聚、均勻的風格,在有些字中有的筆畫要發(fā)生形變,規(guī)范字形中筆畫形變?nèi)我庑缘默F(xiàn)象時有發(fā)生,這表明我們在筆畫這個層次上整理工作做得不細,規(guī)范水平還有待提高。
剛開始研究漢字時,因整理分類筆畫、編寫記憶口訣而陷入泥淖,掙扎在漫長的瓶頸期內(nèi)……后來,經(jīng)過認真思考、熱烈討論、仔細研判,我們像考古隊員一樣,將斷裂、散亂且有殘缺的幾十個漢字筆畫修復(fù)、整理成(4大脈系)10串“(邏輯)鏈條”,并組建一個有理據(jù)性的漢字筆畫形狀數(shù)字模式。
筆畫形狀分類分級示意圖的詮釋及主要特點:
1.左側(cè)的第0、1、2、3組筆畫形狀的尾梢是順時針旋轉(zhuǎn),右側(cè)的第4、5、6、7、8、9組的筆畫形狀的尾梢是逆時針旋轉(zhuǎn)。
2.(左側(cè)的)第0組與(右側(cè)的)第4組的筆畫形狀其左右大致對稱的。第1組與(整體順時針旋轉(zhuǎn)90o的)第6組也是左右大致對稱的;同理,對照第2組與第7組、第3組與第8組也是如此。
3.從筆畫形狀的外部輪廓上看,整齊一致,協(xié)調(diào)美觀。10個組的圖形都有著高度的相似性。
4.同一組的筆畫形狀有依次遞增的明顯特征。
5.依據(jù)分類、分級關(guān)系,只要記住4個筆畫(即第0、1、4、6組的第1個筆畫),再借用聯(lián)想方法,便能記住每個筆畫的形狀所在位置及其排列順序。
看,這一排排、一摞摞筆畫就像超市貨架上擺放的“香蕉”,順溜、整齊又好看。假如你想,從中隨機選取兩個筆畫并互換一下位置,就會有亂套和不適的感覺。這說明,筆畫形狀的確有自然天成之美。
二、筆畫的標號、代號和名稱
“據(jù)形系聯(lián)”(許慎語),這句話現(xiàn)用于區(qū)分筆畫上也很合適的。我們以“相同尾梢”作為標準來,先劃分筆畫的類別,同類中再按照筆畫形狀的折點數(shù)量、單體長度來排列次序,并編制了筆畫的標號、代號、名稱表。
筆畫的標號、代號、名稱表(表1)的說明:
橫向疊層的有10個組,縱向并列的有5個級(組內(nèi)序號),全表共50(10×5)個筆畫。其中“(現(xiàn)行)筆畫”25個,占位率50%;“準筆畫”(筆畫家族的“新生兒”,當前為預(yù)備梯隊)22個,占位率44%;“泛筆畫”(前兩項之和;文中多用此義)47個,占位率94%;還有空位(L1、Y1、F1有名無實的)3個,占位率為6%。
第0組5個筆畫,對應(yīng)的標號(左上角)是01、02、03、04、05;對應(yīng)的代號(右上角)是P1、P2、P3、P4、P5;對應(yīng)的名稱(左下角)是撇一、撇二、撇三、撇四、撇五。其余的9個組也以此類推。
每一個筆畫都是兩位數(shù)字的標號,它由組號、級號組成,組號在十位上、級號在個位上(這里的標號也具有序號功效);代號由該筆畫的拼音首字母、組內(nèi)序號兩項組成;名稱由該組名、組內(nèi)序號兩項組成。
標注*的筆畫有P1、P2、P5、S1、S2、S3、X2、X4、L2、L4、D1、D2、D3、H1、H2、Y3、F3、T2、T4共19個,可作有些漢字的第一筆;未標注的筆畫則不能用作漢字的第一筆。
筆畫全集、例字表(表2)中筆畫折點樣式的解讀:(表2 圖片來源:作者自繪)
1.折點之處有停頓,通常是墨跡加重、加寬(最常見的一種)。如:“又”的第1筆的折點、“臺”的第1、4筆的兩個折點。
2.折點之處無明顯的折角(也稱作“彎”),書寫時不做停頓、平滑而過。如:“兒”的第2筆的第1個折點、“朵”的第2筆的第2個折點。
3.折點之前由粗變細、之后由細變粗,折點在最細的部位。如:“隊”(左耳刀旁)的第1筆的第2折點,尤其是“巡”的第1、2、3筆的折點(在印刷宋體里似連非連,有的手寫楷體則是完全分開的)。
4.折點的重疊區(qū)域有意延長、墨跡似有“漂移”的現(xiàn)象,如:“鄉(xiāng)”(1畫字)的第2、4折點、“之”(2畫字)的第2筆的第2折點、“?!保?/span>3畫字)的第3筆的第3折點、“水”(3畫字)的第3筆的折點。本條放寬了“折點”的定義范圍,也因此產(chǎn)生了“準筆畫”,并使“泛筆畫”的總數(shù)量大幅的增加。
增加了幾個一筆畫,如:N2、N3、N5、D3、D4等等,還有兩個一筆畫成了單體的漢字:“了”(L4)、“鄉(xiāng)”(P5)。
有些漢字的筆畫數(shù)量有所減少,如“紅”的筆畫數(shù)從6畫變成5畫、“饗”的從12畫變成9畫。
請注意:“マ”與“厶”,看似有些相像,其實二者的筆畫數(shù)不一樣?!哎蕖笔且还P畫;“ㄙ”是由、“ ”和“丶”組合的,書寫時中間要有一收筆(筆尖離開紙張),不是一筆畫,它的筆畫數(shù)是兩個。
三、用筆畫的標號給漢字排序
兩個或兩個以上的漢字列放在一起就有一個排隊、排序的問題。
漢字查字法或稱排檢法,從編者方而來說是排序,從使用者方而來說是檢索。排序要合理、簡易、科學(xué),檢索才能輕松、準確、快捷,甚至,僅依靠掃視(直接翻頁尋找)就能查到要查的字。
2021年3月1日,教育部、國家語委聯(lián)合發(fā)布實施的《通用規(guī)范漢字筆順規(guī)范》(GF0023-2020),為社會通用層面的漢字教學(xué)與研究、信息處理、排序檢索、辭書編纂等提供重要依據(jù)。
一個漢字,先按筆順排列其全部的筆畫,并在每個筆畫上面加注其相應(yīng)的標號,再把這些標號串聯(lián)起來就是該字的序號(相當于該字的身份證號碼)。
排序規(guī)則:選出定量的漢字,先對比以上漢字的第1個筆畫的(兩位數(shù))標號,按標號從小到大的排序。如果有幾個漢字的第1個筆畫的標號相同,就對比它們的第2個筆畫的標號,照樣從小到大的排序。以此類推,直到把選出的全部漢字都排序結(jié)束為止。
也可以用代號給漢字排序,代號排序和標號排序的規(guī)則大致相仿。這兩種排序方法得出的漢字順序是一模一樣的。
舉例:
中:丨(11、S1)、┐(12、S2)、一(61、H1)、丨(11、S1)。
①標號序:11、12、61、11→11126111;
②代號序:S1、S2、H1、S1→SS2HS。
國:丨(11、S1)、┐(12、S2)、一(61、H1)、一(61、H1)、丨(11、S1)、一(61、H1)、丶(51、D1)、一(61、H1)。
①標號序:11、12、61、61、11、61、51、61→1112616111615161;
②代號序:S1、S2、H1、H1、S1、H1、D1、H1→SS2HHSHDH。
給下面一句話的8個字排序:“她用新華字典查字”。
她:①520161221172;②D2PHX2SY2
用:①0122616111;②PX2HHS
新:①51615101616121515101016111;②DHDPHHXDDPPHS
華:①011101726111;②PSPY2HS
字:①5151023461;②DDP2L4H
典:①1112611111610151;②SS2HSSHPD
查:①611101411112616161;②HSPNSS2HHH
字:①5151023461;②DDP2L4H
這8個字的順序是:1華、2用、3典、4字(出現(xiàn)了兩次)、5新、6她、7查。
以上示范了(所抽樣的)漢字的新的“字序”、“字典序”,此排序方法的優(yōu)點是準確、清晰,人們從視覺上、邏輯上都可輕松地分辨出漢字的先后順序。
漢字的排序方式及其使用的范圍:一是筆畫阿拉伯數(shù)字標號的排序法,適用于計算機漢字信息處理技術(shù)應(yīng)用;二是筆畫代號的排序法,適用于字典正文、圖書檔案資料的標注及索引;三是筆畫名稱的排序法,適用于學(xué)校漢字漢語教學(xué)。
四、漢字的檢索
編排工具書索引、編制圖書檔案資料、排列姓名次序,以及漢字信息處理等,都需要有一個合理、巧妙的漢字字序排列法,以便查找。
漢字筆畫有50個,可用作單字第一筆的只有19個,因此字典的正文也劃分成這19個區(qū)域。
在字典正文頁眉處位置列出本頁的第一個和最后一個漢字的代號序,并給兩個代號序之間加上一個連接號。如果某頁的第一個字是“賀”,則寫“X2PSS2HSS2PD”。
漢字的“第1部件”都應(yīng)標注在本頁頁眉位置,同時,也可標注在漢字左側(cè)的空白位置,以便使用者查尋漢字。
要查找某個字,從該字的第1筆畫、第1部件開始,直接翻頁,用掃視法可查尋到。如:要查“笑”字,先從字典正文找到第1筆畫——“撇”、再找到第1部件,這樣,就能查到“笑”字。
采用上述的漢字檢索方法,字典本可以取消檢索表的。但是,為了讓使用者有個適應(yīng)過程,可設(shè)立一個(過渡性的)檢索表。把檢字表劃分成19個(第1筆畫的)區(qū)域,再按漢字的筆畫數(shù)量從少到多區(qū)分若干類,同類的漢字也按照(上述的)字序排隊。如“笑”字排在“撇”區(qū)的“10畫”區(qū)內(nèi)。
五、漢字信息處理
光學(xué)字符識別法(OCR)就是把文字看作一個小的圖像,采用圖像掃描儀等設(shè)備對文稿進行掃描,把文稿上的文字變成強弱的兩種電信號,再變成二進制數(shù)0和1儲存于計算機。
另外,還有統(tǒng)計模式識別方法,這兩種方法使用的效果并不理想。
在筆畫(形狀)的數(shù)字模式里,筆畫的分類和編號帶有顯著的“數(shù)理感”,如果能在漢字的每一個筆畫上都“暗記”其標號,而形成一種“邏輯模式識別法”,也許會優(yōu)于光學(xué)字符識別法、統(tǒng)計模式識別法。
如果采用漢字新的字序,通過調(diào)試或升級軟件,或許能將“交換碼”與“內(nèi)部碼”這兩種碼合并或統(tǒng)一,可使計算機的智能識別、漢字信息處理變得更加輕松快捷。
文章來源: 《文化產(chǎn)業(yè)》 http://m.xwlcp.cn/w/wy/32640.html
- 館藏《(增修)施南府志》的修復(fù)與保存
- 紙媒介在平面設(shè)計創(chuàng)作中的應(yīng)用與教學(xué)方法探討
- 廣電媒資從紙質(zhì)向數(shù)字化轉(zhuǎn)型中的敘事重構(gòu)研究
- 空間設(shè)計教學(xué)中紙藝技術(shù)的創(chuàng)意應(yīng)用與學(xué)生創(chuàng)新能力培養(yǎng)
- 人工智能驅(qū)動下的紙質(zhì)出版智能化轉(zhuǎn)型:技術(shù)融合與創(chuàng)新路徑
- 非遺傳統(tǒng)手工藝中紙張應(yīng)用的技術(shù)體系與活態(tài)傳承策略
- 紙藝術(shù)的跨文化符號:中西方剪紙的英譯對比研究
- 數(shù)智時代非物質(zhì)文化遺產(chǎn)的保護與傳承路徑——以河南剪紙為例
- 基于環(huán)保視角的紙制品企業(yè)廢物管理與再利用策略
- 圖書館紙質(zhì)文獻數(shù)字化存儲平臺的優(yōu)化設(shè)計與文件管理方法研究
- 2025年中科院分區(qū)表已公布!Scientific Reports降至三區(qū)
- 官方認定!CSSCI南大核心首批191家“青年學(xué)者友好期刊名單”
- 2023JCR影響因子正式公布!
- 國內(nèi)核心期刊分級情況概覽及說明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學(xué)者
- 我用了一個很復(fù)雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- 重磅!CSSCI來源期刊(2023-2024版)最新期刊目錄看點分析!全網(wǎng)首發(fā)!
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應(yīng)該熟知的10個知識點。
- 注意,最新期刊論文格式標準已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學(xué)術(shù)論文編寫規(guī)則
- 盤點那些評職稱超管用的資源,1,3和5已經(jīng)“絕種”了