創(chuàng)建筆畫數(shù)字模式，探索漢字新的字序

作者：唐維建,唐維強,唐倩琳來源：《文化產(chǎn)業(yè)》日期：2024-11-02人氣：430

漢字是中國人發(fā)明的記錄漢語的文字書寫系統(tǒng)，也是世界上唯一被沿用至今的古老文字，在漫長的歷史過程中，人們不斷的創(chuàng)造新的漢字以滿足生產(chǎn)和生活的需要，有的字義也會隨之變化。漢字的詞匯義項眾多，通用假借頻繁，初學者不易把握字義，因此提供音韻、注解、例句等等的工具書運用而生。

《說文解字》是由東漢文字學家許慎于公元121年編著而成的，它開創(chuàng)了部首檢字的先河，經(jīng)唐宋明清等幾個朝代都對部首排檢法做過多次的改進。此后的1900多年里，人們一直不斷地探究著更簡易、更合理、更巧妙的漢字排序法……

當前，字典和辭書常用的是音序排列法、部首筆畫排列法、號碼排列法。

1.音序排列法，同音字的排序有分歧，不知讀音的字是無法檢索的。

2.部首排列法，無論在立部還是歸部都未統(tǒng)一。查一個字要分別在部首目錄、檢字表、正文三個區(qū)域尋找才能完成。

3.筆畫排列法，相同筆畫數(shù)的漢字存在二義性。

4.號碼排列法，筆形和代碼之間沒有理據(jù)，規(guī)則比較復雜，重碼字較多。

現(xiàn)行的排檢法都或多或少的有些缺點，根據(jù)多年的實踐和研究，我們提出一種新的“筆畫形狀數(shù)字模式”。

一、筆畫形狀的數(shù)字模式

現(xiàn)行漢字的筆畫形狀分類方法很多，最常見一種分類是將筆形分為31個，其中包括基本筆形6個和派生筆形25個。

目前，現(xiàn)行的漢字筆畫分類、命名還不統(tǒng)一，有把二三十種筆形歸入“橫、豎、撇、捺、折”五種基本筆畫類型的，還有個別筆形歸類不當?shù)膯栴}（如把“豎鉤”歸入“豎”）。為了呈現(xiàn)內聚、均勻的風格，在有些字中有的筆畫要發(fā)生形變，規(guī)范字形中筆畫形變任意性的現(xiàn)象時有發(fā)生，這表明我們在筆畫這個層次上整理工作做得不細，規(guī)范水平還有待提高。

剛開始研究漢字時，因整理分類筆畫、編寫記憶口訣而陷入泥淖，掙扎在漫長的瓶頸期內……后來，經(jīng)過認真思考、熱烈討論、仔細研判，我們像考古隊員一樣，將斷裂、散亂且有殘缺的幾十個漢字筆畫修復、整理成（4大脈系）10串“（邏輯）鏈條”，并組建一個有理據(jù)性的漢字筆畫形狀數(shù)字模式。

筆畫形狀分類分級示意圖的詮釋及主要特點：

1.左側的第0、1、2、3組筆畫形狀的尾梢是順時針旋轉，右側的第4、5、6、7、8、9組的筆畫形狀的尾梢是逆時針旋轉。

2.（左側的）第0組與（右側的）第4組的筆畫形狀其左右大致對稱的。第1組與（整體順時針旋轉90o的）第6組也是左右大致對稱的；同理，對照第2組與第7組、第3組與第8組也是如此。

3.從筆畫形狀的外部輪廓上看，整齊一致，協(xié)調美觀。10個組的圖形都有著高度的相似性。

4.同一組的筆畫形狀有依次遞增的明顯特征。

5.依據(jù)分類、分級關系，只要記住4個筆畫（即第0、1、4、6組的第1個筆畫），再借用聯(lián)想方法，便能記住每個筆畫的形狀所在位置及其排列順序。

看，這一排排、一摞摞筆畫就像超市貨架上擺放的“香蕉”，順溜、整齊又好看。假如你想，從中隨機選取兩個筆畫并互換一下位置，就會有亂套和不適的感覺。這說明，筆畫形狀的確有自然天成之美。

二、筆畫的標號、代號和名稱

“據(jù)形系聯(lián)”（許慎語），這句話現(xiàn)用于區(qū)分筆畫上也很合適的。我們以“相同尾梢”作為標準來，先劃分筆畫的類別，同類中再按照筆畫形狀的折點數(shù)量、單體長度來排列次序，并編制了筆畫的標號、代號、名稱表。

筆畫的標號、代號、名稱表（表1）的說明：

橫向疊層的有10個組，縱向并列的有5個級（組內序號），全表共50（10×5）個筆畫。其中“（現(xiàn)行）筆畫”25個，占位率50%；“準筆畫”（筆畫家族的“新生兒”，當前為預備梯隊）22個，占位率44%；“泛筆畫”（前兩項之和；文中多用此義）47個，占位率94%；還有空位（L₁、Y₁、F₁有名無實的）3個，占位率為6%。

第0組5個筆畫，對應的標號（左上角）是01、02、03、04、05；對應的代號（右上角）是P₁、P₂、P₃、P₄、P₅；對應的名稱（左下角）是撇一、撇二、撇三、撇四、撇五。其余的9個組也以此類推。

每一個筆畫都是兩位數(shù)字的標號，它由組號、級號組成，組號在十位上、級號在個位上（這里的標號也具有序號功效）；代號由該筆畫的拼音首字母、組內序號兩項組成；名稱由該組名、組內序號兩項組成。

標注*的筆畫有P₁、P₂、P₅、S₁、S₂、S₃、X₂、X₄、L₂、L₄、D₁、D₂、D₃、H₁、H₂、Y₃、F₃、T₂、T₄共19個，可作有些漢字的第一筆；未標注的筆畫則不能用作漢字的第一筆。

筆畫全集、例字表（表2）中筆畫折點樣式的解讀：（表2 圖片來源：作者自繪）

1.折點之處有停頓，通常是墨跡加重、加寬（最常見的一種）。如：“又”的第1筆的折點、“臺”的第1、4筆的兩個折點。

2.折點之處無明顯的折角（也稱作“彎”），書寫時不做停頓、平滑而過。如：“兒”的第2筆的第1個折點、“朵”的第2筆的第2個折點。

3.折點之前由粗變細、之后由細變粗，折點在最細的部位。如：“隊”（左耳刀旁）的第1筆的第2折點，尤其是“巡”的第1、2、3筆的折點（在印刷宋體里似連非連，有的手寫楷體則是完全分開的）。

4.折點的重疊區(qū)域有意延長、墨跡似有“漂移”的現(xiàn)象，如：“鄉(xiāng)”(1畫字)的第2、4折點、“之”(2畫字)的第2筆的第2折點、“?！保?/span>3畫字）的第3筆的第3折點、“水”(3畫字)的第3筆的折點。本條放寬了“折點”的定義范圍，也因此產(chǎn)生了“準筆畫”，并使“泛筆畫”的總數(shù)量大幅的增加。

增加了幾個一筆畫，如：N₂、N₃、N₅、D₃、D₄等等，還有兩個一筆畫成了單體的漢字：“了”（L₄）、“鄉(xiāng)”（P₅）。

有些漢字的筆畫數(shù)量有所減少，如“紅”的筆畫數(shù)從6畫變成5畫、“饗”的從12畫變成9畫。

請注意：“マ”與“厶”，看似有些相像，其實二者的筆畫數(shù)不一樣?！哎蕖笔且还P畫；“ㄙ”是由、“ ”和“丶”組合的，書寫時中間要有一收筆（筆尖離開紙張），不是一筆畫，它的筆畫數(shù)是兩個。

三、用筆畫的標號給漢字排序

兩個或兩個以上的漢字列放在一起就有一個排隊、排序的問題。

漢字查字法或稱排檢法，從編者方而來說是排序，從使用者方而來說是檢索。排序要合理、簡易、科學，檢索才能輕松、準確、快捷，甚至，僅依靠掃視（直接翻頁尋找）就能查到要查的字。

2021年3月1日，教育部、國家語委聯(lián)合發(fā)布實施的《通用規(guī)范漢字筆順規(guī)范》(GF0023-2020)，為社會通用層面的漢字教學與研究、信息處理、排序檢索、辭書編纂等提供重要依據(jù)。

一個漢字，先按筆順排列其全部的筆畫，并在每個筆畫上面加注其相應的標號，再把這些標號串聯(lián)起來就是該字的序號（相當于該字的身份證號碼）。

排序規(guī)則：選出定量的漢字，先對比以上漢字的第1個筆畫的（兩位數(shù)）標號，按標號從小到大的排序。如果有幾個漢字的第1個筆畫的標號相同，就對比它們的第2個筆畫的標號，照樣從小到大的排序。以此類推，直到把選出的全部漢字都排序結束為止。

也可以用代號給漢字排序，代號排序和標號排序的規(guī)則大致相仿。這兩種排序方法得出的漢字順序是一模一樣的。

舉例：

中：丨（11、S₁）、┐（12、S₂）、一（61、H₁）、丨（11、S₁）。

①標號序：11、12、61、11→11126111；

②代號序：S₁、S₂、H₁、S₁→SS₂HS。

國：丨（11、S₁）、┐（12、S₂）、一（61、H₁）、一（61、H₁）、丨（11、S₁）、一（61、H₁）、丶（51、D₁）、一（61、H₁）。

①標號序：11、12、61、61、11、61、51、61→1112616111615161；

②代號序：S₁、S₂、H₁、H₁、S₁、H₁、D₁、H₁→SS₂HHSHDH。

給下面一句話的8個字排序：“她用新華字典查字”。

她：①520161221172；②D₂PHX₂SY₂

用：①0122616111；②PX₂HHS

新：①51615101616121515101016111；②DHDPHHXDDPPHS

華：①011101726111；②PSPY₂HS

字：①5151023461；②DDP₂L₄H

典：①1112611111610151；②SS₂HSSHPD

查：①611101411112616161；②HSPNSS₂HHH

字：①5151023461；②DDP₂L₄H

這8個字的順序是：1華、2用、3典、4字（出現(xiàn)了兩次）、5新、6她、7查。

以上示范了（所抽樣的）漢字的新的“字序”、“字典序”，此排序方法的優(yōu)點是準確、清晰，人們從視覺上、邏輯上都可輕松地分辨出漢字的先后順序。

漢字的排序方式及其使用的范圍：一是筆畫阿拉伯數(shù)字標號的排序法，適用于計算機漢字信息處理技術應用；二是筆畫代號的排序法，適用于字典正文、圖書檔案資料的標注及索引；三是筆畫名稱的排序法，適用于學校漢字漢語教學。

四、漢字的檢索

編排工具書索引、編制圖書檔案資料、排列姓名次序，以及漢字信息處理等，都需要有一個合理、巧妙的漢字字序排列法，以便查找。

漢字筆畫有50個，可用作單字第一筆的只有19個，因此字典的正文也劃分成這19個區(qū)域。

在字典正文頁眉處位置列出本頁的第一個和最后一個漢字的代號序，并給兩個代號序之間加上一個連接號。如果某頁的第一個字是“賀”，則寫“X₂PSS₂HSS₂PD”。

漢字的“第1部件”都應標注在本頁頁眉位置，同時，也可標注在漢字左側的空白位置，以便使用者查尋漢字。

要查找某個字，從該字的第1筆畫、第1部件開始，直接翻頁，用掃視法可查尋到。如：要查“笑”字，先從字典正文找到第1筆畫——“撇”、再找到第1部件，這樣，就能查到“笑”字。

采用上述的漢字檢索方法，字典本可以取消檢索表的。但是，為了讓使用者有個適應過程，可設立一個（過渡性的）檢索表。把檢字表劃分成19個（第1筆畫的）區(qū)域，再按漢字的筆畫數(shù)量從少到多區(qū)分若干類，同類的漢字也按照（上述的）字序排隊。如“笑”字排在“撇”區(qū)的“10畫”區(qū)內。

五、漢字信息處理

光學字符識別法(OCR)就是把文字看作一個小的圖像，采用圖像掃描儀等設備對文稿進行掃描，把文稿上的文字變成強弱的兩種電信號，再變成二進制數(shù)0和1儲存于計算機。

另外，還有統(tǒng)計模式識別方法，這兩種方法使用的效果并不理想。

在筆畫（形狀）的數(shù)字模式里，筆畫的分類和編號帶有顯著的“數(shù)理感”，如果能在漢字的每一個筆畫上都“暗記”其標號，而形成一種“邏輯模式識別法”，也許會優(yōu)于光學字符識別法、統(tǒng)計模式識別法。

如果采用漢字新的字序，通過調試或升級軟件，或許能將“交換碼”與“內部碼”這兩種碼合并或統(tǒng)一，可使計算機的智能識別、漢字信息處理變得更加輕松快捷。

文章來源：《文化產(chǎn)業(yè)》 http://m.xwlcp.cn/w/wy/32640.html

關鍵字：論文篇論文發(fā)表咨詢文學論文

上一篇：基于文化走出去外宣政策背景下博物館藏知識推介平臺的構建與應用研究
下一篇：文化敘事語境構建：數(shù)字時代的中國文化新質傳播研究

欄目分類

熱門排行

推薦信息

期刊知識

創(chuàng)建筆畫數(shù)字模式，探索漢字新的字序

欄目分類

創(chuàng)建筆畫數(shù)字模式，探索漢字新的字序