優(yōu)勝從選擇開始,我們是您最好的選擇!—— 中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)
0373-5939925
2851259250@qq.com
我要檢測 我要投稿 合法期刊查詢

創(chuàng)建筆畫數(shù)字模式,探索漢字新的字序

作者:唐維建,唐維強,唐倩琳來源:《文化產(chǎn)業(yè)》日期:2024-11-02人氣:327

漢字是中國人發(fā)明的記錄漢語的文字書寫系統(tǒng),也是世界上唯一被沿用至今的古老文字,在漫長的歷史過程中,人們不斷的創(chuàng)造新的漢字以滿足生產(chǎn)和生活的需要,有的字義也會隨之變化。漢字的詞匯義項眾多,通用假借頻繁,初學(xué)者不易把握字義,因此提供音韻、注解、例句等等的工具書運用而生。

《說文解字》是由東漢文字學(xué)家許慎于公元121年編著而成的,它開創(chuàng)了部首檢字的先河,經(jīng)唐宋明清等幾個朝代都對部首排檢法做過多次的改進。此后的1900,人們一直不斷地探究著更簡易、更合理、更巧妙的漢字排序法……

,字典和辭書常用的是音序排列法、部首筆畫排列法、號碼排列法。

1.音序排列法,同音字的排序有分歧,不知音的字是無法檢索的。

2.部首排列法,無論在立部還是歸部都未統(tǒng)一。查一個字要分別在部首目錄、檢字表、正文三個區(qū)域?qū)ふ也拍芡瓿伞?/span>

3.筆畫排列法,相同筆畫數(shù)的漢字存在二義性。

4.號碼排列法,筆形和代碼之間沒有理據(jù),規(guī)則比較復(fù)雜,重碼字較多。

現(xiàn)行的排檢法或多或少的有些缺點,根據(jù)多年的實踐和研究,我們提出一種新的“筆畫形狀數(shù)字模式”。

一、筆畫形狀的數(shù)字模式

現(xiàn)行漢字的筆畫形狀分類方法很多,最常見一種分類是將筆形分為31個,其中包括基本筆形6個和派生筆形25個。

目前,現(xiàn)行的漢字筆畫分類、命名還不統(tǒng)一,有把二三十種筆形歸入“橫、豎、撇、捺、折”五種基本筆畫類型的,還有個別筆形歸類不當?shù)膯栴}(如把“豎鉤”歸入“豎”)。為了呈現(xiàn)內(nèi)聚、均勻的風格,在有些字中有的筆畫要發(fā)生形變,規(guī)范字形中筆畫形變?nèi)我庑缘默F(xiàn)象時有發(fā)生,這表明我們在筆畫這個層次上整理工作做得不細,規(guī)范水平還有待提高。

剛開始研究漢字時,因整理分類筆畫、編寫記憶口訣而陷入泥淖,掙扎在漫長的瓶頸期內(nèi)……后來,經(jīng)過認真思考、熱烈討論、仔細研判,我們像考古隊員一樣,將斷裂、散亂且有殘缺的幾十個漢字筆畫修復(fù)、整理成(4大脈系)10串“(邏輯)鏈條”,并組建一個理據(jù)性的漢字筆畫形狀數(shù)字模式。 

筆畫形狀分類分級示意圖的詮釋及主要特點:

1.左側(cè)的第0、1、2、3組筆畫形狀的尾梢是順時針旋轉(zhuǎn),右側(cè)的第45、67、8、9組的筆畫形狀的尾梢是逆時針旋轉(zhuǎn)。

2.(左側(cè)的)第0組與(右側(cè)的)第4組的筆畫形狀其左右大致對稱的。第1組與(整體順時針旋轉(zhuǎn)90o的)第6組也是左右大致對稱的;同理,對照第2組與第7組、第3組與第8組也是如此。

3.從筆畫形狀的外部輪廓上看,整齊一致,協(xié)調(diào)美觀。10個組的圖形都有著高度的相似性。

4.同一組的筆畫形狀有依次遞增的明顯特征。

5.依據(jù)分類、分級關(guān)系,只要記住4個筆畫(即第0、1、4、6組的第1個筆畫),再借用聯(lián)想方法,便能記住每個筆畫的形狀所在位置及其排列順序。

看,這一排排、一摞摞筆畫就像超市貨架上擺放的“香蕉”,順溜、整齊又好看。假如你想,從中隨機選取兩個筆畫并互換一下位置,就會有亂套和不適的感覺。這說明,筆畫形狀的確有自然天成之美。

二、筆畫的標號、代號和名稱

“據(jù)形系聯(lián)”(許慎語),這句話現(xiàn)用于區(qū)分筆畫上也很合適的。我們以“相同尾梢”作為標準來,先劃分筆畫的類別,同類中再按照筆畫形狀的折點數(shù)量、單體長度來排列次序,并編制了筆畫的標號、代號、名稱表。

筆畫的標號、代號、名稱表(表1)的說明:

橫向疊層的有10個組,縱向并列的有5個級(組內(nèi)序號),全表共5010×5)個筆畫。其中“(現(xiàn)行)筆畫”25個,占位率50%;“準筆畫”(筆畫家族的“新生兒”,當前為預(yù)備梯隊22個,占位率44%;“泛筆畫”(前兩項之和;文中多用此義)47個,占位率94%;還有空位(L1、Y1、F1有名無實的)3個,占位率為6%。

05個筆畫,對應(yīng)的標號(左上角)是0102、0304、05;對應(yīng)的代號(右上角)是P1、P2、P3P4、P5;對應(yīng)的名稱(左下角)是撇一、撇二、撇三、撇四、撇五。其余的9個組也以此類推。

每一個筆畫都是兩位數(shù)字的標號,它由組號、級號組成,組號在十位上、級號在個位上(這里的標號也具有序號功效);代號由該筆畫的拼音首字母、組內(nèi)序號兩項組成;名稱由該組名、組內(nèi)序號兩項組成。

標注*的筆畫有P1、P2、P5S1、S2、S3X2、X4L2、L4、D1、D2D3、H1、H2、Y3F3、T2T419個,可作有些漢字的第一筆;未標注的筆畫則不能用作漢字的第一筆。

筆畫全集、例字表(表2)中筆畫折點樣式的解讀:(表2  圖片來源:作者自繪)

1.折點之處有停頓,通常是墨跡加重、加寬(最常見的一種)。如:“又”的第1筆的折點、“臺”的第14筆的兩個折點。

2.折點之處無明顯的折角(也稱“彎”,書寫時不做停頓、平滑而過。如:“兒”的第2筆的第1個折點、“朵”的第2筆的第2個折點。

3.折點之前由粗變細、之后由細變粗,折點在最細的部位。如:“隊”(左耳刀旁)的第1筆的第2折點,尤其是“巡”的第1、23筆的折點(印刷宋體似連非連,有的手寫楷體則是完全分開)。

4.折點的重疊區(qū)域有意延長、墨跡似有“漂移”的現(xiàn)象,如:“鄉(xiāng)”(1畫字)的第24折點、“之”(2畫字)的第2筆的第2折點、“?!保?/span>3畫字)的第3筆的第3折點、“水”(3畫字)的第3筆的折點。本條放寬了“折點”的定義范圍,也因此產(chǎn)生了“準筆畫”,并使“泛筆畫”的數(shù)量大幅的增加。

增加了幾個一筆畫,如:N2N3、N5D3、D4等等,還有兩個一筆畫成了單體的漢字:“了”(L4)、“鄉(xiāng)”(P5)。

有些漢字的筆畫數(shù)量有所減少,如“紅”的筆畫數(shù)從6畫變成5畫、“饗”的從12畫變成9畫。

請注意:“マ”與“厶”,看似有些相像,其實二者的筆畫數(shù)不一樣?!哎蕖笔且还P畫;“ㄙ”是由  ”和“丶”組合的,書寫時中間要有一收筆(筆尖離開紙張),不是一筆畫,它的筆畫數(shù)是兩個。

三、用筆畫的標號給漢字排序

兩個或兩個以上的漢字列放在一起就有一個排隊、排序的問題。

漢字查字法或稱排檢法,從編者方而來說是排序,從使用者方而來說是檢索。排序要合理、簡易、科學(xué),檢索才能輕松、準確、快捷,甚至,僅依靠掃視(直接翻頁尋找)就能查到要查的字。

2021年3月1日,教育部、國家語委聯(lián)合發(fā)布實施的《通用規(guī)范漢字筆順規(guī)范》(GF0023-2020),為社會通用層面的漢字教學(xué)與研究、信息處理、排序檢索、辭書編纂等提供重要依據(jù)。

一個漢字,先按筆順排列其全部的筆畫,并在每個筆畫上面加注其相應(yīng)的標號,再把這些標號串聯(lián)起來就是該字的序號(相當于該字的身份證號碼)。

排序規(guī)則:選出定量的漢字,先對比以上漢字的第1個筆畫的(兩位數(shù))標號,按標號從小到大的排序。如果有幾個漢字的第1個筆畫的標號相同,就對比它們的第2個筆畫的標號,照樣從小到大的排序。以此類推,直到把選出的全部漢字都排序結(jié)束為止。

也可以用代號給漢字排序,代號排序和標號排序的規(guī)則大致相仿。這兩種排序方法得出的漢字順序是一模一樣的。

舉例:

中:丨(11、S1)、┐(12S2)、一(61、H1)、丨(11、S1)。

號序:11、12、61、1111126111;

②代號序:S1、S2H1、S1SS2HS。

國:丨(11、S1)、┐(12S2)、一(61H1)、一(61、H1)、丨(11、S1)、一(61、H1)、丶(51、D1)、一(61、H1)。

號序:11、1261、61、11、61、51、611112616111615161;

②代號序:S1、S2、H1H1、S1H1、D1H1SS2HHSHDH。

給下面一句話的8個字排序:“她用新華字典查字”。

她:520161221172;②D2PHX2SY2

用:0122616111;②PX2HHS

新:51615101616121515101016111;②DHDPHHXDDPPHS

華:011101726111;②PSPY2HS

字:5151023461;②DDP2L4H

典:1112611111610151;②SS2HSSHPD

查:611101411112616161;②HSPNSS2HHH

字:5151023461;②DDP2L4H

8個字的順序是:1華、2用、3典、4字(出現(xiàn)了兩次)、5新、6她、7查。

以上示范了所抽樣的)漢字的新的“字序”、“字典序”,此排序方法的優(yōu)點是準確、清晰,人們從視覺上、邏輯上都可輕松地分辨出漢字的先后順序。

漢字的排序方式及其使用的范圍:一是筆畫阿拉伯數(shù)字標號的排序,適用于計算機漢字信息處理技術(shù)應(yīng)用;二是筆畫代號的排序,適用于字典正文、圖書檔案資料的標注及索引;三是筆畫名稱的排序,適用于學(xué)校漢字漢語教學(xué)。

四、漢字的檢索

編排工具書索引、編制圖書檔案資料、排列姓名次序,以及漢字信息處理等,都需要有一個合理、巧妙的漢字字序排列法,以便查找。

漢字筆畫有50個,可用作單字第一筆的只有19個,因此字典的正文也劃分成這19個區(qū)域。

在字典正文頁眉處位置列出本頁第一個和最后一個漢字的代號序,并給兩個代號序之間加上一個連接號。如某頁第一個字是“賀”,則寫“X2PSS2HSS2PD”。

漢字的“第1部件”都應(yīng)標注在本頁頁眉位置,同時,也可標注在漢字左側(cè)的空白位置,以便使用者查尋漢字。

要查找某個字,從該字的第1筆畫、第1部件開始,直接翻頁,用掃視法可查尋到。如:要查“笑”字,先從字典正文找到第1筆畫——“撇”、再找到第1部件,這樣,就能查到“笑”字。

采用上述的漢字檢索方法,字典本可以取消檢索表的。但是,為了讓使用者有個適應(yīng)過程,可設(shè)立一個(過渡性的)檢索表。把檢字表劃分成19個(第1筆畫的)區(qū)域,再按漢字的筆畫數(shù)量從少到多區(qū)分若干類,同類的漢字也按照(上述的)字序排隊。如“笑”字排在“撇”區(qū)的“10畫”區(qū)內(nèi)。

五、漢字信息處理

光學(xué)字符識別法(OCR)就是把文字看作一個小的圖像,采用圖像掃描儀等設(shè)備對文稿進行掃描,把文稿上的文字變成強弱的兩種電信號,再變成二進制數(shù)01儲存于計算機。

另外,還有統(tǒng)計模式識別方法,這兩種方法使用的效果并不理想。

在筆畫(形狀)的數(shù)字模式里,筆畫的分類和編號帶有顯著的“數(shù)理感”,如果能在漢字的每一個筆畫上都“暗記”其標號,而形成一種“邏輯模式識別法”,也許會優(yōu)于光學(xué)字符識別法、統(tǒng)計模式識別法。

如果采用漢字新的字序,通過調(diào)試或升級軟件,或許能將“交換碼”與“內(nèi)部碼”這兩種碼合并或統(tǒng)一,可使計算機的智能識別、漢字信息處理變得更加輕松快捷。


文章來源:  《文化產(chǎn)業(yè)》  http://m.xwlcp.cn/w/wy/32640.html

網(wǎng)絡(luò)客服QQ: 沈編輯

投訴建議:0373-5939925????投訴建議QQ:

招聘合作:2851259250@qq.com (如您是期刊主編、文章高手,可通過郵件合作)

地址:河南省新鄉(xiāng)市金穗大道東段266號中州期刊聯(lián)盟 ICP備案號:豫ICP備2020036848

【免責聲明】:中州期刊聯(lián)盟所提供的信息資源如有侵權(quán)、違規(guī),請及時告知。

版權(quán)所有:中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)

關(guān)注”中州期刊聯(lián)盟”公眾號
了解論文寫作全系列課程

核心期刊為何難發(fā)?

論文發(fā)表總嫌貴?

職院單位發(fā)核心?

掃描關(guān)注公眾號

論文發(fā)表不再有疑惑

論文寫作全系列課程

掃碼了解更多

輕松寫核心期刊論文

在線留言