|
|
专利名称:一种计算机键盘形象码汉字编码输入法 专利申请:200610074425.2 发 明 人:孙基寿 电话号码:027-87556191(办公室);62559879(小灵通) 电子邮箱:bynu@163.com 地 址:武汉市武昌珞瑜路1037号华中科技大学出版社 邮政编码:430074 软件下载:形象码安装程序 资料下载:形象码使用手册 |
形象码投资说明
1. 项目简介
形象码是一种编码规则与自然感觉相一致的字形编码。一般几个小时就可以掌握,熟练后见到汉字编码就自动地跑出来,感觉特别轻松,即使很长时间不使用也不遗忘。在电脑上打字平均每字两键,重码很少,在手机上打字平均每字三键,生僻字无需翻页。
发明人已从理论上证明了形象码就是字形编码的唯一正解。因此形象码的推广目标是取代所有字形编码和部首检字法,成为子孙后代赖以管理汉字的一种永久性工具。
2.市场预测
2007我国手机用户达到5亿。目前手机使用的汉字输入技术还在依赖进口,中国人使用的手机要向外国公司支付每年数亿元的专利使用费。数字键盘汉字输入技术不仅可以应用于手机、PDA、小灵通等通信终端设备中,而且还可大量应用在税控机、机顶盒、信息家电、掌上电脑、电子辞典、PC机等其他小键盘或手持类电子信息产品中。
由于形象码是字形编码的唯一正解,因此,形象码一旦推广开来,每年的专利使用费收益至少在10亿元以上。
3.寻觅知音
按投资方提出的方法论证确认无风险后,投资方应一次性支付发明人个人210万元;投资额不低于3210万元;投资方占62%的股份。项目产品即形象码软件已使用了十余年,非常成熟,投资费用主要用于宣传推广,具体推广方法再议。
4. 阅读建议
只有唯一正解的字形编码才具有投资价值。判断形象码是否就是汉字字形编码的唯一正解,必须阅读如下两篇文章。
第一篇 “字形编码的正确方向与现代汉语的本质特点”(在下一页 )
第二篇 “浓缩型形象码研究报告”(在本页下载)
以下六篇论文可以充分证明形象码就是汉字字形编码的唯一正解。如果读者阅读了以上两篇文章,希望进一步了解形象码, 建议阅读形象码研究报告,形象码研究报告中包含如下六篇论文。
论文1 字形编码的正确方向与现代汉语的本质特点
论文2 汉字拆分整体定型方案的思考
论文3 形象码编码方案设计
论文4 形象码的记忆量分析
论文5 反映形象码速度潜力的参数测定
论文6 汉字输入编码优劣评测方法的探讨
有初步投资意向的朋友,请通过邮件向发明人孙基寿索取形象码研究报告。
论文1
字形编码的正确方向与现代汉语的本质特点
摘要:全文共分七部分,第一部分提出了字形编码的正确方向,指出映形是字形编码汉字拆分单位的分类依据。第二部分以一个工作场景为参照系,通过对工作过程的描述揭示了编码思维活动的基本规律。第三部分以人类语言的演化为线索,描述了文字演化的两个方向,提出了几种典型的语言形式,归纳了人类语言的演化特点。第四部揭示了现代汉语的本质特点,指出现代汉语属于单音节映义语言,而拼音文字语言则属于多音节映义语言。第五部分对现代汉语中几个典型的瑕疵词汇进行了分析,提出了相应的修改意见。第六部分分析了现代汉语中与字形编码相关的一组名词,提出了规范这些名词的意见,明确了名词的概念定位。第七部分为结束语,指出现代汉语发展中所遇到的重大问题得不到有效解决是因为人们没有弄清现代汉语的本质。
1 字形编码的正确方向
1.1 映义与映形
“人类”“人手”“长大成人”“军人”“人云亦云”“丢人”“这两天人不大舒服”“人浮于事”中的“人”,其含义各不相同但都是从“人”的本义映射出来的意义,我们把这些映射出来的意义称为映射含义,而把本义称为映射原义。映射原义和映射含义都称为映义。映义被人脑吸收后所构成的综合含义亦称映义。
“田”“甲”“由”“申”的形态各不相同但都可从一个基本形态映射出来。我们把这些映射出来的形态称映射形态,而把基本形态称为映射原形。映射原形和映射形态都称为映形。映形反复刺激人脑在人脑中所构成的综合形态亦称映形。
1.2 字梁的分类依据
字形编码的汉字拆分单位和单一码符对应单位称为字梁。字梁是字形编码描述字形信息的最小信息单位。字形编码用编码符号描述字形信息。字形信息从何而来?在阳光的照射下,汉字的反射光线刺激人脑,人脑才能感觉到汉字形态的存在。这说明字形信息来源于字形刺激。因此,描述字形信息实质上就是描述字形刺激。描述字形刺激就是字形编码的正确方向。
一根有温度的环形铁丝落到皮肤上,我们就能明显地感觉到痛的形状是环形的。同理,汉字刺激人脑,我们也能感觉到痛的形状,这个形状就是我们所看到的字形。这说明字形就是刺激效果的一种表现形式。字形按映形排列,一种映形就是一种刺激效果。
归纳以上推导过程,描述字形信息就是描述字形刺激,而映形就是刺激效果,因此,描述字形信息就是描述映形。换一种说法,映形是字梁的分类依据。
1.3 映形的鲜明性
我们发现,凡是特色鲜明的对象我们就容易辨别它,换言之,凡是特色鲜明的对象人脑就容易捕捉到。作为字形编码的最小信息单位,字梁排列所构成的映形越鲜明,它就越容易被人脑捕捉到。因此,映形的鲜明性是判断一个类别优劣的依据。
只有明白映形是字梁的分类依据,只有明白映形的鲜明性是判断一个类别优劣的依据,才能把握字形编码的正确方向,才能找到字形编码的唯一正解。关于映形的归纳及其代码的确定,笔者有文章专门进行介绍。
2 人脑思维活动规律
2.1 思维活动的基本模式
“田”刺激人脑并指向Q,“甲”刺激人脑并指向Q,“由”刺激人脑并指向Q,“申”刺激人脑并指向Q,若干次刺激之后,Q所代表的映形就建立起来了,也就是人脑建立了Q的概念。以后遇到任一映形(如“毋”),对应概念Q就会同时浮现出来。这就是概念唤醒。编码打字是一个极为频繁的脑力劳动,只有概念唤醒地输入汉字才能轻松快速,不伤脑力。
概念唤醒是人脑思维活动的基本模式,也是最轻松快速和最有效的方式之一。笔者有一次在路上遇到一个人,突然触电一样地叫出他的名字。原来这个人是笔者初中的一个同学,25年没有见面了。我们双方被唤醒之后说了一会儿话,结果当时笔者又把他的名字给忘了,反过来问他叫什么。为什么会发生这样的现象呢?通过以下分析,读者将会对人脑思维活动即概念唤醒有更多的理解。
接触这个同学的时间总共不到两年,但在接触的那段时间里一起玩得比较多。他那特有而深刻的模样虽然已经埋了25年,但特征独特,穿透力强,一下子就把笔者25年之前建立的概念给唤醒了,概念代码即他的名字也就随之喷出。但是,当我们聊了一会儿之后,站在面前的是25年之后的新模样,那个喷出的模样又被厚重的25年尘埃收缩覆盖了,与模样相随的代码即他的名字自然也就随之被覆盖。
2.2 思维单元的起点、终点和决定因素
刺激物刺激人脑,人脑就会建立它的模样(模样包含象征意义时称为形象)。模样建立以后,每一次遇见都是实物对模样的深化和修正。模样是一种概念,实物与模样之间的对照,实质上就是概念唤醒。为什么刺激物的模样会自然浮现?为什么概念能够被唤醒?原因就是眼前的实物刺激与模样建立时发生的刺激具有相同的刺激效果。
模样浮现或概念唤醒是思维活动中一个最小的完整思维单元。在这个思维单元中,实物刺激是起点,意识指向是终点,刺激效果相同是决定因素。
2.3 思维轨道的毛坯构建
甲仓库有A、B两个区域,A区有磁砖、钢筋、木板、玻璃,B区有海绵、棉花、羽绒、绸缎。库管员张三第一天上班看到A区、B区存放的货物,心中就有数了。一日突然来了一包羊毛,张三很快就将羊毛放到了B区。
乙仓库有C、D两个区域,C区有磁砖、木板、棉花、绸缎,D区有钢筋、玻璃、海绵、羽绒。库管员李四第一天上班看到C区、D区存放的货物,一个劲地摸后脑勺。一日突然来了一包羊毛,李四一见又摸后脑勺,不知道应该放在哪里。李四打电话问上司胡经理,胡经理告诉他说,写了羊毛存放位置的纸条和羊毛包在一起。李四解开羊毛包装,找到了纸条,看到了标记。
甲仓库的张三心中有数了,是因为他脑子里建立了两个概念:A区为沉重之物,B区为轻浮之物。因此,张三一见到羊毛,羊毛的刺激就唤醒了他脑子里储存的对应概念“轻浮之物→B区”。
乙仓库李四一个劲地摸后脑勺,是因为他看不出C区、D区有何区别,建立不起概念来。因此,李四一见到羊毛,羊毛的刺激就使他再一次摸后脑勺──没有对应概念吸收刺激波。刺激波无方向地稀释后,李四冷静了下来,想到了打电话,然后解开包装,然后找纸条,然后看标记。
2.4 概念蜂窝的自发形成
乙仓库李四第一次遇到羊毛要查找存放位置,但经历了若干次之后,他也会建立起概念来。只不过他所建立的概念和甲仓库张三所建立的概念是截然不同的。两人分别建立的概念如下。
甲仓库张三
沉重之物→A区;轻浮之物→B区
乙仓库李四
磁砖→C区磁砖;木板→C区木板;棉花→C区棉花;绸缎→C区绸缎;
钢筋→D区钢筋;玻璃→D区玻璃;海绵→D区海绵;羽绒→D区羽绒;
……(注:C区磁砖表示存放位置,其余类推)
由于甲仓库的货物是按照刺激效果分类的,所以张三首先建立的是大概念,如“沉重之物→A区”。由于乙仓库的货物没有按照刺激效果分类,所以李四只能建立小概念,如“磁砖→C区磁砖”。
“磁砖→C区磁砖”和“钢筋→D区钢筋”是李四建立的概念。由于这两个概念中磁砖和钢筋刺激效果比较接近,如果它们被运用的频率不高,就非常容易弄错,变成如下两种情况之一。
“磁砖→C区磁砖”和“钢筋→C区钢筋”
“磁砖→D区磁砖”和“钢筋→D区钢筋”
“磁砖→C区磁砖”和“棉花→C区棉花”也是李四建立的概念。由于这两个概念中磁砖和棉花刺激效果相差较大,如果它们被运用的频率不高,就非常容易弄错,变成如下两种情况之一。
“磁砖→C区磁砖”和“棉花→D区棉花”
“磁砖→D区磁砖”和“棉花→C区棉花”
李四建立的概念不但个数比张三多得多,而且每一概念所要求被运用的频率也比张三大多得。我们把李四建立的概念群称为概念蜂窝。
李四为什么要建立概念蜂窝呢?因为他要减轻劳动负荷,他要提高工作效率。同理,如果某种编码设计不合理,思维活动就会自发地建立概念蜂窝,以利于形成概念唤醒式输入。但是,概念是在大量刺激的基础上形成的,概念的建立是要付出代价的。因此,在字形编码研究过程中,研究者就要规划建立概念的数量,使之越少越好。如果不规划让其自发形成,那么,获得同样轻松快速所需建立的概念数量,可能就是规划的成千上万倍。
2.5 将字形编码置于人脑思维活动中进行考察
以下甲方案和乙方案是两种截然不同的字形编码的部分键位安排。读者可以比较一下它们的刺激效果和人为安排的差异,然后比较一下使用者会产生什么样的使用效果。
甲方案(指向映形代码)
乙方案(指向拼音首字母)
石,万,歹→F
石→S;万→W;歹→D
士,土,千,工→I
士→S;土→T;千→Q;工→G
申,田,由,甲→Q
申→S;田→T;由→Y;甲→J
失,天,夭,夫,大→A
失→S;天→T;夭→Y;夫→F;大→D
以上键位安排中,指向映形代码的刺激效果非常接近,为天然指向;指向拼音首字母的刺激效果截然不同,是人为安排。
在甲方案中,人为安排就是天然指向──刺激波沿着刺激效果的方向即映形的方向流动并指向其代码。因而用得越多,思维轨道就越通畅。
在乙方案中,人为安排违反了天然指向──刺激效果没有被充分利用,通常的关注度无法取得所要求的信息,人脑开始进入警觉状态,关注度提高数倍后获得第一个取码单位的读音,转换为拼音首字母,返回放松状态,休息片刻,重新进入警觉状态,关注度提高数倍后获得第二个取码单位的读音,转换为拼音首字母,返回放松状态……。如此折腾,伤神的中间环节如何跳过?人脑在疲于奔命中摸索,而这个过程是慢长的。
因此,甲方案使用者就会象甲仓库张三一样在较短的时间内建立起大概念。而乙方案使用者则只能象乙仓库李四一样建立小概念。乙方案使用者所能建立的小概念是以整字刺激为基础的,如“特→ntc”。这样一来,6763个汉字就要建立6763个小概念。
2.6 进一步分析两种典型编码的人脑思维活动
假设阅读一个含有16个字的普通句子要耗费的时间是10t,那么把这个句子倒过来阅读要耗费的时间大概就是16t。从拼音转化到拼音首字母要耗费的时间每字按1t计算。以此为参照,乙方案输入“奋斗”二字所耗费的最短时间为4×2t=8t,相当于阅读普通句子1.6×8≈13个字。
大→da→d(2t) →er→e(2t)
田→tian→t(2t) 十→shi→s(2t)
以上就是乙方案看打(看着稿子打字)输入的最短极限时间。如果是盲打(不看稿子打字称为盲打),最短极限时间还会大大延长。以下从信息获取的源头分析这个结果。
乙方案要给一个字编码了,先按读音劈开,念第一个取码单位的读音,将读音转换为拼音首字母,接着念第二个取码单位的读音,将读音转换为拼音首字母……。同样是获取读音,乙方案对取码单位的关注度无论如何都不可能低于平时阅读时对单字的关注度。所以“大→da”的极限最短时间为1t。“da→d”的极限最短时间为多少笔者不敢把话说死,但在笔者个人的感觉中,如果不经过专门训练,它是大于1t的,按1t计算。这样,“大→da→d”的时间就是2t。其余依此类推,结果如上。
相比之下,甲方案输入“奋斗”二字所耗费的最短极限时间为4×0.5t=2t,相当于阅读普通句子1.6×2≈3.2个字。
大→A(0.5t)
→V(0.5t)
田→Q(0.5t)
十→f(0.5t)
“奋斗”二字合起来的阅读时间是2×(10÷16)t=1.25t,一个一个地阅读该二字的合计时间是2t,按2t计算。分配在“大”“田”“”“十”四个字梁上的时间各为0.5t。四个字梁所处的映形如下:
失,天,夭,夫,大→A
,,,→V
申,田,由,甲→Q
十,→f
观察以上映形可以看出,“大”与“A”完全可以互换,看见“大”与看见“A”并没有多少差异。即“大→A”的时间实际上就是阅读“奋”时分摊在“大”上的时间,为0.5t。其余依此类推,结果如上。
以上分析表明,按编码设计者设计的方法编码,乙方案使用者所耗费的最短极限时间是甲方案的4倍。时间是反映脑力消耗的,也就是说,甲方案所耗费的脑力只有乙方案的1/4。
至此,关于甲方案和乙方案的本质差异,不知读者看清楚了没有?让我们再用放大镜来看一看吧。有三个人分别叫张三、李四、王五;有三颗树分别叫张三、李四、王五;有三只鸟分别叫张三、李四、王五。甲方案采用的方法是,人打A,树打B,鸟打C;乙方案采用的方法是,张三打A,李四打B,王五打C。虽然甲方案和乙方案都是通过对象的刺激获取信息的,但人脑在获取信息时所投入的关注度有着天壤之别。
甲方案的A、B、C存在着巨大的视觉差异,人脑只需轻微关注就可以识别,因而消耗的脑力少,反应速度快,发生错误的可能性小。所以说,在甲方案中,人为安排就是天然指向。
乙方案的A、B、C虽然也存在着差异,但它们的差异表现在个体上,人脑必须投入足够的关注度才能识别,因而消耗的脑力大,反应速度慢,发生错误的可能性大。所以说,在乙方案中,人为安排违反了天然指向。
回归理论。甲方案的A、B、C所代表的分别是一种概念,是由对象自身决定的天然类别。乙方案的A、B、C所代表的是一种标记,是偶然形成的人为规定。人、树、鸟这三个概念不会因语言文字的不同而不同,而张三、李四、王五则是与特定语言文字相关的一种偶然标记。甲方案的分类依据是映形,管理方法是概念唤醒。乙方案把彼此不能映射的人张三、树张三、鸟张三强行合在一起,人脑无论如何努力都无法建立概念。没有概念,人脑就不能概念唤醒地认清对象,而只能提高关注度,增加脑力消耗,占用更多的时间。
3 人类语言的演化
3.1 文字演化的两个方向
1.记事图画有了读音
遥远而遥远的远古时代,还处在动物阶段的人类智商远不如现在。一日,某动物人发现可怕的吃人动物狼来了,他在惊恐的同时发出了尖叫的A声──只要一听到A声,人们就知道是狼来了,就会闻声而逃。又一日,某动物人发现兔子,为了取得同伴的协助,他在喜悦的同时发出了动听的B声──只要一听到B声,人们就知道有兔子可抓了。A声表示狼来了,大家快逃;B声表示有兔子可抓了,大家快来──这是动物在长期进化过程中慢慢形成的一种常识,即动物语言。
不知过了多少万年,人类开始从浑沌中慢慢地苏醒过来,智商已取得了长足的发展,语言开始复杂起来。A声不再表示狼来了,而是表示狼,B声不再表示有兔子可抓了,而是表示兔子。那些深深地烙印在脑海中的重大事件支配着人们的行为,习惯的口耳相传方法非常不利于保留可能丢失的信息,于是画图相授开始出现了。渐渐地,一些记事图画开始有了固定的画法甚至有了读音并被广为知晓。
2.象形文字到方块汉字
不知又过了多少千年,有固定画法、有读音并被广为知晓的记事图画逐渐地多了起来,那些熟知的记事画图成了人们传递简单信息的一种有效手段。怎样用图画传递更多更复杂的信息呢?把对象画出来,把图画拼起来。当新旧图画拼起来可以反映一句话的意思时,我们说人类最早的文字──象形文字诞生了。方块汉字就是在象形文字的基础上发展起来的。
3.异军突起的拼音文字
把这两个图连起来念(相当于汉语拼音中的声母加韵母连读的结果)正好就是我们想要记录的那个声音呀!地中海东北岸一条狭长的沿海地带是古代海上和陆上商队贸易的交叉点:它的南面是埃及古王国;它的东面紧挨着土地富饶的美索不达美亚;它的北面与小亚细亚为邻,是进入欧洲大陆的必经之路。由于航海和商业的发展,该地居民腓尼基人迫切需要有一种简单方便的文字系统,用来编制贸易文件和记录航海资料。强烈的应用需求催生了灵感的诞生,公元前15至前13世纪之间,腓尼基人终于发明了将图画简化为字母并用字母拼写记录语音的方法,从而产生了人类最早的拼音文字。
拼音文字用几十个字母符号就能拼出各种语音。这一优点加上商业和文化交流的优越地理环境使腓尼基人发明的用字母拼写记录语音的方法迅速向外辐射。随着地中海文明的昌荣,拼音文字大踏步地征服了整个西方世界。
3.2 几种典型的语言形式
1.连体句和连体句语言
在动物那里,只要一听到A声(可能是单音节声音,也可能是多音节声音),人们就知道是狼来了,就会闻声而逃。A将一个完整的含义全部黏合在一个不能分割的语音上,这个语音的作用相当于人类语言中一个句子的作用。像A这样自身连为一体的句子称为连体句。以连体句为主的语言称为连体句语言。
2.连体词和连体词语言
狼来了用A表示,那么老虎来了用什么表示呢?早期可能还是用A表示。但是,随着人类的发展,当需要予以区别时即可在原来的基础上进行变化。英语“I came here
yesterday”中,came由come变化而来,come是一种行为,表示“来”。came将时间状态“曾经”和行为“来”黏合在一起,表示曾经来过。像came这样自身连为一体的词称为连体词。自身没有连为一体但各部分与整体词义无关的词亦为连体词。单音节词都自身连为一体,故单音节词均为连体词。
只有一个音节的连体词称为单音节连体词,有两个音节的连体词称为双音节连体词,有三个或三个以上音节的连体词称为多音节连体词。turned由turn加ed构成,但turn和ed不能分开书写,且turned有两个音节,则turned为双音节连体词。“单于”中的“单”和“于”的含义均与“单于”无关,且“单于”有两个音节,则“单于”为双音节连体词。“玻璃”一词中“玻”和“璃”均没有具体的含义,且“玻璃”有两个音节,则“玻璃”为双音节连体词。Yesterday有多个音节,则yesterday为多音节连体词。
以连体词为主的语言称为连体词语言。拼音文字都是连体词语言。
3.伴行词和伴行词语言
汉语“我昨天来过这里”中,行为“来”和状态“过”组合在一起表示曾经来过。像“来过”这样“来”和“过”各自的含义与“来过”的整体含义相关的词称为称为伴行词。
“来过”的含义由“来”和“过”简单相加构成,我们称“来过”为相加型伴行词。“汉奸”的含义主要来自“奸”,“汉”起陪衬作用,我们称“汉奸”为陪衬型伴行词。“东西”一词的“东”指东边的草木,“西”指西边的金石,“东”和“西”均为代码,它们合起来泛指一切东西,我们称“东西”为代码型伴行词。“马虎”的含义来自于一个画家马、虎不分以致酿成产惨痛教训的故事,我们称“马虎”为逻辑型伴行词。“逻辑”一词是logic的音译,但“逻”和“辑”的含义均与“逻辑”关联,我们称“逻辑”为关联型伴行词。
以伴行词为主的语言称为伴行词语言。现代汉语是典型的伴行词语言。
4.口语的外部形式
人类的语言器官不会因民族的不同而不同。因此,从公元前5000年到现在,不论哪个民族的语言,口语的外部形式必然是相同的。分析各个民族的语言,特别是没有文字的语言(只有口语),聆听各种动物的叫声,可以将口语的外部形式归纳为:单音节词占少数,双音节词和多音节词占多数。
单音节词是指读音只有一个音节的词,双音节词是指读音中有两个音节的词,多音节词是指读音中有多个音节的词。在口语中,词的长度不会太短。古籍中三字句或四字句的书面语,无论是古人还是今人,不看只听是听不懂的。因为三字句或四字句的书面语主要为单音节词,单音节词占多数不符合口语的外部形式,所以听不懂。现实生活中我们之所以能听懂它的个别词句,是因为那些个别词句已经被组合起来构成了新词,这个新词是多音节词。
5.单音节语言
汉字的前身是文,它是由记事图画演变而来的表示某种概念的比图画的画法要简单比字的写法要复杂的一种文字符号。在一字一音的心理趋向作用下,原始汉语书面语中最早的词──文是一个单音节词。以单音节词为主的语言称为单音节语言。
3.3 人类语言的演化特点
1.没有文字时期汉族先民的语言演化特点
人类从动物进化而来,人类的语言必然也是从动物语言进化而来的。动物进化到人类是一个极为缓慢的过程,动物语言进化到人类语言必然也是一个极为缓慢的过程。这个缓慢的进化过程我们暂时无法观察到,但动物语言的连体句断裂和人类语言的词汇生长则是我们可以想象得到的。
从动物语言到人类语言,词汇不可能凭空产生,它的前身要么来源于连体句语言中的一段或整段声音,要么来源于该语言外部的某种相关声响。无论是连体句中的一段或整段声音,还是某种相关声响,它们都是语言中的词。词决定了语言的性质。这个时期的语言即没有文字的语言的特点如下。
第一,没有文字的语言中的词不能分割成两部分或多部分来理解。例如,“嫦娥”(音)是一个词,这个词不能被拆分成“嫦”(音)和“娥”(音)来理解。
第二,没有文字的语言只有口语,口语的外部形式为:单音节词占少数,双音节词和多音节词占多数。
把以上两点加起来就是:没有文字的语言,单音节连体词占少数,双音节连体词和多音节连体词占多数。无论哪个民族的语言都是这样,汉族先民所操的语言不可能例外。
2.书面语萌芽时期汉族先民的语言演化特点
从只有口语的人类语言到口语与书面书并行的人类语言,即书面语萌芽时期的人类语言,新词汇同样不可能凭空产生,它的前身要么来源于纯口语时期的相关词汇,要么来源于该语言外部的某种相关声响,要么来源于图画标记之类的符号。无论是纯口语时期的相关词汇,还是某种相关声响,还是图画标记之类的符号,它们都是语言中的词。书面语萌芽时期的词有如下三种类型。
第一种类型的词既有读音,也有对应的文。这样的词既是口语中的词,也是书面语中的词。
第二种类型的词有读音,但无对应的文。这样的词是口语中的词。
第三种类型的词无读音,但有与概念对应的文。这样的词专用于书面语,但它在被运用的过程中可被偶然地戴上读音。
自然灾害或残酷的生存战争使操不同口语的人聚到了一起,平时方便快捷的口语交流这时没法派上用场,还好,图画式的书面语彼此都能看懂。那些关系到生死存亡的大事也通过书面语进行传播。象形、指事、会意这三种造字法在这一时期被广为运用。口语中的抽象概念有少数被描绘了出来。
3.书面语生长时期上古汉语的演化特点
文已经变成了字。一字一音的心理趋向限定了书面语的发展格局。这个时候的书面语与口语的外部形式相差较大。书面语是以单音节词为主的单音节语言,而口语则是以连体词(单音节词只占少数)为主的连体词语言。两者虽然相互影响共同发展,但各自的语言性质却不可能在这个时期被改变。
口语人人都能听懂,但只会直白的口语就等于没有文化,是被人瞧不起的。“书面语──诗歌──音乐──礼仪──富贵”这一连串的因果关系使羡慕、追求的目光都投在这里。到后来,《诗经》成了贵族教育中普遍使用的文化教材,学习《诗经》成了贵族人士必需的文化素养。
于是,书面语逐渐地成长了起来,它的词汇日益丰富。假借造字法(一个字被借用时虽然当时没有增加新字,但过后这个被借的字必须再造)在这一时期的后期被广为运用。
4.书面语成型时期古汉语的演化特点
字形再一次得到了较大程度的简化与规范,新的造字空间被让了出来。利用形声造字法和转注造字法,一大批新字迅速地冒了出来。
伴行词大量出现,书面语已由单音节语言变成了伴行词语言。口语中的双音节连体词和多音节连体词一点点地被伴行词所取代,从而使口语逐渐地脱离了当初没有文字记载时的模样,即口语已由连体词语言变成了伴行词语言。但是,这个时期书面语还是书面语,口语还是口语,两者在风格上仍然存在着差异。
5.书面语融合时期现代汉语的演化特点
直到白话文出现,书面语才真正地与口语融为一体,成为现代汉语。现代汉语是在原始记事图画的基础上按语言发展的正常途径演变而来的当今世界唯一成熟的伴行词语言。
现代汉语向完美语言发展需要面临的主要任务:一是标音;二是定序;三是词汇优化;四是逐步消除一字多音现象;五是增强表音规律。其中标音和定序已基本解决:汉语拼音的标音方案已被认同,本文涉及的字形编码定序方案正等待人们的认识。
总结汉语的发展,木已成舟的我们要正确面对,做好修正完善工作。尚未发生的我们要认真对待,要让每一个人都明白语言文字发展的规律性和重要性,让他们自觉抵制瑕疵词汇的产生(关于瑕疵词汇本文将专门进行讨论)。但是,我们不能限制语言文字的发展,不能限制造字,限制就会发生变异。
6.拼音文字语言的演化特点
没有文字的语言(只有口语)都是连体词语言,适合记录连体词语言的拼音字母的发明使人们“一瞬间”把口语变成了书面语──连体词语言的命运从此就被永久性地定格了。通过后边的阅读,读者将会看到,拼音字母的发明和跟风抄袭是一种历史性的目光短浅,它阻碍了被定格的语言向伴行词语言演化的可能。
4 现代汉语的本质特点
1.连体词的借代性与伴行词的先知性
连体词mouse的含义是老鼠,计算机出现后鼠标一词没有着落,就借用mouse来充当。这就是连体词的借代性。鼠标一词之所以能借用mouse,是因为它们的形状类似。mouse除了可借作鼠标之外,还可借作胆小的人、上下窗户用的坠子以及小火箭等。分析这几个对象可以看出,它们都有类似于老鼠的某种特性。
掌握了12个映义单字“公”“母”“毛”“肉”“羊”“鸡”“鸭”“狼”“狗”“猪”“粪”“病”就可以事先知道如下36个伴行词的含义。这就是伴行词的先知性。
公羊 母羊 羊毛 羊肉 羊粪 病羊 公狼 母狼 狼毛 狼肉 狼粪 病狼
公鸡 母鸡 鸡毛 鸡肉 鸡粪 病鸡 公狗 母狗 狗毛 狗肉 狗粪 病狗
公鸭 母鸭 鸭毛 鸭肉 鸭粪 病鸭 公猪 母猪 猪毛 猪肉 猪粪 病猪
伴行词的先知性为汉语新词的构造和掌握带来了极大的便利。
2.连体词的游向性与伴行词的定向性
连体词的借代性在一定程度上解决了拼音文字语言的新词构造难题,但也因此而造成了词义的不定向性。像连体词mouse这样到底是指老鼠还是指鼠标必须依靠语言环境才能定型的特性称为连体词的游向性。
伴行词“羊毛”指的就是羊身上长出的毛,指向非常明确。像“羊毛”这样不需要依靠语言环境指向非常明确的特性称为伴行词的定向性。
游向性词含义多,总量少,词义依赖语言环境。
定向性词含义少,总量多,词义不依赖语言环境。
3.连体词的封闭性与伴行词的贯通性
公羊、母羊、羊毛、羊肉是相互关联的,与之相对应的连体词ram、ewe、wool、mutton词形之间没有任何直观的联系。概念之间的关联性信息在与之相对应的词形之间被完全覆盖了。这说明连体词具有封闭词汇关联性信息的特性(称为连体词的封闭性)。这种特性非常不利于词汇的立体化掌握和运用。
公羊、母羊、羊毛、羊肉是相互关联的,与之相对应的伴行词“公羊”“母羊”“羊毛”“羊肉”词形之间都有一个“羊”字,该字反映了各个概念之间的联系。就词形“羊毛”来说,通过“羊”和“毛”的含义,可自然产生“羊毛”的词意。就实物羊毛来说,毛的特点可以启发人们追溯它的来源,从而也可自然产生“羊毛”的词形。这说明伴行词具有贯通词汇关联性信息的特性(称为伴行词的贯通性)。这种特性非常有利于词汇的立体化掌握和运用。
4.连体词的孤立性和伴行词的衬托性
接受、接收、接手三个概念之间有共性,也有区别。与之相对应的三个连体词accept、receive、take
over摆在一起,从词形上看不出它们的共性,也看不出它们的差异点,每个词都是孤立的。这种从词形上看不出关联信息的特性称为孤立性。连体词的孤立性非常不利于词汇的立体化掌握和运用。
接受、接收、接手三个概念之间有共性,也有区别。与之相对应的三个伴行词“接受”“接收”“接手”摆在一起,从词形上一眼就能看出它们的共性和差异点,每个词都不是孤立的,是可以相互衬托的。这种在词形上相互衬托关联信息的特性称为衬托性。伴行词的衬托性非常有利于词汇的立体化掌握和运用。
掌握抽象概念一般要比认识具体对象困难,而伴行词的衬托性特性则非常有利于抽象概念的掌握。例如,“接受”“接收”“接手”的含义共同点和不同点之所以在我们的意识中十分清晰不易混淆,是因为“受”“收”“手”的映义在发生作用。而“受”“收”“手”的映义又可以从以下系列词中衬托出来。
受──接受;忍受;受害;受听
收──接收;收集;收税;收益;收留;收监;收心;收场
手──接手;人手;手册;手抄;手段;一手;选手
连体词的孤立性类似于前边讲过的封闭性,伴行词的衬托性类似于前边讲过的贯通性。封闭性和贯通性主要是针对容易理解的实物对象而言的,孤立性和衬托性主要是针对较难理解的抽象概念而言的。
5.连体词的音节不应性和伴行词的音节呼应性
羊肉是羊的肉,就羊肉这个对象来说,它有两个特性,一个是肉的一般性特性,另一个是反映生长来源的特异性特性。连体词mutton的两个音节所产生的两股冲击波与羊肉的两个特性无法产生呼应关系。连体词的这种音节冲击波不能呼应相关概念的特性称为音节不应性。音节不应性抑制了人脑对某一对象的多特性感知,从而不利于词汇的辨识与理解。
羊肉是羊的肉,就羊肉这个对象来说,它有两个特性,一个是肉的一般性特性,另一个是反映生长来源的特异性特性。伴行词“羊肉”的两个音节所产生的两股冲击波与羊肉的两个特性相互呼应呈现出一种叠加效果。伴行词的这种音节冲击波呼应相关概念的特性称为音节呼应性。音节呼应性增强了人脑对某一对象的多特性感知,从而有利于词汇的辨识与理解。
6.现代汉语的本质特点
语言由词构成,词的特点就是语言的属性。现代汉语为伴行词语言,伴行词的先知性、定向性、贯通性、衬托性和音节呼应性都来源于一个总的特性,那就是伴行词的含义由分布在单音节上的映义构成。因此,从语言的本质属性来说,现代汉语属于单音节映义语言,而拼音文字语言则属于多音节映义语言。
7.进一步认识映义的作用
打开字典随便看一下就会发现,很多字的后边都有好几个注解。翻开英语辞典,单词的注解也不少。汉语的一个字或英文的一个单词有那么多含义,人们是怎么记住的呢?其实,无论是汉语中的一个字还是英文中的一个单词,它们都是映义的代码。人脑就是通过映义把那么多含义贯穿起来的。不通过映义人脑将无法把握这个世界。
5 瑕疵词汇的商榷
1.外来词“的士”
“的士”来源于英文taxi,意思是出租小汽车。从静止的角度来判断,这是一个连体词。但从演变的角度来判断,这是一个伴行词。理由有两点:其一,“的士”的读音前重后轻使得“出租小汽车”这个含义自然地落到了“的”的身上,“士”成了一个只起拖尾音作用的配词;其二,“打的”等相关词汇的出现把“出租小汽车”这个含义再一次推到了“的”的身上。
但是,“的士”是一个极其糟糕的词汇。理由有两点:其一,它使“的”变成了多义字;其二,它使严重高频的“的”雪上加霜。
在《现代汉语字频统计表》[1]中,顺序排列的163、603、1048、1352个字形的累计使用频度分别为50.1%、80.0%、90.0%、93.6%。这个数据告诉我们,常用字的使用频度太高。
一次阅读就是一次刺激,阅读是有限的,刺激也是有限的。一部分汉字刺激人脑的机会太多,另一部分汉字刺激人脑的机会就必然太少。“赣”是一个应当掌握的汉字,但它的使用频度很低一年也见不到几次,人脑没有接收到它的刺激自然就难以记住它。人们对“赣”的陌生充分地反映了这样一个实事:常用字的使用频度太高不利于汉字的全面掌握。
建议把“的士”改为“狄轼”(“打的”改为“打狄”)。如果这样人们就会自发地赋予该词新的含义:“狄,一种动物;轼,一种车”(“狄”的反犬旁和“轼”的“车”字旁都有这样的暗示作用)。这样一来不仅“狄”“轼”两个闲字被活化了,而且还减轻了高频字“的”的压力。
另外,建议把“美的”(商标名)中的“的”改为别的字。“睡的香”(商标名)中的“的”是错别字,应改为“得”。
2.外来词“克隆”
抽取生物体的体细胞进行无性繁殖可复制出遗传性状完全相同的生命物质或生命体,这是当今世界所掌握的一项技术。英文单词clone就是这一技术最常用的词汇之一,而“克隆”就是clone的音译。这个音译不但从字面上看不到任何该技术的信息,而且还暗示着“克制兴隆”。本来复制生命就涉及伦理问题,现在又从字面上浮出这样一层意思来,真是太不吉利了。
克隆羊就是抽取羊的细胞进行无性繁殖而培养出来的遗传性状与“母”羊完全相同的羊。把“克隆羊”改为“无性繁殖羊”太长,改为“无性羊”容易引起歧义,但改为“无蜂羊”则是可以考虑的。蜂是植物授粉的媒介。“无蜂羊”就是没有经过授粉的羊,与“无性繁殖羊”含义吻合而又具有直观性。
从语言的本质特性来分析,clone是游向性很强的词,这样的词只适用于它自己的连体词语言环境,而属于伴行词语言环境的现代汉语则排斥游向性词。因此,涉及clone的翻译要充分利用反映无性繁殖特点的直观性信息如手指螺纹和遗传基因
DNA的双螺旋结构等进行意译。比较以下两个句子我们可以看到,避免使用“克隆”而利用上面谈到的直观性信息意译出来的句子,其表达效果要好得多。
──由于各个细菌的生存和繁殖能力不同,各个克隆被保存的机会也因此有所不同。
──由于各个细菌的生存和繁殖能力不同,各个受体中植入的螺片被增值保存的机会也因此有所不同。
建议取消“克隆”这个词。相关的替代词汇有“无性繁殖”“无蜂”“螺片”“孪制”“植入”“植螺”等。其中“孪制”是指一模一样的复制。
3.外来词“托福”
“托福”是toefl的音译,而toefl则是Test of english as a foreign
language的缩写,它指的是一种考试。“托福”给人的感觉是“寄托幸福”,这个字面意思的暗示作用将会潜移默化地影响人们的心理健康,建议改为“拓幅”。
4.算术中的“除”
“根除”“铲除”中的“除”是去掉的意思,“这篇文章除附表外只有三千字”中的“除”是不计算在内的意思。这两个意思可以相互映射,相互衬托,并且看得见,有感觉。但是,“2除6得3”就让人迷惑了,不但看不见,还想不通:2去掉6怎么得3呢?
不追究“除”的原始含义,只看它的实际功能,可以这样理解:“2除6得3”都是,用2把6折断可以折为3节;“6除以2等于3”就是,6用2来折可以折为3节。当然也可以这样理解:“2除6得3”就是,2个人分6个苹果,每人得3个。
总之,如果把“2除6得3”改为“2折6得3”,这个运算过程人们就看得见了。小学生建立除法的概念就不会有那么难了,小学生做除法应用题就比较容易进入角色了。
“2除6得3”中的“除”有三个缺陷:一是其含义(即实际功能)与“铲除”“除此之外”中的“除”相冲突;二是其含义太抽象,看不见,不好理解;三是容易造成“除以”与“除”的混乱使用。以下专讲第三个缺陷。
如果你是一个细心的读者,你可能会听到过隔壁邻居“6除2等于3”教其小孩的声音。为什么会发生这样的现象呢?有两点原因:一是“除以”的读音有点长,经常有人不知不觉就把其中的“以”字省掉了;二是受“加、减、乘、除”贯性思维的影响“既然6加上2可以说成6加2,2乘以3可以说成2乘3,那么6除以2就‘理所当然’地可以说成是6除2了”。
还有,“5整除2”是等于“5整除以2”呢?还是等于“2整除以5”呢?这就只有再一次依靠人为规定了。
综合考虑有两种解决思路:第一种思路是简单地用一个闲字“刍”取代“除以”,并使“刍”与“刍以”等效,且取消“2除6”的书写形式;第二种思路是用“折”取代“除”,用“断”取代“除以”(“断”与“断以”等效),用“垄”取代“整除”。
建议采用第二种思路。“2折6等于3”就是“用2折6可把6折为3节”。“6断2等于3”就是“6断为两节每节为3”。“6断以2等于3”就是“6用2来折断,可折为3节”。“7垄2等于3”就是“7垄(断)为2节,每节取整数,结果为3”。
5.多音字“会计”中的“会”
在包含“会”字形的所有词汇中,仅有“会计”和“会计师”中的“会”念kuai(降声)。其实把“会计”和“会计师”改为“脍计”和“脍计师”是完全可以的。如果真能这样,将有三大好处:一是减少了一个多音字;二是降低了高频字的使用频度;三是提高了低频字的刺激量。
“脍炙人口”为单科独种词汇,刺激量较低,若有“脍计”一词,则“脍”的刺激量就会大大提高,从而会使人们自然地熟悉“脍炙人口”这个成语。
6.“冰箱”与“冰柜”
我们都知道箱和柜的区别:箱是从顶部开盖的,柜是从侧面开门的。但是现在所指的冰箱与冰柜的开门或开盖方向却反过来了。如此一来箱和柜的概念就被损伤了。
在电冰箱之前我国北方就已经有了冰箱,而当初电冰箱这个昂贵物品传入我国时人们最关注的,是它能用电致冷。第一个人不用心地把“电”和“冰箱”这两个已知名词简单地加起来就构成了电冰箱的名称,而人们的注意力又都集中在电上,于是“电冰箱”这个名称就被接受了。后来有了用电致冷的从顶部开盖的箱式容器,而“电冰箱”这个名称已被占用,结果就只好用“电冰柜”这个名称了。再后来人们觉得用电致冷是理所当然的,“电”字成了多余的累赘,于是“电冰箱”被简化成了“冰箱”,“电冰柜”被简化成了“冰柜”。整个演变过程就是这样。
建议把这两个词的含义互换过来,使它们都处于正常状态。
6 名词概念的定位
6.1 词
1.词的定义
语言的产生就是概念的运用,概念的运用就是词的运用,最早的词就是动物之间能够听懂的呼叫声。动物的呼叫声既是词,又是概念,还是意识。动物的下一代之所以能够很快地掌握上一代的“意识~概念~词”,说明“意识~概念~词”存在着相应的可以遗传的物质形式。我们把这种物质形式称为意
载体。动物进化到人,意识复杂了,概念多了,词汇丰富了,装载着“意识~概念~词”的意载体数量也多了,但刺激总量未变,物质总量未变,结果分摊到每个意载体上的遗传“硬度”就不足了。于是,下一代继承上一代的“意识~概念~词”就变得相对困难了。
虽然“意识~概念~词”的遗传“硬度”趋近于零,但毕竟不等于零。“意识~概念~词”的物质基础是显而易见的,语言的运用也正是建立在这个物质基础之上的。“意识~概念~词”一个个地存在于人脑之中,每一个都是不可分割的
意载体,它们就是语言的运用单位。语言的运用单位就是我们要定义的词。
词是语言中能够独立运用的意载体。一个句子由若干个独立的意载体组成,每一个意载体都是一个词。词是语言的基本单位,是句子的唯一构成单位。
例句:他来过这里∕他拿着玻璃∕他做事总是三心二意∕你这难道不是此地无银三百两?
以上例句中“他”“来过”“玻璃”“三心二意”“此地无银三百两”都是语言中独立的意载体,是被人脑当作一个意义单位进行运用的,都是词。
2.词的固化度划分
词按固化程度分为连体词和伴行词两类。伴行词再分为结发伴行词、结伴伴行词和固语伴行词三类。结发伴行词是指固化程度较高拆分理解不舒服的一类伴行词。结伴伴行词是指固化程度一般拆分理解可接受的一类伴行词。固语伴行词是指承担词功能的固化了的短语。
伴行词的固化程度与语言环境的变化是有关联的,因而其划分也只能是相对的,有时是无法严格区分的。各类伴行词举例如下:
结发伴行词──疾病、单位、银行、汉奸、马虎、东西、意识、速度、迷信、总称
结伴伴行词──来过、拿着、总是、不要、就是、新社会、主动性、封建迷信、见者有份
固语伴行词──三心二意、实事求是、此地无银三百两、竹篮打水一场空、死猪不怕开水烫
3.词定义的商榷
“词是能够独立运用的最小的造句单位”是目前现代汉语教科书中对词的典型定义。该定义的逻辑线就像一把剪刀一样把固化程度不高或长度较长的一部分词剪掉了。具体说明如下。
第一,对于运用词来表达思想的人脑来说,它一旦捕捉到了某一个词,那就是一个完整的独立运用的概念,而与该词是否是最小的造句单位无关。因此定义中包含“最小的”就是对词的含义进行切割。
第二,无论是“他”,还是“疾病”,还是“封建迷信”,还是“死猪不怕开水烫”,它们都是被语言运用的基本单位:在人脑之外有明确的指向,在人脑之中是意载体。在人脑之中它们都是词,而在人脑之外它们有的是词,有的是词组或短语,这显然不通。
第三,“意识~概念~词”一个个地存在于人脑之中,它们每一个都是不可分割的意载体,都是语言的运用单位,都具有相同的性质──树有高有矮,有结实的,也有不结实的,但都具有树的性质;同理,词有固化程度高的,也有固化程度一般的,有字数少的,也有字数多的,但都具有词的性质。
以上三点说明,现代汉语的词定义缩小了词的正常范围。建议采用本文的词定义,并在现代汉语中取消“词组”这个名词。“词组”作为日常生活用语与“单字”对应可以允许存在:单字是指一个字,词组是指多于一个字的字组合(“字组”念起来有点拗口)。
6.2 独体字与合体字
1.独体字与合体字的第一次尴尬
传统汉字学从造字法的角度分析汉字,认为象形字和指事字是由一个具有独立表意的部分构成的,是独体字;会意字和形声字是由两个或两个上以上的具有独立表意或表音的部分构成的,是合体字。
为什么称象形字和指事字为独体字呢?因为隶变前的象形字和指事字就像一幅图画一样是一个整体,所以称为独体字。独体字这个名称是对隶变前的象形字和指事字形体独立这个特点的概括。当汉字隶变以后,象形字和指事字的形体发生了根本性的变化,这时如果还用独体字来概括象形字和指事字的形体特点,那就不恰当了。例如,隶变前的象形字“泉”字相当于一幅图画,是一个整体,但眼前的这个“泉”字则是由“白”和“水”两个字拼合而成的。如果我们现在还把眼前的这个“泉”字称为独体字的话,则这样的称呼明显地与“独体”的字面意思发生矛盾。
为什么称会意字和形声字为合体字呢?会意字和形声字是由一个字加或减一个或多个能表示独立意义的单位拼合而成的,意义是由形体承载的,意义拼合就是形体拼合,所以将会意字和形声字称为合体字也就理所当然了。合体字这个名称是对会意字和形声字形体拼合特点的概括。需要说明的是,虽然会意字和形声字都是形体的拼合,但从视觉空间上看,并不是都留下了拼合的缝隙。例如,从造字的角度分析,“本”“末”“正”“乌”这些会意字(有的指事与会意无法严格区分)为合体字是毫无疑问的,但从形体结构上分析,因看不到拼合的缝隙,将它们称为合体字就会感到十分别扭。
根据以上分析可知,自从汉字隶变特别是楷化以后,独体字和合体字这两个名词就处于一种尴尬的境地。汉字结构方式国家标准的十三种类型中的第一种类型称为合体字,这里的“合体”显然是基于形体结构而言的。如果允许这样的称呼存在的话,那么,固化在各种文献和人们心目中的基于造字思维体系的独体字的概念又该怎么办呢?“独体为文,合体为字”以及“汉字从独体字发展到合体字”这样的话还能继续说下去吗?
2.独体字与合体字的第二次尴尬
自从有了部件这个术语之后,自发地对独体字与合体字进行重新定义的人就更多了。其中具有代表性的定义是:由一个末级部件构成的字是独体字,由两个或两个以上末级部件构成的字是合体字。
如何理解这个定义呢?我们不妨看一看《部件规范》[2]对部件的定义:部件是由笔画组成的具有组配汉字功能的构字单位。“构字单位”的一个定语是“由笔画组成的”,汉字中最基本的构成除了笔画,就再也没有别的东西,这说明“由笔画组成的”这个定语没有起到任何限定作用,是多余的;“构字单位”的另一个定语是“具有组配汉字功能的”,这个定语也没有起到任何限定作用,也是多余的。因为汉字中的任何一个结构都具有组配汉字的功能,否则它就不是汉字中的结构了。去掉这两个多余的定语,《部件规范》对部件的定义就变成了“部件是构字单位”。至于部件是什么样的构字单位,在这个定义中人们看不出来。因为汉字中的任何一个结构都是构字单位。
根据分析后的部件定义可把“部件”换成“构字单位”。如果这样一换,即以上具有代表性的对独体字与合体字的新定义就变成了“由一个末级构字单位构成的字是独体字,由两个或两个以上末级构字单位构成的字是合体字。”而这样的定义说了等于没说。
由于部件的属性不明确,因此,用部件来定义独体字与合体字,也就使得独体字与合体字的属性也不明确。于是,独体字与合体字这两个名词再次处于一种更加尴尬的境地。
3.独体字与合体字两个名词的用途
独体字与合体字这两个名词的尴尬境地我们已经看到了,那么这两个名词有没有什么实际用途呢?不涉及汉字溯源而使用独体字与合体字的句子,句子意思往往因独体字与合体字的概念不清晰而不清晰。进而言之,如果把那些做秀的行为过滤掉,在不涉及汉字溯源的句子里,我们还真的找不到哪个句子中必须使用独体字与合体字这两个名词的理由。也就是说,在不涉及汉字溯源的情况下,独体字与合体字这两个名词没有什么实际用途。因此,应将独体字与合体字的含义停留在汉字隶变之前。即在现代汉语中,避免使用独体字与合体字这两个名词。汉字结构方式国家标准的十三种类型中的第一种类型即合体字可以改称为单体结构。
6.3 偏旁与部首
1.偏旁
按传统说法,汉字从独体字发展到合体字便产生了偏旁。因为汉字大部分是左右结构,故左边称偏,右边称旁。后来人们习惯于将左右上下不同部位都统称为偏旁。
在汉字隶变之前,偏旁都是具有独立表意或表音的结构单位,但随着汉字的隶变,情况就变得复杂起来:
其一,在字义教学中,人们已经习惯于用偏旁来帮助理解和记忆汉字的字义和读音,于是希望偏旁是一种具有独立表意或表音的构字单位;
其二,在日常对话或写字教学中,人们又习惯于把那些处于“有利”位置但不能独立表意或表音的构字单位也说成是偏旁,如左偏旁、右偏旁、上偏旁、下偏旁;
其三,形状完全相同的结构,在一些字里具有独立的表意或表音的功能,而在另一些字里则可能不具有这样的功能,这就使得人们对偏旁的认定更加捉摸不定。
怎样满足使用者多方面的应用需求呢?不同的概念用不同的代码是最且码的要求。建议将偏旁作为通用名词对待,重新定义一个专用名词“字李”来取代偏旁的表意或表音功能。字李是汉字中具有独立表意或表音的构字单位即理据单位。
2.部首
部首始创于东汉许慎的《说文解字》。在《说文》中,许慎以那个时候的汉字偏旁为线索,把9353文归并为540
部,每部的首字即为部首。但《说文》一书并未出现“部首”一词,“部首”这个名词是后来慢慢出现的。
最早的部首即《说文》中的部首有540个,几乎可以说这540个都具有独立表意或表音的功能。现代汉语词典2005年版有201个部首。在这201个部首中,有很多已没有独立表意或表音的功能了。本来,部首的作用就是检索汉字,它不需要具有表意或表音的功能。但是,由于受到传统思想的束缚,人们始终没有摆脱表意或表音的阴影。
用部首检字法查字,必须先查部首,而不是按汉字结构的顺序查找。图画式的篆书要先查具有表意或表音功能的部首是一种不错的选择,而对现代汉字还是照搬两千年前的做法,则是国人因循守旧的最好证据。检索“叶”“史”“吏”时先查“口”,而检索“中”“串”时却不能先查“口”,这是为什么呢?两千年来竟然没有人修改它,这真是一项“千古奇迹”!
设置部首检字法的目的是为了检索汉字,而不是为了学习部首。《现代汉语词典》2005年版设置201个部首的依据是什么似乎没有人能够说清楚。在《现代汉语词典》中也找不到部首的定义。归纳这201个部首,笔者只能给部首下这样的定义:部首是现代汉语部首检字法中的汉字拆分单位,它包括笔画、没有读音的汉字结构和有读音的汉字。
6.4 部件与字梁
1.部件与字梁的指向
关于部件,目前学术界被如下三个问题所困扰:一是单笔画是否属于部件;二是部件是否有层次性;三是部件是否应当是成字的。[3]产生这三个问题的根源就在于,学术界既希望部件用于识字教学,又希望部件用于字形编码。
如果希望部件用于字义教学的话,那么,它必须是一种具有独立表意或表音的构件;如果希望部件用于写字教学的话,那么它必须是一种方位结构,或具有某种有助于写字教学的形体特征;如果希望部件用于字形编码的话,那么,它必须有利于汉字拆分和部件分类。但是,我们不能既希望部件用于字义教学,又希望部件用于写字教学,还希望部件用于字形编码,正如我们不能希望有一种药物能包治百病一样。
部件是一个词。来源于实际需要的词,其含义由使用它的各种类型的句子共同衬托和维护,合理的定义可以起到领头羊的作用,而不合理的定义不但起不到领头的作用,反而还会把人们的思想搞乱。一个句子凭什么要使用“部件”这个词?如果部件的指向不清晰,那么含有“部件”的句子所表述的思想往往就清晰不起来。因此,“部件”作为一个词存在,它必须具有清晰简明并且有用的指向。
其实,部件无非就是汉字中的某些结构而已,这个不清晰的指向即“部件”这个词根本就是多余的。困扰学术界的三个问题更是没有意义的问题。笔者建议在字形编码和识字教学中淘汰“部件”这个名词。字义教学有字李,字李是汉字中具有独立表意或表音的构字单位即理据单位。写字教学有笔画和偏旁。而对于字形编码,我们可以定义一个新名词字梁。字梁是字形编码的汉字拆分单位和单一码符对应单位。
2.字梁的命名依据
为什么非要定义一个新名词“字梁”而不使用人们已经熟知的名词“字根”或“部件”呢?
根的本意是树根,引申为根本。从这一基本含义延伸出来的词语如根本、根据、根基、根源等使用极为频繁,在人们的意识中烙印很深,因而当遇到字根这个词时,人脑就会自发地与“字的根本”联系起来,但字根并不是字的根本。这就产生了一种不协调的感觉,以至对人脑造成了某种程度的伤害,因而字根这个名词不理想,不宜使用。
部件本来是机械学中的一个术语,指的是由若干装配在一起的零件所组成的一部分。目前,在人们的意识中,部件这个词几乎已经成了通用名词,如“这个物体主要包括三个部件”。如果非要把字形编码的汉字拆分单位和单一码符对应单位称为部件的话,那就只能称为“汉字部件”。而这样的名词实在是太长了,不方便使用。
十多年前笔者在研究汉字编码之初想出“字梁”这个名称花了将近半年时间。梁的本意是房梁,可引申为栋梁、支柱、骨架、构件。因此,字梁就是字的构件,字的构件就是字的拆分单位。字梁中的“字”字说明它是汉字的拆分单位,而不是机器或其他物体的拆分单位,字梁中的“梁”字说明它是一个构件,一个如房梁一样的构件。
梁的另一层含义是隆起的部分,如鼻梁中的梁。这样,字梁就是字的隆起的部分。例如在“束”中,“木”相对于“口”而言是隆起的部分,“口”相对于“木”而言也是隆起的部分。
字梁这个词形象、直观、简明地表达了汉字的拆分单位这个对象。由一个字梁组成的汉字称为“单梁字”,这个名称要比“单部件字”“成字部件”等名称清晰、简明得多。
名词“字梁”充分地体现了伴行词的多种特性,是一个理想的名词。笔者将字形编码的汉字拆分单位和单一码符对应单位称为字梁,不仅是因为字梁是最恰当的名词,更重要的是,字梁就像英文字母一样是一个纯粹的取码单位,概念十分清晰。
7 结束语
20世纪50年代初国家专门成立了文字改革委员会。当时对汉字改革的总体规划是:先简化汉字,推广普通话,制定和推行汉语拼音方案,等条件成熟后再过渡到拼音文字[4]。如今半个世纪过去了,拼音文字并没有出现。问题到底出在哪里呢?
20世纪70年代末80年代初,汉字输入计算机的问题解决了。但是,随之而来的问题是,在数以千计的编码方法面前,人们无所适从。“……尤其是汉字部件拆分的不规范现象正逐年增多。这种状况既不利于计算机的应用,又不利于语言文字的统一规范,同时也给计算机教育和识字教育造成了很大的困难。”
[5]为此,1997年12月,国家语委颁布了《部件规范》。此规范在评定汉字编码时具有一票否决权。如今十余年又过去了,符合《部件规范》的汉字编码仍然没有逃脱优劣难辨的命运,人们还是无所适从。问题到底出在哪里呢?
不弄清现代汉语的本质,现代汉语发展中所遇到的重大问题就不可能得到有效的解决。这就是本文的写作意图。本文所要强调的两个重要观点如下。
其一,字形编码的编码符号只有代表一组相互映射的形态,它才能在人脑中形成清晰的概念,只有概念清晰映形鲜明,人脑才能较好地捕获和运用。
其二,伴行词的构成单位──单音节字代表了一组相互映射的含义,正是由于这些映义的相互映射,伴行词才能具有先知性、定向性、贯通性、衬托性和音节呼应性,使现代汉语成为当今世界唯一成熟的语言。
通读全文,可以得出这样的结论:通过映义现代汉语可以有效地管理世界,通过映形字形编码可以有效地管理汉字。
另外本文还有一个搭配产品提请读者注意:字母“l”和数字“1”特别相像,它给使用带来了极大的不便,但至今没有人修改它,不知问题到底出在哪里?
参 考 文 献:
[1] 国家语言文字工作委员会,国家标准局.现代汉语字频统计表[M],北京:语文出版社,1992.
[2] 国家语言文字工作委员会.GF3001-1997信息处理用GB13000.1字符集汉字部件规范[S].北京:语文出版社,1997.
[3] 沙宗元.汉字研究中的一组术语[J].语言文字应用,2006,(3):57-62.
[4] 黄伯荣,廖序东主编.现代汉语[M].宁夏:甘肃人民出版社,1983,188-188.
[5] 《汉字部件规范》研制组.关于制订《汉字部件规范》的若干问题[A].计算机世界.1998年第15期.技术专题版.专题报道.
========================
注:此文有造字,安装了形象码后即可显示和打印造字
========================