我国公民姓名用字中的生僻字分析
发布时间:2015-07-02 11:56
摘 要:在社会信息化进程不断深入的今天,信息处理过程对文字系统的标准化程度要求日益凸现。为了充分发挥汉字的交际作用,必须实现对其规范化。建国以来公布的通用字表及后来制订的gb信息交换用汉字编码字符集为汉字的规范化提供了标准和依据,但对于人名用字范围却没有做出相应的规定。长期的规范缺失致使这一方面的汉字应用逐渐混乱无序,显著特征之一就是取名频繁使用生僻字。已经制订完成的公安部《姓名登记条例(初稿)》和由国家语委主持制订的《规范汉字表》对人名用字的范围做出了明确划定,施行之后将会逐渐减少取名无序的现象。从列举实际姓名中生僻字用例开始,对此种现象进行了分析并为户籍管理工作人员提出了建议。
关键词:姓名用字;生僻字;规范汉字表;户籍管理
1 中国人姓名中冷僻字的使用情况
中国是一个人口大国,同时也是一个姓氏大国。我国历史上记载过的姓氏共有5652个,其中单音姓氏3438个,双音姓氏2030个,目前使用的大约有2800多个。在这两千多个姓氏中,大姓张、王、李、赵、陈、杨、吴、刘、黄、周姓公民就占全国人口总量的40%。大姓与惯常普遍的人名用字组合便形成重复率极高的姓名形式,一个名为“中国姓氏权威”的博客于2007年公布的《中国重名最多的50个姓名列表》显示“张伟”、“王伟”、“王芳”、“李伟”、“王秀英”居于列表前五位,是当今中国最大众化、最“流行的”名字。该博客称其数据来源是公安部全国公民身份证号码查询服务中心。数据显示全国有“张伟”290607人,“王伟”281568人,二伟数量庞大,甚至超过了冰岛和马尔代夫两国人口数量之和。随着人口的不断增长,社会内部人员信息流动性增强,姓名相同的人在生活诸方面遇到了意想不到的身份证明问题――升学就业,户籍管理,储蓄信贷,社会保障……跟随自己多年的名字居然会带来如此多的烦恼与不便,这在以前是未曾预料的。
“赐子千金不如授子一艺,授子一艺不如赐子好名”,在中国传统文化中,姓名早已超越了本身的符号性,传承着人的情、意、志,蕴含了人的精、气、神。父母授子以好名,将自己对后代的希冀与祝福包蕴在名中,给姓名的同时希望文字中的好运能伴随子女一生。于是为孩子取个寓意好、读音好、字形好的“三好”名字是家长们要考虑的大事。如今孩子越来越多,好名字也层出不穷,无论选什么样的字做名字似乎都会和别人重名。年轻的父母自然不愿意自己的宝宝与别人家的宝宝“撞名”,于是就找到了一种省时省力的办法――求助于“起名公司”,希望能从姓名专家处求得美名。但所谓的“专业人士”并未意识到人之姓名是别人用的多,换言之姓名的本质属性是社会性,应当“在考虑个人使用方便的同时兼顾社会使用方便”(苏培成,2003),许多起名公司夸大了姓名的个性特征,只要不与他人重名,怎样的形式都可以。笔者早些年曾在一家起名公司的宣传手册上了解到这样几条取名方法论,虽不是原文,但经归纳后仍不失要义:一,取两个字以上的名;二,自造复姓(父姓+母姓);三,使用符号、数字及自造汉字(自造的汉字多来源于公司首席周易大师);四,使用不常见的汉字(冷僻字)。在理论指导下,一个个新颖、新奇、奇怪、怪异的名字不断涌现,现举例若干:马啸中原(1990年生),这属于第一类;夏曲佳硕(2003年生)、李冠清华(1999年生)、吴唐亦多(1991年生),这是第二类,自创的复姓;张一a、赵c,属于第三类,由数字、符号或字母构成的名字;李垚辰、李龑,姓名中包含不常用的冷僻字,为第四类。
2005年公安部在全国范围内开始进行第二代居民身份证的换发工作。在此过程中由于名字中的冷僻字计算机字库中并未完全收入,许多姓名中含有冷僻字的公民无法按时领取证件。就此问题公安部组织全国各级公安机关,收集涉及姓名、地名方面的冷僻字3万多个,将其与北大方正字库已收字相比对,最后确定字库未收入而实际使用的冷僻字4600个。对于新增的4600个字,公安部门联合相关机构对其逐一进行编码、造字并制成新的字符软件,安装到各制证中心。如此一番努力让身份证被暂缓发放的居民最终拿到了自己的身份证明,可其间花费了个人及社会组织、机关单位的大量时间、精力和财力,造成了很多不必要的资源浪费。
2 生僻字及人名用字中的生僻字
2.1 生僻字的概念
即将出台的《规范汉字表》依据社会通用度将汉字分为四级:一级字,约3500字,略相当于原《现代汉语常用字表》;二级字,约4500字,略相当于原《现代汉语通用字表》中除常用字以外的通用字;三级字,约4000字,为除通用字以外的专业用字,包括地名、姓氏、人名、科技等专用字;四级字,约18000字,罕用的古字、方言字等。(《规范汉字表》课题组)。其中的三级字与四级字使用频率远低于前两级用字,在日常语文生活中显得少见,按苏培成的建议,可将三级字与四级字合并,建立《罕用字表》(苏培成,2004),与通用字使用高、分布广、构词能力强等特点相对,罕用字的使用频率低,学科分布不广泛,构词能力不强,广大民众在日常文化生活和沟通交往中很少使用,与报章杂志,街头巷尾处处可见的常用字相比,这两类字显得古奥生疏,难于识记。根据周有光先生提出的汉字效用递减律,将汉字按降频排列,在6600号以后的字,不管有多少,它的总覆盖率不超过0.001%,也就是十万分之一。划分生僻字要依据社会用字的实际情况,即字频统计的结果,但通用字和三级、四级字的区分是相对的,无法找到一个绝对的划分界线(苏培成,2004)。根据国家语委和国家教委1988年发布的《现代汉语常用字表》,首先将生僻字的范围界定在2500个常用字和1000个次常用字之外。目前,汉字学称四类字为生僻字:第一类是音义不全的字,字典上有形,但有音无义或有义无音,这些字多半是在字典收字时横向合并或历史传承时整理不彻底及转抄错讹造成的;第二类是指已经被现代楷书取代了的古文字隶定字形或过渡字形;第三类是不通行的异构或异体字;第四类是适应某一种方言的方音而制造的方言字,例如粤语中的“乜”,武汉方言中曾经使用过的木与六组合而成的新形声字代替“楼”字。
2.2 人名用字中的生僻字带来的不便
自1985年gb2312-80信息交换用汉字编码字符集基本集发布以来,为了适应社会信息交换的数字化进程,我国不断研发颁布了一系列信息用的汉字编码字符集,如:信息交换用汉字编码字符集的几个辅助集,1993年12月公布的gb13000信息技术用通用八位编码字符集,2000年3月发布的gb18030-2000信息交换用汉字编码字符集基本集的扩充,最新的扩充集收字27484个,总编码空间超过了150万个码位,为解决人名、地名用字的计算机输入问题提供了方案。尽管汉字字库不断扩充,现实信息处理过程中依然会遇到人名用字中极生僻的字未被收录的情况。例如在南宁一所小学,有个学生的名字是“契”下面的“大”换成“女”,读音是jiē,这个字即使在收字达7万的cjk中日韩统一汉字字符集里也找不到,该字集包含来自中文、韩文、越南文意义相同、形态相近的表意汉字。这样使用频率极低的“死字”硬被送到现代社会生活里来,除了增加使用困难,没有多少实际意义。
3 当前户籍管理中姓名生僻字问题
随着公安部、教育部、国家语委等相关部门陆续出台各项姓名规范,我国公民姓名用字的选取将逐渐趋于规范。由公安部制定的《姓名登记条例(初稿)》已于2007年6月起实行。《条例》中明确规定姓名不得使用超出规范汉字范围以外的字样。该条例是针对基层公安机关进行人口户籍登记工作的细则,对公众取名所用汉字的范围只做出了大体规定,并未说明实际具体的规范用字。。
对于姓名规范这一问题,国外有许多先例可以借鉴参考。相关措施大多为制定条例或直接由国家立法实现对公民取名用字的规范。例如邻国日本。日本的《户籍法》于“申报出生第五十条(子女名字使用的文字)规定:子女的名字,应当使用常用平易的文字,常用平易文字的范围,由命令规定;巴西的《民事登记法》规定:户籍人员对户籍申报人申报的古怪名字可以抵制,不作登记;阿根廷《民事及人事登记法》规定不允许公民取古怪的、荒唐可笑的、不道德的或反应政治和意识形态倾向的、或不属于西班牙文字的名字等。在中国,既然对商标的设计、地名的命名以及法人的名称设定已有诸多禁止性的规范,对于自然人的用名也应当有明确的禁止性规定。
除政策法规制定,解决我国公民人名规范化问题,群众意识的改变以及科技创新是必由之路。规范的实质是一项语文改革,任何改革都会遇到阻力。公众观念的改变绝非朝夕之间可以实现,在保证必要的行政手段的前提下,细致的思想工作也是必需的。向群众宣传科学的汉字观,转变对人名用字的认识,使用规范汉字起名字照样可以彰显个性,得到人们喜爱的好名字。在户籍工作过程中,基层公安机关可以向辖区居民定期发放取名规范宣传手册,从最基础层面把思想工作抓起来。
在技术更新方面,建议在互联网上和公安派出所分别建立全国公民姓名查询系统和供取名选字用的规范字字库,面向群众提供免费快捷的服务。居民到辖区派出所进行姓名登记之前可以先查询核实要申报的名字是否符合用字要求,是否属于高重名率的姓名。此类查询服务若能尽快实现,将会为公民和户籍管理工作带来极大的便利。
参考文献
[1]周有光.现代汉语用字的定量问题[j].北京:商务印书馆,2004.
[2]王新华.日本户籍法[m].北京:中国人民公安大学出版社,2003.
[3]王涛.论中国的姓名管理制度[j].理论学刊,2005,(7):67-68.
[4]李娜.人名忌用生僻字[j].语言文字修辞,2006,(5).
关键词:姓名用字;生僻字;规范汉字表;户籍管理
1 中国人姓名中冷僻字的使用情况
中国是一个人口大国,同时也是一个姓氏大国。我国历史上记载过的姓氏共有5652个,其中单音姓氏3438个,双音姓氏2030个,目前使用的大约有2800多个。在这两千多个姓氏中,大姓张、王、李、赵、陈、杨、吴、刘、黄、周姓公民就占全国人口总量的40%。大姓与惯常普遍的人名用字组合便形成重复率极高的姓名形式,一个名为“中国姓氏权威”的博客于2007年公布的《中国重名最多的50个姓名列表》显示“张伟”、“王伟”、“王芳”、“李伟”、“王秀英”居于列表前五位,是当今中国最大众化、最“流行的”名字。该博客称其数据来源是公安部全国公民身份证号码查询服务中心。数据显示全国有“张伟”290607人,“王伟”281568人,二伟数量庞大,甚至超过了冰岛和马尔代夫两国人口数量之和。随着人口的不断增长,社会内部人员信息流动性增强,姓名相同的人在生活诸方面遇到了意想不到的身份证明问题――升学就业,户籍管理,储蓄信贷,社会保障……跟随自己多年的名字居然会带来如此多的烦恼与不便,这在以前是未曾预料的。
“赐子千金不如授子一艺,授子一艺不如赐子好名”,在中国传统文化中,姓名早已超越了本身的符号性,传承着人的情、意、志,蕴含了人的精、气、神。父母授子以好名,将自己对后代的希冀与祝福包蕴在名中,给姓名的同时希望文字中的好运能伴随子女一生。于是为孩子取个寓意好、读音好、字形好的“三好”名字是家长们要考虑的大事。如今孩子越来越多,好名字也层出不穷,无论选什么样的字做名字似乎都会和别人重名。年轻的父母自然不愿意自己的宝宝与别人家的宝宝“撞名”,于是就找到了一种省时省力的办法――求助于“起名公司”,希望能从姓名专家处求得美名。但所谓的“专业人士”并未意识到人之姓名是别人用的多,换言之姓名的本质属性是社会性,应当“在考虑个人使用方便的同时兼顾社会使用方便”(苏培成,2003),许多起名公司夸大了姓名的个性特征,只要不与他人重名,怎样的形式都可以。笔者早些年曾在一家起名公司的宣传手册上了解到这样几条取名方法论,虽不是原文,但经归纳后仍不失要义:一,取两个字以上的名;二,自造复姓(父姓+母姓);三,使用符号、数字及自造汉字(自造的汉字多来源于公司首席周易大师);四,使用不常见的汉字(冷僻字)。在理论指导下,一个个新颖、新奇、奇怪、怪异的名字不断涌现,现举例若干:马啸中原(1990年生),这属于第一类;夏曲佳硕(2003年生)、李冠清华(1999年生)、吴唐亦多(1991年生),这是第二类,自创的复姓;张一a、赵c,属于第三类,由数字、符号或字母构成的名字;李垚辰、李龑,姓名中包含不常用的冷僻字,为第四类。
2005年公安部在全国范围内开始进行第二代居民身份证的换发工作。在此过程中由于名字中的冷僻字计算机字库中并未完全收入,许多姓名中含有冷僻字的公民无法按时领取证件。就此问题公安部组织全国各级公安机关,收集涉及姓名、地名方面的冷僻字3万多个,将其与北大方正字库已收字相比对,最后确定字库未收入而实际使用的冷僻字4600个。对于新增的4600个字,公安部门联合相关机构对其逐一进行编码、造字并制成新的字符软件,安装到各制证中心。如此一番努力让身份证被暂缓发放的居民最终拿到了自己的身份证明,可其间花费了个人及社会组织、机关单位的大量时间、精力和财力,造成了很多不必要的资源浪费。
2 生僻字及人名用字中的生僻字
2.1 生僻字的概念
即将出台的《规范汉字表》依据社会通用度将汉字分为四级:一级字,约3500字,略相当于原《现代汉语常用字表》;二级字,约4500字,略相当于原《现代汉语通用字表》中除常用字以外的通用字;三级字,约4000字,为除通用字以外的专业用字,包括地名、姓氏、人名、科技等专用字;四级字,约18000字,罕用的古字、方言字等。(《规范汉字表》课题组)。其中的三级字与四级字使用频率远低于前两级用字,在日常语文生活中显得少见,按苏培成的建议,可将三级字与四级字合并,建立《罕用字表》(苏培成,2004),与通用字使用高、分布广、构词能力强等特点相对,罕用字的使用频率低,学科分布不广泛,构词能力不强,广大民众在日常文化生活和沟通交往中很少使用,与报章杂志,街头巷尾处处可见的常用字相比,这两类字显得古奥生疏,难于识记。根据周有光先生提出的汉字效用递减律,将汉字按降频排列,在6600号以后的字,不管有多少,它的总覆盖率不超过0.001%,也就是十万分之一。划分生僻字要依据社会用字的实际情况,即字频统计的结果,但通用字和三级、四级字的区分是相对的,无法找到一个绝对的划分界线(苏培成,2004)。根据国家语委和国家教委1988年发布的《现代汉语常用字表》,首先将生僻字的范围界定在2500个常用字和1000个次常用字之外。目前,汉字学称四类字为生僻字:第一类是音义不全的字,字典上有形,但有音无义或有义无音,这些字多半是在字典收字时横向合并或历史传承时整理不彻底及转抄错讹造成的;第二类是指已经被现代楷书取代了的古文字隶定字形或过渡字形;第三类是不通行的异构或异体字;第四类是适应某一种方言的方音而制造的方言字,例如粤语中的“乜”,武汉方言中曾经使用过的木与六组合而成的新形声字代替“楼”字。
2.2 人名用字中的生僻字带来的不便
自1985年gb2312-80信息交换用汉字编码字符集基本集发布以来,为了适应社会信息交换的数字化进程,我国不断研发颁布了一系列信息用的汉字编码字符集,如:信息交换用汉字编码字符集的几个辅助集,1993年12月公布的gb13000信息技术用通用八位编码字符集,2000年3月发布的gb18030-2000信息交换用汉字编码字符集基本集的扩充,最新的扩充集收字27484个,总编码空间超过了150万个码位,为解决人名、地名用字的计算机输入问题提供了方案。尽管汉字字库不断扩充,现实信息处理过程中依然会遇到人名用字中极生僻的字未被收录的情况。例如在南宁一所小学,有个学生的名字是“契”下面的“大”换成“女”,读音是jiē,这个字即使在收字达7万的cjk中日韩统一汉字字符集里也找不到,该字集包含来自中文、韩文、越南文意义相同、形态相近的表意汉字。这样使用频率极低的“死字”硬被送到现代社会生活里来,除了增加使用困难,没有多少实际意义。
3 当前户籍管理中姓名生僻字问题
为了应对我国姓名用字范围不断扩大的趋势,特别是不断“回归”的生僻字,公安部与相关职能部门研发了gb13000新字库,建立辅助字集以及创制生僻字应用方案,有效解决了人口姓名登记过程中的汉字输入问题。技术层面的不断创新提高了工作效率,但并不意味着用生僻字取名就应当被提倡。冷僻罕见的字保存在计算机字库里,轻松检索,一键即现;现实生活中,在个人口头笔下的使用过程中,生僻字带来的烦恼远没有结束。我们应当清楚,字库所收的字量与日常生活中实际使用的字量并非一致,“电脑要用来处理各种文本,收字要多,不但要收规范字,还要收不规范字;而一个特定阶段的社会用字量并没有这么多”(苏培成,2003)。人名用字中的生僻字之于计算机,输得进去,打得出来;之于个人,读不出来,写不出来,识记颇费时间,出现谬误的可能性也大。
随着公安部、教育部、国家语委等相关部门陆续出台各项姓名规范,我国公民姓名用字的选取将逐渐趋于规范。由公安部制定的《姓名登记条例(初稿)》已于2007年6月起实行。《条例》中明确规定姓名不得使用超出规范汉字范围以外的字样。该条例是针对基层公安机关进行人口户籍登记工作的细则,对公众取名所用汉字的范围只做出了大体规定,并未说明实际具体的规范用字。。
对于姓名规范这一问题,国外有许多先例可以借鉴参考。相关措施大多为制定条例或直接由国家立法实现对公民取名用字的规范。例如邻国日本。日本的《户籍法》于“申报出生第五十条(子女名字使用的文字)规定:子女的名字,应当使用常用平易的文字,常用平易文字的范围,由命令规定;巴西的《民事登记法》规定:户籍人员对户籍申报人申报的古怪名字可以抵制,不作登记;阿根廷《民事及人事登记法》规定不允许公民取古怪的、荒唐可笑的、不道德的或反应政治和意识形态倾向的、或不属于西班牙文字的名字等。在中国,既然对商标的设计、地名的命名以及法人的名称设定已有诸多禁止性的规范,对于自然人的用名也应当有明确的禁止性规定。
除政策法规制定,解决我国公民人名规范化问题,群众意识的改变以及科技创新是必由之路。规范的实质是一项语文改革,任何改革都会遇到阻力。公众观念的改变绝非朝夕之间可以实现,在保证必要的行政手段的前提下,细致的思想工作也是必需的。向群众宣传科学的汉字观,转变对人名用字的认识,使用规范汉字起名字照样可以彰显个性,得到人们喜爱的好名字。在户籍工作过程中,基层公安机关可以向辖区居民定期发放取名规范宣传手册,从最基础层面把思想工作抓起来。
在技术更新方面,建议在互联网上和公安派出所分别建立全国公民姓名查询系统和供取名选字用的规范字字库,面向群众提供免费快捷的服务。居民到辖区派出所进行姓名登记之前可以先查询核实要申报的名字是否符合用字要求,是否属于高重名率的姓名。此类查询服务若能尽快实现,将会为公民和户籍管理工作带来极大的便利。
参考文献
[1]周有光.现代汉语用字的定量问题[j].北京:商务印书馆,2004.
[2]王新华.日本户籍法[m].北京:中国人民公安大学出版社,2003.
[3]王涛.论中国的姓名管理制度[j].理论学刊,2005,(7):67-68.
[4]李娜.人名忌用生僻字[j].语言文字修辞,2006,(5).
上一篇:浅谈汉字与诗歌创作