ExcelHome技术论坛

 找回密码
 免费注册
QQ登录 只需一步,快速开始
   
高效办公必会的Office99uu优优 永久免费,网表让Excel秒变数据库 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
Excel不给力? 何不试试FoxTable! 国内首部Excel函数公式学习大典 职场充电黑科技, Office微99uu优优 免费下载Excel行业应用视频
300集Office 2010微99uu优优 Tableau-数据可视化工具 突破Excel限制,用活字格提高效率 12门Excel免费公开课任你学
你的Excel 201099uu优优学习锦囊 欲罢不能, 过目难忘的 Office 新界面 免费的Excel考勤计算系统
查看: 19378|回复: 61
打印 上一主题 下一主题

或是最让人放心的汉字笔画序库

  [复制链接]
TA的精华主题TA的得分主题
跳转到指定楼层
1
发表于 2010-11-16 10:12 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
或是最让人放心的汉字笔画序库
(与之配套的排序工具详见二楼)

    一、主要用途
    列出了GB13000.1中20902个汉字按笔画序排列的顺序,为按“姓氏笔画排序”、“姓名笔画排序”等提供依据。
    二、为什么让人放心
    因为其排列的顺序与国家公布的最新规范一致(除修改了两个明显的排列错误外)。
    三、最新的规范是什么
    先介绍一下三个相关的规范:
    1、《现代汉语通用字笔顺规范》:1997年国家语言文字工作委员会和新闻出版署联合发布,给出了7000个通用字的笔顺。(以下简称《通用字笔顺规范》)
    2、《GB13000.1字符集汉字字序(笔画序)规范》:1999年国家语言文字工作委员会发布,给出了GB13000.1中20902个汉字的笔顺。(以下简称《笔画序规范》)
    3、《GB13000.1字符集汉字部首归部规范》:2009年教育部和国家语言文字工作委员会发布,给出了20902个汉字的部首归部。(以下简称《部首归部规范》)
    单从规范名称上来看,《笔画序规范》应该最新的标准,不过,仔细研读《部首归部规范》,里面有这样两段话。“1 范围 …… 本规范适用于中文信息处理领域汉字排序检索,也可供辞书编撰和汉字教学参考”;“6.3 为方便检索,本规范在附录A(资料性附录)中给出了归部表的笔画序检索表。该表遵照《GB13000.1字符集汉字字序(笔画序)规范》排序……”。
    《笔画序规范》在公布后的十多年内被众多专家、网友检查出很多错误,例如“桒、鵖、鵡”等字,而这些字在《部首归部规范—附录A》中都得到了修正。《部首归部规范—附录A》虽然没有给出汉字的具体笔顺,仅仅列出列出了排列的先后,但这用于“姓氏笔画排序”、“姓名笔画排序”等方面就已经足够了。
    故选择《部首归部规范—附录A》作为验证的规范。
    四、怎样确保与《部首归部规范—附录A》一致(凭什么让人放心)
    经过反复实践,总结了一个效率和正确率都高的方法:就是将已经排列好的笔画序库,按《部首归部规范—附录A》的格式排版好(往左偏一个字),然后打印在《部首归部规范—附录A》上,然后逐个核对。(在最终定稿后还核对了一次,以确保正确性)
    当然,因为个人能力的原因没有逐个校对每个汉字的笔顺,可能个别字的笔顺是错误的,但可以肯定一点,这些错误不会影响排序。
    五、整理过程简介
    整理过程花了两个月的时间,其中走了不少弯路(弯路中也有收获)。
    一开始的想法是DIY一个笔画序库,因为偶然发现QQ拼音(版本号3.3.881.400)中有个小字典中可以将最多25个字粘贴进去,拼音、笔画拆分瞬间就出来了,并且还可以很方便的复制出来。于是利用键盘鼠标录制回放器将7170个汉字(7000个通用汉字和utf-8中6763个汉字的并集)的笔画弄出来,再与以前收集的其它笔顺库包括与Excel的按笔画排序功能进行比对,其中笔顺不一样的字用《笔画序规范》进行验证,最后将其中笔顺相同的241组535个字用《部首归部规范—附录A》确定先后顺序。
    DIY好了后,且准备上网发帖的时候,发生了一个有趣的事,以前在网上不管怎么找都找不到一个比较权威的汉字笔画库,可当我DIY好了后,抱着试一试的心理,又搜了一下,这一次,在百度文库中找了一个TXT格式的《笔画序规范》。这个TXT格式的文件与图片版的虽然有一些差异,但看上去很规范,内容还比《笔画序规范》还要充实。
    于是,我就以这个TXT格式的《笔画序规范》为基础,开始了新一轮的校对(这轮校对过程保留在附件中)。
    六、发现的一些常见问题
    1、Excel按笔画排序的问题(只验证了2003和2007,两个版本排序相同)。Excel可以按笔画进行排序(相同笔画数的不按笔顺排序),但针对GB13000.1字库存在了200个左右的错误,包括了“与之及以巨歺印巫叟彪描歌”等常用字。大家可以把笔画序库以汉字为关键字按笔画排序就可以发现。
    2、1999年的《笔画序规范》中包含了1997年的《通用字笔顺规范》,其中个别字的顺序进行了调整。例如“卫”和“子”这两个字,在《通用字笔顺规范》中,“卫”排在“子”的前面(第4页),而在《笔画序规范》中,“子”排在了“卫”的前面(字序132、134),这两个字在姓名中出现率很高,很多排序工具都没有按新规范。
    3、很多网站提供了笔画查询功能,其中也有很多错误,附件中QQ拼音错的,这些网站大多数都错,就连“字”这个字都错(第二笔)。
    七、扩充至utf-8
    utf-8比GB13000.1多收录了101个汉字,其中10个与GB13000.1中“长相”相同(或类似),69个可以通过“组合”得到,22个可以通过“分解”得到。得到汉字笔顺编码后,有24个字笔顺与GB13000.1中相同,通过与GB13000.1中笔形、结构类似的字来及汉字字序定序规则(见《笔画序规范》)确定其排序。
    附件中列出了这101个字,不过因为没有相关的国家标准或规范来验证,我没有将其收录进去,如果您需要,请先核对一下(1、分解组合的方法,2、笔顺编码汉字的排序),合并后按笔画数、笔顺编码、ID三个关键字升序排序即可。(ID的作用是确定相同编码的字的排序)
    八、部分参考资料的下载地址
    《通用字笔顺规范》:新浪爱问,pdf格式
    http://ishare.iask.sina.com.cn/f/7666709.html
    《笔画序规范》:中国语言文字网,gif格式
    http://www.china-language.gov.cn ... /zfjhzzx/gfbz30.htm
    用“小说下载阅读器”下载这个比较方便,先复制网址,然后返回“小说下载阅读器”,直接点新增(左上角第一个),输入小说名称(不输也行),点确定即可。下载后还可以制成chm等格式文件方便阅读。
    《部首归部规范》含(附录A):教育部,pdf格式
    http://jianfeizx.cn/edoas/websit ... id=1254119792102795
    《笔画序规范》:百度文库,txt格式
    http://wenku.baidu.com/view/896bc68583d049649b66587f.html
    笔画序库主要在这个txt文件的基础上进行了修改,在校对的过程中发现的错误极少,在此向mystlone(百度文库中的发帖者)致敬。

[ 本帖最后由 iaiexcel 于 2010-11-16 10:25 编辑 ]
最让人放心的汉字笔画序库.rar 525.01 KB, 下载次数: 1895
QQ字典的整理结果.rar 548.68 KB, 下载次数: 982
utf-8中补充的101个字.rar 500.69 KB, 下载次数: 846

评分

参与人数 1鲜花 +2 收起 理由
YZC51 + 2 优秀作品
查看全部评分
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏22 分享分享 有用有用1 无用无用
TA的精华主题TA的得分主题
2
 楼主| 发表于 2010-11-16 10:15 | 只看该作者 |楼主

或是最准确、最方便的汉字笔画排序工具

TTX姓氏(姓名)笔画排序小工具

    首先,综合了许多关于介绍排序的文章对排序方法做了一个简洁、明确的总结:
    1、汉字笔画排序的方法以《笔画序规范》中介绍的方法为依据;
    2、汉字的笔画序决定了姓名的笔画序,先比较第一个字,若相同再比较第二个字……;
    3、同名同姓的视具体情况加上注释,再根据要求对注释进行比较;
    4、姓氏笔画排序和姓名笔画排序的唯一区别在对两个字姓名排序时,姓氏笔画排序会在中间插入一个空格,空格的笔画数看成0,排在所有汉字的前面。通俗一点说就是按姓氏笔画排序时,当姓氏(单姓)相同时,两个字的姓名铁定排在三个字姓名的前面。

    “TTX姓氏(姓名)笔画排序小工具”的特点:
    1、使用的汉字笔画序库排列准确,经得起验证(详见一楼)。
    2、考虑问题全面。比如:同名同姓如何排序;少数名族姓名中的“•”如何排序;是否存在有可简化的繁体字或异体字;将常用的一、二、三级汉字放在笔画序库的前面以加快处理速度。
    3、众多人性化设计。比如:将在排序中可能遇到的错误、问题以最方便校对的形式列出来;排序结束后还可以按多种格式输出排序结果;在帮助中列出了可能遇到的问题同时列出了建议的操作方法。


    这是一个免费使用的小工具,您可以任意复制、传播或修改(VBA工程密码是1011)。作者对基数数据准确性、程序功能的正确性、考虑问题的全面性和人性化设计等方面都很有信心。
    这是一个从最大程度上确保排序的操作者不承担责任的小工具。因为汉字的笔画序是根据国家权威部门公布的规范,其它影响排序的环节都可以进行确认(要多请示领导哦),但必须说明两点:
    1、基础数据的正确性是相对于目前国家公布的最新规范而言的,新规范公布可能会影响到个别字的排序,例如“卫”和“子”这两个字在97年和99年公布的两个版本的规范中排序是不同的(详见一楼)。国家公布的规范通常都是图片版的,将其准确的“数字化”要花很长时间,作者不能保证及时更新,但会尽可能的加快速度。(若更新,还在这里)
    2、作者从未从事过姓名排序的工作,程序中所涉及的要求、注意事项等都是作者根据从网上介绍排序要求的文章或从网上公布的会议名单中自己“琢磨”出来的,如果与您现在用的笔画排序方法有所不同或还有没有考虑到的事项,请您与作者联系,我会根据您的要求,尽快且免费为您定制。

    关于TTX:创作期间恰逢儿子的生日,用他在幼儿园学英语时为自己起的英文名字的缩写TTX作程序的名字,以示庆贺。

[ 本帖最后由 iaiexcel 于 2010-11-16 10:22 编辑 ]
TTX姓氏(姓名)笔画排序小工具.rar 623.23 KB, 下载次数: 881

评分

参与人数 1财富 +50 技术 +3 收起 理由
Kevin + 50 + 3
查看全部评分
TA的精华主题TA的得分主题
3
发表于 2010-11-16 10:33 | 只看该作者
TA的精华主题TA的得分主题
4
发表于 2010-11-17 08:08 | 只看该作者
TA的精华主题TA的得分主题
5
发表于 2010-11-17 22:08 | 只看该作者
TA的精华主题TA的得分主题
6
发表于 2010-11-21 12:11 | 只看该作者
TA的精华主题TA的得分主题
7
发表于 2010-11-28 08:54 | 只看该作者
TA的精华主题TA的得分主题
8
发表于 2010-11-30 17:01 | 只看该作者
TA的精华主题TA的得分主题
9
发表于 2010-12-6 11:11 | 只看该作者

太感谢了,太好用了

一直在网上找了几年,什么姓名笔划排序助手、EXCEL的笔画排序等等全试过,都不能适应我们的实际。
终于无意中找到了TTX这个完美的姓名姓氏排序工具,无比激动中。
经检验和党的十七大公布的中央委员名单,只有一个马馼,就是不少媒体说马+文的那个字。
自动排序是在马凯之后。公布的是在马凯之前。程序中有说明,应是人工算简体的笔画数排在马凯前的。

全国人大公布的和TTX排序完全一致。

感谢楼主的FREE精神,强烈建议各级党委、人大、政协下载使用并推广。
谢谢。并祝TTX活波可爱。
TA的精华主题TA的得分主题
10
发表于 2010-12-6 12:14 | 只看该作者
您需要登录后才可以回帖 登录 | 免费注册
本版积分规则
关闭

最新热点上一条 /1 下一条

关注官方微信,每天坐享新鲜教程
手机版|关于我们|联系我们|ExcelHome    GMT+8, 2017-12-12 01:18 , Processed in 1.126579 second(s), 24 queries , Gzip On.
Powered by Discuz! X3.3 © 2001-2017 Wooffice Inc.
    沪公网安备 31011702000001号 沪ICP备11019229号 本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:徐怀玉律师 李志群律师
快速回复 返回顶部 返回列表
99uu优优