自然语言处理人名识别常用词典

1.中文常见姓氏词典

该词典来源于盘古分词中文分词开源软件,盘古分词用该词典识别人名

http://pangusegment.codeplex.com/SourceControl/latest#PanGuSegment/PanGu/Dict/ChsName.cs

//有明显歧异的姓氏

“王”,“张”,“黄”,“周”,“徐”,“胡”,“高”,“林”,“马”,“于”,

“程”,“傅”,“曾”,“叶”,“余”,“夏”,“钟”,“田”,“任”,“方”,

“石”,“熊”,“白”,“毛”,“江”,“史”,“候”,“龙”,“万”,“段”

“雷”,“钱”,“汤”,“易”,“常”,“武”,“赖”,“文”,“查”

//没有明显歧异的姓氏 

“赵”,“肖”,“孙”,“李”,“吴”,“郑”,“冯”,“陈”

“褚”,“卫”,“蒋”,“沈”,“韩”,“杨”,“朱”,“秦”

“尤”,“许”,“何”,“吕”,“施”,“桓”,“孔”,“曹”

“严”,“华”,“金”,“魏”,“陶”,“姜”,“戚”,“谢”

“邹”,“喻”,“柏”,“窦”,“苏”,“潘”,来源:liu_zhlai

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2016年6月23日
下一篇 2016年6月23日

相关推荐