基于Python生成中文测试数据

几点说明:

1. 基于unicode码方式生成的汉字,因为总计约有2万多个汉字,因此在随机生成时,会很容易生成生僻字

2. 基于gbk2312码生成的汉字,大概有6千个常用的汉字,所以生成的汉字,我们大多都认识

所以根据这两点,你大体可以知道在自己去原生构造汉字生成功能时,应该怎么去使用了。

看了上面简单的实例,是不是觉得生成汉字比较容易呢r>

那如何生成中文名字呢r>

你要不要自己试试p>

说下简单的思路,随便找个百家姓的 页,把所有的姓爬取下来弄成一个姓氏库,至于名嘛,随便用用常用的汉字组合下

我们看一个简单的实例

运行结果

文章知识点与官方知识档案匹配,可进一步学习相关知识Python入门技能树人工智能机器学习工具包Scikit-learn211223 人正在系统学习中

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2019年3月12日
下一篇 2019年3月12日

相关推荐