初探——数说《红楼》

在我们分析之前我们要做一些准备工作:

1. 装有Python、Excel的计算机一台

2. 获取《红楼梦》电子版全文

3. 阅读《红楼梦》全文(至少要知道里面有哪些人物吧)

首先,给自己的电脑装上Python编程软件,安装wordcloud、jieba等库文。

1. 贾宝玉是宁国府的还是荣国府的/p>

2. 贾赦、贾琏、贾蓉、贾珍的辈分关系是怎么样的/p>

3. 在《红楼梦》后面,远嫁他乡的是元春、迎春、探春、惜春中的谁/p>

如果你能立马回答得出来,那么恭喜您,准备工作第3步可跳过。

如果你隐隐约约有些印象,但又记得不确切,那也没关系,我们先一起来看一下下面这张红楼主要人物关系简表,稍微梳理梳理。

在分析词云之前我们先大概的介绍下词云制作过程。

利用前面我们装好相应库文件的Python编程软件进行操作,可以细分为四个步骤:

1. 在程序中写入《红楼梦》电子书文件地址及名称

2. 在程序中写入“中文停用词表”文件地址及名称

3. 在程序中写入底板样式图片的文件地址及名称

4. 生成《红楼梦》全文词云

整个过程执行下来,最后生成的词云的结果如下图所示:

使用Python对《红楼梦》电子版全文进行词频统计,将统计结果转入Excel归类分析,可以发现,在《红楼梦》中出现的高频词语,大致的可以分为三类——角色名称、人物称谓以及故事场景。

我们现在来看在书中出现频次较多的人物,如下图所示:

最后我们来看下《红楼梦》中故事发生场景的出现频次,统计出来如下图所示:

—END—

◆ ◆ ◆  ◆ ◆

猜你喜欢

● 笑死人不偿命的知乎沙雕问题排行榜

● 用Python扒出B站那些“惊为天人”的阿婆主!

● 全球股市跳水大战,谁最坑爹!

● 上万条数据撕开微博热搜的真相!

● 你相信逛B站也能学编程吗

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年3月12日
下一篇 2020年3月12日

相关推荐