201671010433 | 词频统计软件项目报告

1.需求分析

使用JAVA编程语言,独立完成一个英文文本词频统计的软件开发。软件基本功能要求如下:
1.程序可读入任意英文文本文件,该文件中英文词数大于等于1个。
2.程序需要很壮健,能读取容纳英文原版《哈利波特》10万词以上的文章。
3.指定单词词频统计功能:用户可输入从该文本中想要查找词频的一个或任意多个英文单词,运行程序的统计功能可显示对应单词在文本中出现的次数和柱状图。
4.高频词统计功能:用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。
5.统计该文本所有单词数量及词频数,并能将单词及词频数按字典顺序输出到文件words.txt。

2. 功能设计

基本功能:利用java的io流实现对文本文件的读取、Map和HashMap集合对文件进行存储,进行词频统计后输出单词的使用次数。

3. 流程图

程序设计流程图如下:

1614508-20190315235409107-877214920.png
201671010433 | 词频统计软件项目报告

6. 总结

本次设计主要分为字符流读取模块、字符存储模块、字频统计模块、字符输出模块,各个模块通过主函数来调用,实现了模块化设计。

7. PSP展示

任务内容 计划共完成需要的时间(min) 实际完成需要的时间(min)
计划 10 5
估计这个任务需要的时间,并规划大致工作步骤 5 3
开发 100 120
需求分析(包括学习新技术) 7 9
生成设计文档 15 20
设计复审 5 7
代码规范(为目前的开发制定合适的规范) 5 5
具体设计 6 8
具体编码 60 80
代码复审 10 25
测试(自我测试、修改代码、提交修改) 10 8
报告 20 25
测试报告 10 10
事后总结,并提出过程改进计划 25 20

从PSP表中可以发现项目在实施工程中的时间比预计时间要长,可能和自己对开发流程不熟悉、算法设计不精有关。在以后的 开发中要多加改进。
源代码地址;https://github.com/CoderLixin/GitTest

转载于:https://www.cnblogs.com/coder200/p/10540115.html

相关资源:下拉通刷词软件v3.1.zip-其它代码类资源-CSDN文库

来源:weixin_30809173

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2019年2月13日
下一篇 2019年2月13日

相关推荐