统计语言模型的实现(Qt实现)

Feb 25, 2017


TNND,终于赶在开学前把统计语言模型给做完了、

关于统计语言模型是什么,请进入我写的这篇笔记

实现平台: Qt5.7, Qt Quick 2.7, macOS操作系统

整个项目: 传送门

项目打开方式: 使用Qt打开nlpmodel.pro文件之后,点击运行即可

项目使用方法: 内置有说明书,运行成功后点击【说明书】按钮即可

项目说明: 目前还未做成.exe与.app格式的文件,所以只能编译代码打开。

实现流程:

  • 手动写单词库data.json, 可手动按照格式添加词语,数量不限
  • 手动写语料库article.txt, 可手动进行修改,数量不限
  • 构建整个界面
  • 创建输入正确分析函数,分析输入是否正确
  • 创建输入枚举函数,枚举出所有可能的句子
  • 创建在语料库中得到单个字频率的函数
  • 创建在语料库中得到两个字频率的函数
  • 创建在语料库中得到一个句子出现概率的函数
  • 创建根据枚举结果获得所有概率的函数
  • 结束。

代码已经差不多完成,剩下的评测和优化准备全部给队友去写了。我继续把论文给解决掉吧。

诶、明明计划五天写完的,怎么两天就不小心写完了,,难道这个东西实现真的很简单么。

其他: 待解决问题:

  • 枚举函数复杂度 n^n, 草泥马,不会优化。
  • 频率检索函数复杂度 n^2, 可以用KMP优化,未进行。
  • 所有词语和概率未进行排序处理,待进行。
差不多就这些吧。