一种X^2统计-遗传算法的特征提取技术研究
2012
特征提取技术是决定分类结果优良的主要因素,传统特征提取方法存在许多不足,诸如,当类别和特征分布高度不平衡时,不能有效地处理低频词;对于单个特征的处理不当,导致局部最优解的产生。针对特征提取技术中的问题,提出基于X^2统计-遗传算法的特征提取算法,此方法将词条X^2统计值引入到特征向量中,将此类向量作为遗传算法的初始种群进行启发式搜索,与此同时,针对特征提取的性质,提出新的适应度函数和交叉规则。实验表明,基于X^2统计-遗传算法的特征提取算法能选择出准确表征文本类别的特征项,将其运用到文本分类系统中能有效地提高文本分类的准确率。
- Correction
- Source
- Cite
- Save
- Machine Reading By IdeaReader
0
References
0
Citations
NaN
KQI