论文

融合主题信息的卷积神经网络文本分类方法研究 

论文题目 融合主题信息的卷积神经网络文本分类方法研究
论文作者 杨锐,陈伟, 何涛, 张敏, 李蕊伶, 岳芳
发表年份 2020
摘要  [目的/意义]针对能源政策语义信息丰富的特点,研究不同环境下卷积神经网络模型对能源政策文本特征分类识别的效果并提出优化方法,辅助能源政策信息资源进行自动分类操作,方便研究人员更好地进行能源政策解读。[方法/过程]在不同环境下利用字符级和词级卷积神经网络模型对能源政策自动文本分类识别效果进行实验,从标题、内容、核心主题句等角度全面对比分析,利用Doc2Vec抽取不同比例核心主题句,将这些主题信息融入卷积神经网络模型中以对实验进行优化。[结果/结论]随着核心主题句抽取率的提高F1均值呈正态分布,当抽取率为70%时达到平衡,神经网络模型评估F1均值为83. 45%,较实验中的其它方法均有所提高,通过Doc2Vec提取主题信息,并将其融入卷积神经网络的方法有效提升了卷积神经网络模型自动文本分类的效果。 
论文明细 杨锐,陈伟, 何涛, 张敏, 李蕊伶, 岳芳.融合主题信息的卷积神经网络文本分类方法研究.现代情报.2020.40(4):.