基于 BERT 预训练模型的灾害推文分类方法

图学学报, 2022

引用方式: 林佳瑞*, 程志刚, 韩宇, 尹云鹏. (2022). 基于 BERT 预训练模型的灾害推文分类方法. 图学学报, 43(3), 530-536. doi: 10.11996/JG.j.2095-302X.2022030530 http://www.txxb.com.cn/CN/10.11996/JG.j.2095-302X.2022030530 cited by count

摘要

社交媒体已成为当前发布和传播突发灾害信息的重要媒介,有效识别并利用其中的真实信息对灾害应急管理具有重要意义。针对传统文本分类模型的不足,提出一种基于 BERT 预训练模型的灾害推文分类方法。经数据清洗、预处理及算法对比分析,在 BERT 预训练模型基础上,研究构建了基于长短期记忆-卷积神经网络(LSTM-CNN)的文本分类模型。在 Kaggle 竞赛平台的推文数据集上的实验表明,相比传统的朴素贝叶斯分类模型和常见的微调模型,该分类模型性能表现优异,识别率可达 85%,可以更好地应对小样本分类问题。有关工作对精准识别真实灾害信息、提高灾害应急响应与沟通效率具有重要意义。

论文下载链接

预印本下载链接

基金资助:国家自然科学基金项目(72091512,51908323)

The authors are grateful for the financial support received from the National Natural Science Foundation of China (No. 72091512, No. 51908323).

相关项目资助情况:

发表评论