ARCBERT: 面向土木建筑领域的大规模语料库及领域预训练模型

发表于: April 02, 2022

自2019年以来，课题组专注于如何让计算机高效理解规范、施工组织文档等复杂的领域文本，并从中提取复杂领域知识。为实现大规模领域语料中复杂领域先验知识的高效利用与迁移，课题组构建了首个面向土木建筑领域的大规模领域语料库和领域预训练模型，并在分类、命名实体识别等多个任务中实现性能的大幅提升，F1值相较传统方法最大提升分别可达3.8%和8.1%。有关数据集、预训练模型及算法可在此下载，供大家研究参考。最新算法、数据集及预训练模型更新可在github主页跟踪关注。同时欢迎关注课题组微信公众号（智能土木ABC，点击左侧链接查看二维码）了解更多有趣的研究。

当您使用或参考以上成果时，请引用以下关键研究论文：

Zheng, Z., Lu, X.Z., Chen, K.Y., Zhou, Y.C., Lin, J.R. (2022). Pretrained Domain-Specific Language Model for Natural Language Processing Tasks in the AEC Domain. Computers in Industry, 142, 103733.

Twitter Facebook Google+ LinkedIn

发表评论

ART（AutoRuleTransform）: 面向中文建筑规范智能解译的数据集及关键算法

发表于: March 03, 2022

面向中文建筑领域规范标准数字化拆解与规则抽取，课题组构建并开放了首个领域规范智能解译数据集及核心算法，并将其命名为AutoRuleTransform，简称ART。有关成果覆盖简单规范条文、多约束复杂条文、高阶规则及隐含信息等不同条文数据及其高效解译算法

林佳瑞

ARCBERT: 面向土木建筑领域的大规模语料库及领域预训练模型

分享

发表评论

你可能喜欢

面向计算流体力学仿真（CFD）数据可视化的AR工具及代码

面向室内火荷载识别的图片数据集

SODA: 面向建筑领域深度学习的施工现场图像数据集

ART（AutoRuleTransform）: 面向中文建筑规范智能解译的数据集及关键算法