(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210376823.9
(22)申请日 2022.04.12
(65)同一申请的已公布的文献号
申请公布号 CN 114462383 A
(43)申请公布日 2022.05.10
(73)专利权人 江西少科智能建造科技有限公司
地址 330000 江西省南昌市新建区望城新
区玉壶山大道414 号1栋A座8层801
(72)发明人 彭飞 李一华 周自强 王潇
刘玉
(74)专利代理 机构 南昌旭瑞知识产权代理事务
所(普通合伙) 36150
专利代理师 彭琰
(51)Int.Cl.
G06F 40/205(2020.01)G06F 40/258(2020.01)
G06F 40/289(2020.01)
G06F 30/13(2020.01)
(56)对比文件
CN 110442744 A,2019.1 1.12
CN 113486148 A,2021.10.08
审查员 田凌桐
(54)发明名称
建筑图纸设计说明书获取方法、 系统、 存储
介质及设备
(57)摘要
本发明公开了一种建筑图纸设计说明书获
取方法、 系统、 存储介质及设备, 所述方法包括:
获取DWG格式文件, 并对所述DW G格式文件进行解
析以得到 所述DWG格式文件中设计说明书的文本
信息; 按预设规则对所述文本信息中的每一行中
的文字进行分词以及对分词后的文字进行词性
标注; 对所述文本信息中的词性标注进行分析以
获取所述设计 说明书中的标题与正文; 根据所述
标题中的编号信息将与所述标题对应的所述正
文与所述标题匹配存储。 本发明解决了现有技术
中在进行CAD图纸中的设计说明书提取时效率低
的问题。
权利要求书2页 说明书8页 附图3页
CN 114462383 B
2022.07.08
CN 114462383 B
1.一种建筑图纸设计说明书获取 方法, 其特 征在于, 所述方法包括:
获取DWG格式文件, 并对所述DWG格式文件进行解析以得到所述DWG格式文件中设计说
明书的文本信息;
按预设规则对所述文本信息中的每一行中的文字进行分词以及对分词后的文字进行
词性标注;
对所述文本信息中的词性标注进行分析以获取 所述设计说明书中的标题与正文;
根据所述标题中的编号信息将与所述标题对应的所述 正文与所述标题匹配存 储;
所述根据所述标题中的编号信息将与所述标题对应的所述正文与所述标题匹配存储
的步骤包括:
根据预设的标题正则表达 式确定所述标题的标题编 号列表, 并将所述标题编号列表中
的首个编号作为前缀的所述标题的标题数量作为所述设计说明书的数量;
获取将所述标题编 号列表中的首个编 号作为前缀的所述标题的上一行的文字信 息, 按
预设规则对所述文字信息进行判断以确定所述设计说明书的篇名;
根据所述篇名、 所述标题编号列表中的标题编号、 所述标题以及所述标题对应的文字
信息将每 个所述设计说明书 进行存储。
2.根据权利要求1所述的建筑图纸设计说明书获取方法, 其特征在于, 所述获取DWG格
式文件, 并对 所述DWG格式文件进 行解析以得到所述DWG格式文件中设计 说明书的文本信息
的步骤包括:
对所述DWG格式文件进行解析以获取文本块以及与所述文本块对应的坐标;
根据所述坐标确定所述文本块的排列顺序, 并通过所述排列顺序对所述文本块依次进
行读取以获取 所述DWG格式文件中设计说明书的文本信息 。
3.根据权利要求1所述的建筑图纸设计说明书获取方法, 其特征在于, 所述获取将所述
标题编号列 表中的首个编号作为前缀的所述标题的上一行的文字信息, 按 预设规则对所述
文字信息进行判断以确定所述设计说明书的篇名的步骤 包括:
判断所述文字信息中是否含有编号;
若否, 判断所述文字信息中的文字 长度是否在预设范围;
若是, 判断所述文字信息中是否包 含预设关键词;
若是, 判断所述文字信息中是否含有中文;
若否, 则确定所述文字信息中的文字为所述设计说明书的篇名。
4.根据权利要求1所述的建筑图纸设计说明书获取方法, 其特征在于, 获取将所述标题
编号列表中的首个编号作为前缀的所述标题的上一行的文字信息, 按 预设规则对所述文字
信息进行判断以确定所述设计说明书的篇名的步骤 包括:
判断所述文字信息中是否含有编号;
若是, 判断所述设计说明书的数量是否大于1;
若是, 则将所述标题编 号列表中的首个编号作为前缀的所述标题确定为所述设计说明
书的篇名。
5.根据权利要求1所述的建筑图纸设计说明书获取方法, 其特征在于, 所述根据 预设的
标题正则表达式确定所述标题的标题编号列 表, 并将所述标题编号列表中的首个编号作为
前缀的所述标题的标题数量作为所述设计说明书的数量的步骤 包括:权 利 要 求 书 1/2 页
2
CN 114462383 B
2在预设映射表中查找与所述标题正则表达式对应的标题编号列表。
6.根据权利要求1所述的建筑图纸设计说明书获取方法, 其特征在于, 所述根据 所述篇
名、 所述标题编号列表中的标题编号、 所述标题以及所述标题对应的文字信息将每个所述
设计说明书 进行存储的步骤 包括:
获取相邻 两个所述篇名之间的标题信 息, 根据所述标题信 息以及所述标题编号列表中
标题编号 顺序对所述设计说明书的每级标题进行获取;
根据所述篇名、 所述标题编号列表中的标题编号、 所述每级标题以及所述每级标题对
应的文字信息将每 个所述设计说明书 进行存储。
7.一种建筑图纸设计说明书获取系统, 其特 征在于, 所述系统包括:
获取模块, 用于获取DWG格式文件, 并对所述DWG格式文件进行解析以得到所述DWG格式
文件中设计说明书的文本信息;
标注模块, 用于按预设规则对所述文本信 息中的每一行中的文字进行分词以及对分词
后的文字进行词性标注;
分析模块, 用于对所述文本信 息中的词性标注进行分析以获取所述设计说明书中的标
题与正文;
存储模块, 用于根据 所述标题中的编 号信息将与所述标题对应的所述正文与 所述标题
匹配存储;
所述存储模块包括:
标题确定单元, 用于根据预设的标题正则表达式确定所述标题的标题编号列表, 并将
所述标题编号列表中的首个编号作为前缀的所述标题的标题数量作为所述设计说明书的
数量;
获取单元, 用于获取将所述标题编号列表中的首个编 号作为前缀的所述标题的上一行
的文字信息, 按预设规则对所述文字信息进行判断以确定所述设计说明书的篇名;
存储单元, 用于根据 所述篇名、 所述标题编号列表中的标题编号、 所述标题以及所述标
题对应的文字信息将每 个所述设计说明书 进行存储。
8.一种可读存储介质, 其上存储有计算机程序, 其特征在于, 所述程序被处理器执行时
实现如权利要求1至 6中任意一项所述的方法的步骤。
9.一种电子设备, 其特征在于, 包括存储器、 处理器以及存储在存储器上并可在处理器
上运行的计算机程序, 所述处理器执行所述程序时实现如权利要求 1至6任一所述的方法的
步骤。权 利 要 求 书 2/2 页
3
CN 114462383 B
3
专利 建筑图纸设计说明书获取方法、系统、存储介质及设备
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 01:31:13上传分享