(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210928186.1
(22)申请日 2022.08.03
(71)申请人 北京印刷学院
地址 102600 北京市大兴区兴华大街 二段1
号
(72)发明人 刘玉琴 任慧超 门川琨 汪雪锋
(74)专利代理 机构 北京智行 阳光知识产权代理
事务所(普通 合伙) 11738
专利代理师 刘颖
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/35(2019.01)
G06F 17/10(2006.01)
G06F 17/16(2006.01)
G06F 40/289(2020.01)
(54)发明名称
一种基于技术主题图进行技术竞争力测度
的方法
(57)摘要
本发明公开了一种基于技术主题图进行技
术竞争力测度的方法, 基于技术主题图, 构建技
术竞争力测度模 型, 用具体数字对企业或研发机
构之间的技术竞争力进行度量, 使决策者在观测
技术主题图的同时不仅有视觉上的直观感知, 也
有更加直接的、 更加精细化的数值 参考。
权利要求书3页 说明书7页 附图1页
CN 115186107 A
2022.10.14
CN 115186107 A
1.一种基于技 术主题图进行技 术竞争力测度的方法, 其特 征在于, 具体过程 为:
S1、 对科技文本数据集进行分词处理, 计算各个科技文本与主题词之间的隶属关系矩
阵;
S2、 基于各个科技文本与主题词之间的隶属关系矩阵, 计算所有主题词之间的关系强
度矩阵;
S3、 根据步骤S2得到的关系强度矩阵, 按照各个主题词之间的关系强度, 应用聚类算法
对所有主题词进行聚类, 根据聚类结果为每个主题词加上类别标签; 记 聚类后的类别数为
C, 即主题词分为C组; 之后, 通过不同的布局算法将主题词映射到空间平面中的点;
S4、 构建平面像素点类密度函数进行 可视化:
S4.1、 假设n个主题词的坐标分别为(xi, yi),i=1…n, 主题词之间的二维欧氏距离平均
值为
Numberi, i=1…n, 表示出现了主题词i的科技文本数量; 经过聚类后共有C个类
别, 每个类别下分别有nc个主题词; f(Numberi)为主题词i的标准化值; 像素点P的坐标(x,
y); 其中, 密度函数α, β 为非负数;
定义像素点的密度函数和类密度函数为:
密度函数:
类密度函数:
c表示聚类后的某一具体 类别;
S4.2、 融合聚类信息后, 用Densitymax表示最大的密度值, Colori表示类别i=1 …C的RGB
模式颜色; 像素点P(x,y)的RGB模式颜色计算如下:
其中, Colori是RGB模式颜色的各通道取值;
S4.3、 为了实现类似地形图等高线的可视化效果, 同时等高线既能对同一类别下的主
题词进行区分, 又能对不同类别下的主题词进行区分, 构建 色彩强度函数:
f(Density(x,y)/Density(max) );
S5、 构建企业或研发机构i在技 术主题j下的竞争力测度模型:
w为参与竞争力测度的企业或研发机构的数量; s为技术领域涵盖的技术主题数量; ni,j
为企业或研发机构i在技术主题j的文献数量, Position(xk)为科技文本k的技术地位,
Ability(xk)为科技文 本k的质量; Position(xk)取值为步骤S4.4中计算 所得的色彩强度; 因
此, 企业或研发机构i在技 术主题j下的竞争力测度模型如下:
Corprati oni表示企业或研发机构i, Tec hnologyj表示技术主题j;权 利 要 求 书 1/3 页
2
CN 115186107 A
2S6、 形成如下 形式的机构、 技 术主题之间的竞争力矩阵。
2.根据权利要求1所述的方法, 其特 征在于, 步骤S1中, 所述隶属关系矩阵表示如下:
其中, m表示科技文本数量, n表示主题词数量, Documenti表示第i个科技文本, Keywordj
表示第j个主题词, bij表示第i个科技文本第j主题词出现的数量。
3.根据权利要求1所述的方法, 其特 征在于, 步骤S2中, 所述关系强度矩阵表示如下:
其中, n表示主题词数量, Keywordi、 Keywordj表示第i、 j个主题词, rij表示第i个主题词
与第j主题词的共同出现的科技文本数量。
4.根据权利要求1所述的方法, 其特 征在于, 步骤S4.3中, 色彩强度函数 具体为:
其中,
为向下取整, N为强度级别数量。
5.根据权利要求 4所述的方法, 其特 征在于, 步骤S5中的竞争力测度模型 可以转化为:
其中Dk(x,y)为科技文本k在技 术主题图中的坐标。
6.根据权利要 求5所述的方法, 其特征在于, Ability(xk)采用科技文本被引用数量与引
用该科技文本的机构数量比进 行表示, 即以科技文本被引用数量和被引用机构覆盖情况评
价单个科技文本的质量, 由此进一 步将竞争力测度模型转 化如下:权 利 要 求 书 2/3 页
3
CN 115186107 A
3
专利 一种基于技术主题图进行技术竞争力测度的方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:38:40上传分享