全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111641822.4 (22)申请日 2021.12.2 9 (71)申请人 北京邮电大 学 地址 100876 北京市海淀区西土城路10号 (72)发明人 王晓湘 林雪松 陈劲伊 刘至成  彭亮 韩万江 魏鹏 王玉龙  (74)专利代理 机构 北京风雅颂专利代理有限公 司 11403 专利代理师 孙晓凤 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/289(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 自媒体用户选择方法及相关 设备 (57)摘要 本申请提供一种自媒体用户选择方法及相 关装置, 该方法包括: 周 期性获取多个预选用户 的初始数据, 得到每个预选用户的关系特征、 影 响力特征、 粉丝特征、 情感特征和传播度特征; 利 用关系特征, 对全部预选用户执行聚类算法进行 聚类, 在每个类别的预选用户中确定多个候选用 户; 采取极端梯度提升算法对该候选用户的影 响 力特征进行加权, 得到影响力得分; 利用粉丝特 征计算粉丝重要度得分; 利用自回归语言模型、 循环卷积神经网络和注意力机制构建情感分析 模型, 得到情感得分; 利用传播度特征、 影 响力得 分、 粉丝重要度得分和情感得分进行区间模糊处 理, 得到目标权重, 并输入预置的多准则决策框 架, 得到该候选用户的综合值, 并根据综合值确 定目标用户。 权利要求书3页 说明书11页 附图4页 CN 114580427 A 2022.06.03 CN 114580427 A 1.一种自媒体用户选择 方法, 包括: 在自媒体平台中周期性获取多个预选用户的初始数据, 通过对所述初始数据进行预处 理, 得到每 个所述预选用户的关系特 征、 影响力特 征、 粉丝特 征、 情感特 征和传播度特 征; 利用所述关系特征, 对全部所述预选用户执行聚类算法进行聚类, 得到划分为不同类 别的所述预选用户, 在每 个所述类别的所述预选用户中, 按照预设比例确定多个候选用户; 对全部所述候选用户中的每一个, 采取极端梯度提升算法对该候选用户的所述影响力 特征进行加权, 得到影响力得分; 利用所述粉丝特征计算粉丝重要度得分; 利用自回归语言 模型、 循环卷积神经网络和注意力机制构建情感分析模型, 对 所述情感特征进 行概率分析, 得到情感得分; 基于全部所述候选用户, 利用所述传播度 特征、 所述影响力得分、 所述粉丝重要度得分 和所述情感得分进行区间模糊处理, 得到目标权重, 将每个所述候选用户的所述 目标权重 输入预置的多准则决策框架, 得到该候选用户的综合 值, 并根据所述综合 值确定目标用户。 2.根据权利要求1所述的方法, 其特征在于, 所述在自媒体平台中周期性获取多个预选 用户的初始数据, 通过对所述初始数据进 行预处理, 得到每个所述预选用户的关系特征、 影 响力特征、 粉丝特 征、 情感特 征和传播度特 征, 包括: 在预设的获取周期内, 获取每 个所述预选用户的初始数据; 提取该预选用户初始数据中的所述关系特征, 所述关系特征包括与 该预选用户互相关 注的其他预选用户之间的关系数据; 提取该预选用户初始数据中的全部所述影响力特征的标签, 所述影响力特征的标签包 括: 明星标签、 平台认证标签、 电商合作标签、 创作类型 标签和优质作品标签中的至少一种; 提取该预选用户初始数据中的粉丝特征, 所述粉丝特征包括: 该预选用户的每个粉丝 的转发次数、 评论次数和点赞次数; 提取该预选用户初始数据中的情感特征, 所述情感特征包括: 该预选用户收到的评论 语句中的句子矩阵; 提取该预选用户初始数据中的传播度特征, 所述传播度特征包括: 该预选用户全部作 品的点赞 数量、 浏览数量、 评论数量、 被分享数量和粉丝数量。 3.根据权利要求1所述的方法, 其特征在于, 所述利用所述关系特征, 对全部所述预选 用户执行聚类算法进行聚类, 得到划分为 不同类别的所述预选用户, 包括: 利用全部所述预选用户的所述关系特征, 对词向量模型进行训练, 得到每个所述预选 用户之间的距离; 利用所述距离, 对全部所述预选用户执行粗聚类算法进行粗聚类, 得到质心个数并确 定相应数目的质心; 利用所述质心, 对全部所述预选用户采取K类均值算法进行聚类, 得到多个包含不同所 述预选用户的团簇, 根据所述团簇调整所述质心; 循环执行K类均值算法进行聚类, 至所述质心保持稳定; 将所述质心稳定的所述团簇作为所述类别, 并将每个稳定的所述团簇中的所述预选用 户划分为 一类。 4.根据权利要求1所述的方法, 其特征在于, 所述采取极端梯度提升算法该候选用户的 所述影响力特 征进行加权, 得到影响力得分, 包括:权 利 要 求 书 1/3 页 2 CN 114580427 A 2对于每个所述候选用户, 确定在该候选用户的所述影响力特 征中所具备的所述标签; 基于该候选用户具备的所述标签, 采取极端梯度提升算法对该候选用户是否能够合法 持有其余缺失的所述标签进行 预测, 得到预测结果; 基于预测结果, 利用该候选用户具备的所述标签和能够合法持有的其他所述标签计算 该用户的影响力得分。 5.根据权利要求1所述的方法, 其特征在于, 所述利用所述粉丝特征计算粉丝重要度得 分, 包括: 对于每个所述候选用户, 利用该候选用户的每个所述粉丝的所述粉丝特征和该候选用 户在获取周期内发布作品数量, 计算该候选用户与该粉丝之间的信息量; 确定该粉丝与其关注的全部所述预选用户之间的信息量总量; 利用关于该粉丝的所述信 息量和所述信 息量总量, 确定该粉丝对于该候选用户的重视 度; 将全部所述候选用户与每个所述粉丝之间的重视度组成转移矩阵, 并为所述转移矩阵 赋予重要性向量, 并基于预设的阻尼系数, 构建 关于所述重要性向量的迭代函数; 响应于所述重要性向量在迭代中收敛至稳定, 将该重要性向量确定为粉丝重要度得 分。 6.根据权利要求1所述的方法, 其特征在于, 所述利用自回归语言模型、 循环卷积神经 网络和注意力机制构建情感分析模型, 对所述情感特征进行概率分析, 得到情感得分, 包 括: 将所述情感特 征输入所述子回归语言模型进行训练, 得到文本动态特 征; 将所述文本动态特征输入所述循环卷积神经网络进行训练, 得到深层的文本语义特 征, 其中, 所述文本语义特 征包括多个词向量; 对所述文本语义特征中的每个所述词向量采取所述注意力 机制进行处理, 得到每个所 述词向量的语义权 重; 对全部的所述语义权 重和所述文本语义特 征进行融合, 得到所述情感得分。 7.根据权利要求1所述的方法, 其特征在于, 所述基于全部所述候选用户, 利用所述传 播度特征、 所述影响力得分、 所述粉丝重要度得分和所述情感得分进 行区间模糊处理, 得到 目标权重, 包括: 在全部所述候选用户中, 将所述传播度 特征、 所述影响力得分、 所述粉丝重要度得分和 所述情感得分均取最大值, 并作为理想方案; 将所述传播度特征、 所述影响力得分、 所述粉丝重要度得分和所述情感得分均取最小 值, 并作为临界方案; 对于每个所述候选用户, 将该候选用户所述传播度 特征、 所述影响力得分、 所述粉丝重 要度得分和所述情感得分的取值作为当前 方案; 对于每个所述候选用户, 利用所述理想方案、 所述临界方案和所述当前方案构建投影 模型; 基于最大熵原理, 融合所述理想方案、 所述临界方案和全部所述候选用户的所述当前 方案, 计算目标权 重。 8.一种自媒体用户选择装置, 包括:权 利 要 求 书 2/3 页 3 CN 114580427 A 3

.PDF文档 专利 自媒体用户选择方法及相关设备

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 自媒体用户选择方法及相关设备 第 1 页 专利 自媒体用户选择方法及相关设备 第 2 页 专利 自媒体用户选择方法及相关设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:45:28上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。