全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111429772.3 (22)申请日 2021.11.29 (71)申请人 号百信息服 务有限公司 地址 200080 上海市虹口区四川北路61号 13-19楼 (72)发明人 李宏图 崔隆 吴仲文 柏京  贾泉臻 卢丹 郭心如 杨晓宇  孙永学 王荣辉  (74)专利代理 机构 上海沪慧律师事务所 3131 1 代理人 朱九皋 (51)Int.Cl. H04M 1/663(2006.01) H04M 3/22(2006.01) G06F 30/27(2020.01) G06V 10/762(2022.01)G06K 9/62(2022.01) (54)发明名称 一种基于信令的非频率特征快速识别骚扰 电话系统和方法 (57)摘要 本发明涉及电信技术及大数据等领域, 特别 是一种基于信令的非频率特征快速识别骚扰电 话系统, 由信令采集单元、 历史信令全量数据库 单元、 信令特征分类建模单元和 信令监控与骚扰 电话拦截单元构成。 信令采集单元用于采集原始 信令, 转换为呼叫详细记录, 然后传输至历史信 令全量数据库单元保存。 信令特征分类 建模单元 利用样本数据, 形成非频率特征骚扰电话判别 库。 信令监控与骚扰电话拦截单元, 实时监控信 令, 结合非频率特征骚扰电话识别库骚扰电话并 拦截或提醒。 本发明还包含方法。 本发明用全特 征训练建模, 在识别阶段, 采集非频率特征判断 识别骚扰电话, 从而避免了识别阶段的二次采 样、 重复计算特征向量的工作, 进而做到实时识 别, 提高识别准确率。 权利要求书2页 说明书12页 附图2页 CN 114025041 A 2022.02.08 CN 114025041 A 1.一种基于信 令的非频率特征快速识别骚扰电话系统, 其特征在于,由信 令采集单元、 历史信令全量数据库单 元、 信令特 征分类建模单 元和信令监控与骚扰电话 拦截单元构成; 所述信令采集单元用于采集通信网络中的原始信令, 并转换为呼叫详细记录, 然后传 输至所述历史信令全量数据库单元作为样本数据保存; 所述信令特征分类建模单元, 利用 所述历史信令全量数据库单元提供的所述样本数据, 形成仅依赖信令原始属性的非频率特 征骚扰电话判别库; 所述信令监控与骚扰电话拦截单元, 实时监控通信网络中信令里 的非 频率特征向量, 结合所述非频率特 征骚扰电话库识别骚扰电话并拦截, 或向客户发出提醒。 2.根据权利要求1所述的基于信 令的非频率特征快速识别骚扰电话系统, 其特征在于, 所述信令采集单元从采集的原始信令中得到一级信息, 包含码号信息、 通话时长信息、 接通 信息和释放信息; 其中, 所述接通信息包含接通率和应答率; 所述释放信息包含主叫挂机和 被叫挂机; 所述信令采集单元利用所述一级信息计算出二级信息, 包含呼叫频率, 呼出呼入 比, 被叫离散度; 所述信令采集单元生成包含所述一级信息和所述二级信息的所述呼叫详 细记录。 3.一种使用如权利要求1所述的基于信令的非频率特征快速识别骚扰电话系统进行基 于信令的非频率特 征快速识别骚扰电话的方法, 其特 征在于, 利用所述信 令采集单元采集日常业务中的原始信 令, 转换为所述呼叫详细记录后作为 所述样本数据, 保存至所述历史信令全量数据库单 元中; 利用所述信 令特征分类建模单元, 基于所述样本数据, 建立特征向量集, 再使用机器学 习形成全特征骚扰电话判别库; 所述全特征骚扰电话判别库中的特征向量, 包含频率特征 和非频率特 征, 还包含所属主叫 号码和号码类别; 在所述全特征骚扰电话判别库中剔除所述频率特征, 形成所述非频率特征骚扰电话判 别库; 利用所述信令监控与骚扰电话拦截单元, 实时监控信令中的非频率特征向量, 与所述 非频率特征骚扰电话判别库中的所述特征向量进 行相似度计算, 根据所述特征向量的所述 号码类别, 识别出骚扰电话; 拦截识别出的所述骚扰电话, 或向客户发出骚扰电话 提醒。 4.根据权利要求3所述的基于信 令的非频率特征快速识别骚扰电话方法, 其特征在于, 在利用所述信令特征分类建模单元, 基于所述样本数据, 建立特征向量集, 再使用机器学习 形成全特 征骚扰电话判别库过程中, 包 含步骤: 从所述样本数据中提取信令特 征, 建立所述特 征向量集; 对所述特 征向量集合进行归一 化, 构建特 征矩阵; 利用所述特 征矩阵, 使用机器学习聚类建模, 生成所述全特 征骚扰电话判别库。 5.根据权利要求4所述的基于信 令的非频率特征快速识别骚扰电话方法, 其特征在于, 所述特征向量集中的所述特征向量, 包含一个或者多个所述信令特征, 包含主叫呼叫频次、 接通率、 通话时长比值、 主叫呼出呼入比、 被叫离散程度、 被叫号码等差 分布占比、 主叫释放 次数、 呼叫间隔固定占比以及外省号码占比。 6.根据权利要求4所述的基于信 令的非频率特征快速识别骚扰电话方法, 其特征在于, 对所述特征向量集合进行归一化时, 针对每个特征变量包含的每个所述信令特征, 如果所 述信令特征 的取值是连续取值的, 采用离散标准化进行线性变换, 使得归一化后的取值大权 利 要 求 书 1/2 页 2 CN 114025041 A 2于等于0小于等于1; 如果所述信令特征的取值是布尔类型或者离散取值的, 采用独热编码 进行变换, 使得归一 化后的取值大于等于 0小于等于1。 7.根据权利要求4所述的基于信 令的非频率特征快速识别骚扰电话方法, 其特征在于, 采用无监督机器学习 算法K‑Means算法对所述特征矩阵聚类建模, 生成所述全特征骚扰电 话判别库; 在所述K ‑Means算法中, 不同所述特 征向量之间的距离计算采用余弦距离 。 8.根据权利要求3所述的基于信 令的非频率特征快速识别骚扰电话方法, 其特征在于, 利用所述信令特征分类建模单元, 在所述全特征骚扰电话判别库中剔除所述频率特征, 形 成所述非频率特 征骚扰电话判别库, 包 含步骤: 在所述全特 征骚扰电话判别库中的所述特 征向量中, 删除所述频率特 征; 以所述号码类别分组, 两两比较不同分组中的所述特征向量之间的余弦距离, 当所述 余弦距离小于分类阈值时, 同时剔除参与比较的两个所述特 征向量; 剩余的所述特 征向量构成所述非特 征向量骚扰电话判别库。 9.根据权利要求3所述的基于信 令的非频率特征快速识别骚扰电话方法, 其特征在于, 所述频率特征包含呼叫频次、 接通率、 呼出呼入比、 被叫号码回拨率和被叫离散度; 所述非 频率特征包含振铃时长、 通 话时长、 链路释放原因、 是否被叫先挂断和主被叫是否 外省。 10.根据权利要求3所述的基于信令的非频率特征快速识别骚扰电话方法, 其特征在 于, 利用所述信令监控与骚扰电话 拦截单元, 进行相似度计算时, 包 含步骤: 所述信令监控与骚扰电话拦截单元, 实时监控信令中的非频率特征向量, 归一化后生 成待检测特征向量; 计算所述待检测特征向量与所述 非频率特征骚扰电话判别库中的每一 个所述特 征向量的余弦距离; 当所述 余弦距离小于骚扰判断阈值时, 判定为骚扰电话。权 利 要 求 书 2/2 页 3 CN 114025041 A 3

.PDF文档 专利 一种基于信令的非频率特征快速识别骚扰电话系统和方法

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于信令的非频率特征快速识别骚扰电话系统和方法 第 1 页 专利 一种基于信令的非频率特征快速识别骚扰电话系统和方法 第 2 页 专利 一种基于信令的非频率特征快速识别骚扰电话系统和方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 22:25:22上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。