全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211179262.X (22)申请日 2022.09.27 (71)申请人 杭州安恒信息技 术股份有限公司 地址 310051 浙江省杭州市滨江区西兴街 道联慧街18 8号 (72)发明人 刘凯 吴卓群  (74)专利代理 机构 杭州华进联浙知识产权代理 有限公司 3 3250 专利代理师 范丽霞 (51)Int.Cl. G06F 16/14(2019.01) G06F 16/182(2019.01) G06F 21/60(2013.01) (54)发明名称 一种基于Cassandra数据库的文件存储、 检 索方法及装置 (57)摘要 本申请涉及一种基于Cassandra数据库的文 件存储、 检索方法及装置, 其中, 该一种基于 Cassandra数据库的文件存储方法包括: 创建 Cassandra数据库的数据表; 接收客户端上传的 文件, 根据文件的大小将文件分成若干个数据 块, 并对若干个数据块进行编号; 确定文件在数 据表中的组合主键, 组合主键包括分区键和集群 键, 集群键根据数据块的编号确定, 同一个文件 的分区键相同; 根据组合主键, 将文件存入 Cassandra数据库, 解决了现有技术中不能满足 把大文件分割后的不同部分存储到相同的节点, 导致文件数据的检索效率低的问题, 实现了相同 文件的数据即使被 分割, 也总是存放在相同节点 上, 在客户需要检索数据时, 加快了数据检索的 速度的效果。 权利要求书2页 说明书9页 附图3页 CN 115422130 A 2022.12.02 CN 115422130 A 1.一种基于 Cassandra数据库的文件 存储方法, 其特 征在于, 所述方法包括: 创建所述Cas sandra数据库的数据表; 接收客户端上传的文件, 根据所述文件的大小将所述文件分成若干个数据块, 并对所 述若干个数据块进行编号; 确定所述文件在所述数据表中的组合主键, 所述组合主键包括分区键和集群键, 所述 集群键根据所述数据块的编号确定, 同一个所述文件的分区键相同; 根据所述组合主键, 将所述文件 存入所述Cas sandra数据库。 2.根据权利要求1所述的基于Cassandra数据库的文件存储方法, 其特征在于, 所述根 据所述文件的大小将所述文件分成若干个数据块包括: 判定所述文件大小是否大于设定阈值, 若是, 将所述文件根据所述设定阈值分割成若 干个所述数据块。 3.根据权利要求1所述的基于Cassandra数据库的文件存储方法, 其特征在于, 在所述 根据所述文件的大小将所述文件分成若干个数据块之前还 包括: 判断所述文件是否 需要进行预处理, 若是, 则对所述文件进行预处理, 所述预处理包括 压缩和/或加密。 4.一种基于Cassandra数据库的文件检索方法, 所述文件为根据权利 要求1至权利 要求 3中任一项所述的基于Cassandra数据库的文件存储方法存入所述Cassandra数据库的文 件, 其特征在于, 所述方法包括: 获取客户端文件检索请求, 确定所述文件检索类型, 所述文件检索类型包括文件元数 据和文件内容; 当所述文件检索类型为所述文件元数据 时, 根据所述文件 的分区键在所述Cassandra 数据库进行检索, 并返回检索结果; 当所述文件检索类型为所述文件内容时, 根据所述的分区键在所述Cassandra数据库 中进行检索, 若仅检索到一条所述文件内容时, 则返回所述文件内容; 若检索到多 条所述文 件内容时, 则对多条 所述文件内容进行合并, 并返回合并后的所述文件内容。 5.根据权利要求4所述的基于Cassandra数据库的文件检索方法, 其特征在于, 当所述 文件检索类型为所述文件内容时, 所述方法还 包括: 判断所述文件内容是否经过预处理, 若所述文件内容经过预处理, 则对所述文件内容 进行逆序操作, 所述逆序操作包括 解压缩和/或解密。 6.一种文件 存储的装置, 其特 征在于, 所述装置包括: 创建模块, 用于创建Cas sandra数据库的数据表; 接收模块, 用于接收客户端上传的文件, 根据所述文件的大小将所述文件分成若干个 数据块, 并对所述若干个数据块进行编号; 确定模块, 用于确定所述文件在所述数据表中的组合主键, 所述组合主键包括分区键 和集群键, 所述 集群键根据所述数据块的编号确定, 同一个所述文件的分区键相同; 存储模块, 用于根据所述组合主键, 将所述文件 存入所述Cas sandra数据库。 7.根据权利要求6所述的文件 存储的装置, 其特 征在于, 所述接收模块, 还用于判定所述文件大小是否大于设定阈值, 若是, 将所述文件根据 所 述设定阈值分割成多个所述数据块。权 利 要 求 书 1/2 页 2 CN 115422130 A 28.一种文件检索的装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取客户端文件检索请求, 确定所述文件检索类型, 所述文件检索类型 包括文件元 数据和文件内容; 检索模块, 用于当所述文件检索类型为所述文件元数据时, 根据所述文件的分区键在 Cassandra数据库进行检索, 返回检索结果; 以及用于当所述文件检索类型为所述文件内容时, 根据所述的分区键在所述 Cassandra数据库中进行检索, 若仅检索到一条所述文件内容时, 则返回所述文件内容; 若 检索到多条所述文件内容时, 则对多条所述文件内容进行合并, 并返回合并后的所述文件 内容。 9.一种电子装置, 包括存储器和处理器, 其特征在于, 所述存储器中存储有计算机程 序, 所述处理器被设置为运行所述计算机程序以执行权利要求1至权利要求3中任一项所述 的基于Cassandra数据库的文件存储 方法; 或者, 所述处理器被 设置为运行所述计算机程序 以执行权利要求 4或权利要求5所述的基于 Cassandra数据库的文件检索方法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至权利要求3中任一项 所述的基于Cassandra数据库的文件 存储方法的步骤; 或者, 所述计算机程序被处理器执行时实现权利要求4或权利要求5所述 的基于Cassandra数据库的文件检索方法的步骤。权 利 要 求 书 2/2 页 3 CN 115422130 A 3

.PDF文档 专利 一种基于Cassandra数据库的文件存储、检索方法及装置

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于Cassandra数据库的文件存储、检索方法及装置 第 1 页 专利 一种基于Cassandra数据库的文件存储、检索方法及装置 第 2 页 专利 一种基于Cassandra数据库的文件存储、检索方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 05:35:59上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。