数学建模社区-数学中国

标题: 一种用于大数据内容安全监测的快速相似匹配并行算法 [打印本页]

作者: 张志红    时间: 2023-6-7 16:12
标题: 一种用于大数据内容安全监测的快速相似匹配并行算法
     为了提高大数据集基于内容的相似匹配速度,本文采用MapReduce框架实现了一种并行的相似匹配算法,解决了大数据信息安全监测中的快速相似匹配问题。算法基于先过滤、再验证的方式设计了三个阶段。在配对阶段,通过对索引子串和匹配子串进行配对去除了不包含共享q-gram的无关对;在过滤阶段,通过q-gram命中特征过滤掉了一定不是真实匹配的候选对;在验证阶段,通过计算候选对的真实匹配度找出了满足要求的真实匹配。实验结果证明,本文提出的字符串分割过滤方法有效地提高了相似匹配的速度。
4 B1 H- ]% B) c# F( O
* }+ W( B" N6 G8 I) _

一种用于大数据内容安全监测的快速相似匹配并行算法_王晓霞 (1).caj

1.3 MB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]  [购买]






欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5