欢迎访问机床与液压官方网站!

咨询热线:020-32385312 32385313 RSS EMAIL-ALERT
大数据环境下基于Hadoop框架的改进Apriori挖掘算法
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

河南省科技厅2018年度科技攻关项目(182102110277) ;广西壮族自治区教育厅2018年度广西高校中青年教师基础能力提升项目(2018KY0783);广西壮族自治区教育厅2019年度广西高校中青年教师科研基础能力提升项目(2019KY0960)


An improved Apriori mining algorithm based on Hadoop framework in big data environment
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对Hadoop框架下的用户行为大数据挖掘效率问题,提出了一种改进的关联规则Apriori挖掘算法。该算法首先实现了Hadoop框架下的项集分类建模。然后通过传统关联规则Apriori算法的挖掘步骤分析,对候选项目集的生成方式进行了改进,并结合标志位信息实现无用事务去除,有效压缩了事务和项目的数量,从而缩短了任务处理时间。在具体实现过程中对改进Apriori算法流程进行了Map Reduce处理。仿真实验表明:相比于传统Apriori算法,改进后的Apriori挖掘算法具有更高的执行效率。

    Abstract:

    Aiming at the efficiency of user behavior big data mining under Hadoop framework, an improved Apriori mining algorithm for association rules is proposed in this paper. Firstly, the modeling of item sets classification under Hadoop framework is realized. Then through the analysis of the mining steps of the traditional association rule Apriori algorithm, the generation method of the candidate item set is improved, and the useless information is removed with the flag information, which could effectively reduce the number of transactions and projects, thereby shorten the task processing time. In the specific implementation process, Map Reduce processing is performed on the improved Apriori algorithm flow. Simulation experiments show that the improved Apriori mining algorithm has higher execution efficiency than that of the traditional Apriori algorithm.

    参考文献
    相似文献
    引证文献
引用本文

曾毅,周湘贞.大数据环境下基于Hadoop框架的改进Apriori挖掘算法[J].机床与液压,2019,47(6):98-103.
. An improved Apriori mining algorithm based on Hadoop framework in big data environment[J]. Machine Tool & Hydraulics,2019,47(6):98-103

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2019-09-24
  • 出版日期: