您好,欢迎来到叨叨游戏网。
搜索
您的当前位置:首页Hadoop平台数据挖掘技术研究

Hadoop平台数据挖掘技术研究

来源:叨叨游戏网
皇 皇 里 !垦_R 皇 里堑 竺 t Hadoop平台数据挖掘技术研究 ◆黄铭陈明 摘要:随着信息时代的不断发展,互联网产生的数据以爆炸性的态势不断增长。传统的 单片机计算机体系结构在如此大量的数据面前显得力不从心,云计算为大型数据的处理提供 了新的解决方案。Hadoop.@Apache基金会的开源项目之一, ̄Ma.preduce、HDFS、HBase、 pig等于项目于一身,展示出了卓越的计算、处理与调度能力。 关键词:Hadoop ̄-台;数据挖掘;云计算 一、基 ̄Hadoop的云计算平台 1.Hadoop云计算平台。Hadoop是apache提供的一个 便于编写和运行处理大数据的软件平台,HDFs是Hadoop Distributed File System的缩写, ̄PHapoop分布式文件系统, 所谓的分布式计算存储的技术支持。云计算的发展以商业为 主导,它的核心与其说是计算不如说它是一种服务,这种服 务大规模、虚拟化、通用性的特点使其在基础设施即服务、 平台即服务、软件即服务上大量应用。 2.云计算。云是一个强大的组合,将计算、网络、存 储、管理解决方案以业务应用全部包括其中,完善了新一代 的IT和消费服务,且不影响安全性和功能,Hadoop的多个组 成子项目HDFS分布式文件系统、MapReduce分布式编程框 架、HBbse分布式数据库等等,这些子项目以HDFS为基础, 解决问题又相辅相成。 二、Hadoop ̄台数据挖掘技术的实现 Hadoop平台采用并行计算的方法、分布式存储结构来 组成数据计算系统,并且利用成本低廉的PC机组成一个容量 大的集群,在此基础上组成一个能够储存、处理大量数据的 分布式的计算系统,从而实现大量数据的高效挖掘,最终实 现计算机的云计算。另外,Hadoop平台采用开放式的源代 码,以方便系统的再次开发,从而能够根据更多人的需求, 更新程序,满足更多人的特定需求。 针对Hadoop平台数据挖掘技术的实现,我们可以具体的 进行以下的设计: 首先,选一个合适的编程模型,具体来讲,可以采用 MapReduce的编程模型,这是一种相对简单的编程模型,在 海量数据的计算处理方面有很大的应用。同ttgMapReduce具 有很大的优点,比如:编程简单、易于扩展、容错性比较好 等。MapReduce能够将?昆乱庞大的的数据系统划分为两个阶 段,即:Map和Reduce阶段,而且在处理过程中只需要移动 计算的方式即可,利用拥有众多优点的MapReduce编程模型 作为设计Hadoop平台的载体,是非常有前途的选择。 其次,根据市场需求来设计所需要的前台模块。如今市 场上无论各行各业竞争相对都比较激烈,尤其是在如今计算 机技术的飞速发展,各大高校计算机人才的扩招,国家提倡 高新技术产业发展的大背景下,计算机行业的竞争也是越来 越激烈,而想要在日益激烈的市场竞争中争得~席之地,必 须把握市场规律,掌握市场技巧,要是铲平有销路,则必须 以客户需求为导向,从客户需求出发,设计出满足客户需求 的产品。因此在设计平台的时候必须先进行用户需求分析, 在真正了解了客户需求的基础上,再进行相关软件的开发。 最后,进行Hadoop平台具体的设计。就总体而言,在设 计基于Hadoop平台的数据挖掘系统的时候可以采用自上而 下分层的思维模式,利用上层的系统来调用下层的系统。并 且依前段所言,要根据用户的具体需求来分层设计,且设计 的各层之间的相互的,通过调用来实现数据问的传输与 通信,之所以采用这种模式是因为这种模式具有很好的扩展 性。 在设计基于Hadoop平台的数据挖掘系统时,主要包 括:交互层、业务应用层、数据挖掘层三个部分,具体来 讲:交互层主要的职责是完成用户与系统之间信息的传递, 可以称为其交流的窗口,交互层能够提供清晰形象的图像, 利用直观的图像信息将内容呈献给用户。业务应用层主要进 行调度、处理、控制用户层的业务,通过调用数据挖掘算法 层来进行用户层业务的处理。数据挖掘层作为整个系统的核 心,利用并行的方式完成其任务,最后把最终结果返回到业 务应用层中。 三、总结 本文站在如今互联网迅速发展,社会各界数据量越来越 庞大的现实情况下,通过分析Hadoop平台的基本情况以及 云计算的应用与特点,设计一个基于Hadoop平台的数据挖 掘系统来完成企业云计算的实行,最终为处理庞大冗杂的数 据提供一个切实可行的宏观方案。 参考文献 I11李伟卫.基@Hadoop平台的数据挖掘技术研究ID]西北农林科技 大学,2013. [2]宋伟.基于H adOOP平台的数据挖掘技术研究【J].电子制 作.2014,12:76—77. (作者单位:四川工商职业技术学院信息工程系) 信息系统1 程1 2015.1 20 103 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- gamedaodao.net 版权所有 湘ICP备2024080961号-6

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务