fpbl.net
当前位置:首页 >> 数据挖掘软件DisCo >>

数据挖掘软件DisCo

这个接口是用作数据类型转换的.具体就是把连续型取值(numeric type)转化为离散型取值(nominal type).比如这样一个字段,字段名为age, 属性取值范围是0~100,用numerictonominal转换的结果就是把所有的年龄取值归纳为几个非连续的离散区间,用这些区间名称代替原始的取值,例如:pre-school (0~6)teenager (13~19)具体应用要视算法的需求和样本空间的分布情况而定.希望对你有帮助^^

EXCEL MATLAB Origin 等等 当前流行的图形可视化和数据分析软件有Matlab,Mathmatica和Maple等.这些软件功能强大,可满足科技工作中的许多需要,但使用这些软件需要一定的计算机编程知识和矩阵知识,并熟悉其中大量的函数和命令.而使用Origin就像使用Excel和Word那样简单,只需点击鼠标,选择菜单命令就可以完成大部分工作,获得满意的结果. 但它又比excel要强大些.一般日常的话可以用Excel,然后加载宏,里面有一些分析工具,不过有时需要数据库软件支持

SAS,SPSS,SPSS CLEMENTINE,WEKA(开源软件)等等.

成千万上亿的原始数据进行处理时用SAS的效率显著高于等其他语言(如果你手头没有SAS,又喜欢写代码,用SQL都是个不错的选择)在原始数据加工分析挖掘等方面选择就比较多了

1、 Weka WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化.2、 Rapid Miner RapidMiner是世界领先的数据挖

SAS enteprise minerIBM intelligent minerSPSS Clementine..很多工具可以用,但是这些根据都是非常贵的.

数据挖掘工具的话要学习excel,sql,r语言,mysql等等,数据挖掘的软件的话可以学习下tableau以及finebi,作为大数据前端分析挖掘工具,两个软件都是很容易上手的.

数据库:oracle ,hbase ,Mysql, Kylin(国产数据库,功能强大)等数据挖掘工具:spss modeler(数据量限制,可试用14天) ,SmartMining(可计算PB级数据,桌面版可试用60天)代码工具:SAS、R(开源)、Python(开源)等数据挖掘书籍:《机器学习》《深入浅出数据分析》《数据挖掘导论》《数据挖掘概念与技术》等

楼主可以用emule软件进行搜索,可以找到很多关于SPSS的资源,包括安装程序、使用说明、工具书等,我就是从那儿下载的.另外,SPSS的另外一个产品clementine是目前最流行的SPSS产品,它以工作流的思想来处理数据挖掘问题,使用熟练的话还可以找到一份不错的工作.

数据挖掘主要分为监督学习和非监督学习,当然存在半监督学习.监督学习主要指分类,比如朴素贝叶斯,k-邻近,svm等等;而非监督学习主要指聚类,比如k-means,c-means,凝聚层次聚类.不同的方法需要用不同的软件.spss和sas主要是统计软件,对数据做预处理不错,当然这一类的统计软件都会自带一些聚类方法,比如spss就有凝聚层次聚类.matlab中有很多函数,可以用来做数据挖掘.我个人主要做聚类的,很多算法都是自己编的.你的问题不太明确,希望能说一下你想做什么,如果比较简单就不用编程,像cluto这样软件是相当不错的聚类软件.这我不常来,可以给我发邮件ocean_papa@qq.com

网站首页 | 网站地图
All rights reserved Powered by www.fpbl.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com