数据挖掘中常用的算法

日期: 栏目:大数据算法 阅读:0
数据挖掘中常用的算法

随着数据挖掘技术的进步与发展,众多的数据挖掘算法不断开发出来,其中有些是被使用较多的常用算法。

决策树,是一种基于概率和统计的机器学习方法,它可以用于分类和回归的模型,决策树可以把复杂的模型分解为更加简单的表达方式。用树的形式表示这些分类和回归模型。它可以被简单理解为,基于每一个属性值的选择,生成一条“分界线”,决定哪些数据点属于某一个类别。

K 近邻算法是一种常用的模式分类算法,它属于监督学习,它主要的作用是从数据集中找出一个最相近的 K 个点,然后把人们划分到属于哪一类别中。它的优点是有很强的可解释性,而且算法运行速度较快。

贝叶斯算法是一种基于概率的分类算法,它可以把新的数据点划分到属于不同类别的概率。贝叶斯算法从模型参数的统计角度分析,计算非常简单,但它要求数据输入的格式严格。

聚类分析是一种无监督的学习模型,它分类数据点,通过找到附近的相似点,然后划分出不同的类别,聚类分析是非监督学习的一种,它把相近的数据点划归到一起,它的优点是算法简单,可以有效的找到非线性相关性。

回归分析是一种数据分析方法,它把一个或多个变量间的相关关系形式化,从而建立出分析的模型,回归分析可以用来估计因变量与自变量间的相关程度,以及因变量的值。

总之,以上所提到的这些算法都是常用的数据挖掘算法,它们都具有自己的优点以及特征。

标签: