1. Python模型调优

    Python模型调优 了解了Scikit-learn在分类、回归、聚类、降维等领域的各种模型后,在实际应用中,我们还会面对许多新的问题:在众多可用模型中,应该选择哪一个?如何评价一个或多个模型的优劣?如何调整参数使一个模型具有更好的性能?这一类问题属于模型评估和参数调优,Scikit-learn在模型选择子模块model_selection中提供了若干解决方案。

    2016/11/18 Python scikitlearn

  2. Python机器学习降维算法

    Python机器学习降维算法 收集数据时,我们总是不想漏掉任何一个可能会影响结果的变量,这将导致数据集变得异常庞大。而实际训练模型时,我们又总想剔除那些无效的或对结果影响甚微的变量,因为更多的变量意味着更大的计算量,这将导致模型训练慢得令人无法忍受。如何才能从众多数据中剔除无效的或对结果影响甚微的变量,以降低计算复杂度,提高模型训练效率呢?答案就是降维。机器学习领域中的降维是指采用某种映射方法,将原本高维度空间中的数据点映射到低维度的空间中。

    2016/11/17 Python scikitlearn

  3. Python机器学习聚类算法

    Python机器学习聚类算法 聚类是指自动识别具有相似属性的给定对象,并将具有相似属性的对象合并为同一个集合。聚类属于无监督学习的范畴,最常见的应用场景包括顾客细分和试验结果分组。根据聚类思想的不同,分为多种聚类算法,如基于质心的、基于密度的、基于分层的聚类等。Scikit-learn中最常用的聚类算法包括k均值聚类、谱聚类、均值漂移聚类、层次聚类、基于密度的空间聚类等。

    2016/11/16 Python scikitlearn

  4. 支持向量机

    支持向量机 支持向量机简称SVM,是Support Vector Machine的缩写。SVM是一种分类算法,在工业界和学术界都有广泛的应用。特别是针对数据集较小的情况下,往往其分类效果比神经网络好。

    2016/11/15 Python scikitlearn

  5. 逻辑回归算法

    2016/11/13 Python scikitlearn

  6. Python机器学习回归算法

    Python机器学习回归算法 回归是指研究一组随机变量(输入变量)和另一组变量(输出变量)之间关系的统计分析方法。如果输入变量的值发生变化时,输出变量随之改变,则可以使用回归算法预测输入变量和输出变量之间的关系。回归用于预测与给定对象相关联的连续值属性,而分类用于预测与给定对象相关联的离散属性,这是区分分类和回归问题的重要标志。和分类问题一样,回归问题也属于监督学习的一类。回归问题按照输入变量的个数,可以分为一元回归和多元回归;按照输入变量与输出变量之间的关系,可以分为线性回归和非线性回归。

    2016/11/12 Python scikitlearn

  7. Python机器学习分类算法

    Python机器学习分类算法 通过训练已知分类的数据集,从中可以发现分类规则,并以此预测新数据的所属类别,这被称为分类算法。按照类别标签的多少,分类算法可分为二分类算法和多分类算法。分类算法属于监督学习。Scikit-learn中最常用的分类算法包括支持向量机(SVM)、最近邻、朴素贝叶斯、随机森林、决策树等。尽管Scikit-learn也支持多层感知器(MLP),不过Scikit-learn本身既不支持深度学习,也不支持GPU加速,因此MLP不适用于大规模数据应用。如果想借助GPU提高运行速度,建议使用Tensorflow、Keras、PyTorch等深度学习框架。

    2016/11/11 Python scikitlearn

  8. Python机器学习

    Python机器学习 谈到Python在机器学习领域的应用,程序员们一定会想起Scikit-learn模块,以及Tensorflow、Keras、PyTorch等深度学习框架,但谁也不会否认这样一个事实:Scikit-learn是非常基础和友好的机器学习模块。

    2016/11/10 Python scikitlearn