跳转到内容

scikit-learn

维基百科,自由的百科全书

这是本页的一个历史版本,由Upojzsb留言 | 贡献2023年3月10日 (五) 02:52 参见:​ link "List of numerical-analysis software " to its corresponding ZH Wikipedia link)编辑。这可能和当前版本存在着巨大的差异。

scikit-learn
原作者David Cournapeau
首次发布2007年6月,​17年前​(2007-06
当前版本1.6.1[1]在维基数据编辑(2025年1月10日,4個月前)
源代码库 編輯維基數據鏈接
编程语言Python, Cython, C, C++
操作系统Linux, macOS, Windows
类型机器学习
许可协议三条款BSD许可证
网站scikit-learn.org

Scikit-learn(曾叫做scikits.learn还叫做sklearn)是用于Python编程语言自由软件机器学习[2]。它的特征是具有各种分类回归聚类算法,包括支持向量机随机森林梯度提升k-平均聚类DBSCAN,它被设计协同于Python数值和科学库NumPySciPy

概述

scikit-learn计划开始于scikits.learn,它是David Cournapeau英语David CournapeauGoogle编程之夏计划。它的名字来源自成为“SciKit”(SciPy工具箱)的想法,即一个独立开发和发行的第三方SciPy扩展[3]。最初的代码库被其他开发者重写了。在2010年,来自法国罗康库尔法国国家信息与自动化研究所的Fabian Pedregosa、Gael Varoquaux、Alexandre Gramfort和Vincent Michel,领导了这个项目并在2010年2月1日进行了首次公开发行[4]。在各种scikit中,scikit-learn和scikit-image英语scikit-image截至2012年11月 (2012-11)被称为“良好维护和流行的”[5]。Scikit-learn是在GitHub上最流行的机器学习库之一[6]

实现

Scikit-learn主要用Python书写的,并广泛使用NumPy进行高性能线性代数和数组运算。此外,一些核心算法用Cython书写来以提高性能。支持向量机是通过用Cython包装LIBSVM英语LIBSVM实现;逻辑回归和线性支持向量机是通过对LIBLINEAR英语LIBLINEAR的类似的包装实现的。在这些情况下,用Python扩展出这些方法是不可能的。

Scikit-learn与很多其他Python库集成良好,比如用于绘图的matplotlibplotly英语plotly,用于数组向量化的NumPy,用于数据帧的pandas,用于科学计算的SciPy等等。

参见

引用

  1. ^ 1.0 1.1 Release 1.6.1. 2025年1月10日 [2025年1月29日]. 
  2. ^ Fabian Pedregosa; Gaël Varoquaux; Alexandre Gramfort; Vincent Michel; Bertrand Thirion; Olivier Grisel; Mathieu Blondel; Peter Prettenhofer; Ron Weiss; Vincent Dubourg; Jake Vanderplas; Alexandre Passos; David Cournapeau; Matthieu Perrot; Édouard Duchesnay. Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research. 2011, 12: 2825–2830 [2020-10-31]. (原始内容存档于2020-12-01). 
  3. ^ Dreijer, Janto. scikit-learn. [2020-10-31]. (原始内容存档于2020-11-07). 
  4. ^ About us — scikit-learn 0.20.1 documentation. scikit-learn.org. [2020-10-31]. (原始内容存档于2020-11-06). 
  5. ^ Eli Bressert. SciPy and NumPy: an overview for developers. O'Reilly. 2012: 43 [2020-10-31]. (原始内容存档于2016-04-25). 
  6. ^ The State of the Octoverse: machine learning. The GitHub Blog. GitHub. 2019-01-24 [2019-10-17]. (原始内容存档于2020-11-07) (美国英语). 

外部链接