Paradise's Blog

Rome Paradise was not built in a day.

Python DataScience CookBook -- Learning Notes (II)

「 数据预处理 | KNN | NBM | 决策树 | Ridge | lasso | CV 」

教材介绍:https://book.douban.com/subject/26630181/ 第六章 机器学习(I) (1)为建模准备数据 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 from sklearn.datasets import load_ir...

Python DataScience CookBook -- Learning Notes (I)

「 PCA | SVD | 随机映射 | NMF | 距离度量 | 核函数 | LVQ | LOF 」

教材介绍:https://book.douban.com/subject/26630181/ 简介 这本书比较冷门,因为需要快速上手 python 机器学习,随便找本书来学习一下。虽然内容比较浅显,不够深入,但是作为快速上手的教材很好用。其实整本书就是相当于 scikit-learn 的一个帮助文档而已,没有扯什么原理性的东西。如果有一定基础,要熟悉 scikit-learn,其...

Python 入门知识补充

「 总结 Python 基础中不太熟悉的知识点 」

作为入门学习,首先是学习了 Python Crash Course ,了解了大致的架构体系。但是很多知识点还没有完全掌握,现在再简略地过一遍 Begining Python 这一本书,补充一些还比较新鲜的内容。 相关的书籍资源: Python Crash Course | 提取码:4os7 Begining Python | 提取码:zbs8 CHPT01 基础知识 进制...

R 编程实用技巧

「 数据处理进阶 | 爬虫 | 数据库 」

善用 apply 函数族 R 语言的运行性能较差,使用 apply 函数可以避免使用大量的 for 循环,有效提高代码运行速度。尤其是处理较大的数据集的时候。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 # apply 函数作用于向量 x <- cbind(3, c(1:5, 4:1)) app...

Plotly 绘图基础

「 使用 Plotly 创建交互式可视化作品 」

一、简介 Ploty(plotly.py)是一个交互式的开源绘图库,它支持40多种独特的图表类型,涵盖了各种统计,财务,地理,科学和三维用例。 plotly.py 构建在 Plotly JavaScript 库(plotly.js)之上,使 Python 用户可以创建基于 Web 的漂亮的交互式可视化效果,这些可视化效果可以显示在 Jupyter notebook 中,可以保存到独立的 ...

Matplotlib 绘图例子

「 关联 | 偏差 | 排序 | 分布 | 组成 | 变化 | 分组 」

本文为笔记,原文链接:http://liyangbit.com/pythonvisualization/matplotlib-top-50-visualizations/ 本文在代码 jupyter notebook 运行,在当前文件夹打开 cmd 执行:jupyter nbconvert --to script *.ipynb 可以把 .ipynb 文件保存为 .py 脚本...

R 统计学习(ISLR)-- Learning Notes (III)

「 决策树 | 支持向量机 | 无监督学习 」

Python 解决方案:https://github.com/hardikkamboj/An-Introduction-to-Statistical-Learning 教材介绍:https://book.douban.com/subject/26430936/ 相关资源:http://faculty.marshall.usc.edu/gareth-james/ISL/ ...

R 统计学习(ISLR)-- Learning Notes (II)

「 重抽样方法 | 子集选择 | 压缩估计 | 降维 | 非线性模型 」

Python 解决方案:https://github.com/hardikkamboj/An-Introduction-to-Statistical-Learning 教材介绍:https://book.douban.com/subject/26430936/ 相关资源:http://faculty.marshall.usc.edu/gareth-james/ISL/ ...

R 统计学习(ISLR)-- Learning Notes (I)

「 统计学习简介 | 线性回归 | 分类问题 」

Python 解决方案:https://github.com/hardikkamboj/An-Introduction-to-Statistical-Learning 教材介绍:https://book.douban.com/subject/26430936/ 相关资源:http://faculty.marshall.usc.edu/gareth-james/ISL/ ...

Seaborn 绘图基础

「 基于 Matplotlib 的封装,Matplotlib 的补充 」

简介 Seaborn是一个使用Python制作统计图形的库。它基于matplotlib构建,并与pandas数据结构紧密集成。Seaborn旨在使可视化成为探索和理解数据的中心部分。其面向数据集的绘图功能在包含整个数据集的数据框和数组上运行,并在内部执行必要的语义映射和统计汇总,以生成有用的图。 Seaborn 官方文档 关联 1 2 3 4 5 6 7 # 二维数据 df = pd...