文章归档


2023

SQL 复习笔记

知识点复习补充


检验样本的正态性

图像方法与量化方法


Git 常用操作总结

版本控制与团队协作


医药销售数据分析

如何从日常数据中得到关键洞察


使用 fitter 拟合数据分布

寻找最匹配的总体分布


特征工程知识点总结

非系统且不严谨的总结


检验样本是否服从泊松分布

统计分析一例


通过一个简单的例子理解 Python 中的多线程

如何实现一边写代码一边掉头发?


在前端开发中使用 Python

推荐给需要鼓捣前端应用又不熟悉 JS 的 Pythoner


Modin 使用总结

通过 Modin 加速 Pandas


常见回归模型评估指标总结

各个评估指标的优缺点及其相互关系


介绍几款在线编程工具

无需编译环境开始 python 编程以及共享代码


Overview of Data Distributions

数据分布概述


2022

餐饮市场分析(下)

茶饮产品市场分析网站展示


PyEcharts 学习总结

如何用 pyecharts 绘制一切你想象得到的交互式图表?


Bokeh 绘图入门

Bokeh 绘图基础以及常用绘图功能


餐饮市场分析(上)

以茶饮为例 研究某一类餐饮产品的市场概况


超市零售数据可视化分析

Plotly + Cufflinks + Pandas 绘图指南


网页视频弹幕爬取

获取网页 API 的基本方法


Matplotlib 绘制动画入门

使用 matplotlib.animation 可视化数据变化趋势


油猴脚本入门总结

如何给浏览器开挂?—— 三分钟入门


深圳数据分析招聘数据研究

爬取 51Job 网站上相关职位数据并进行分析


A/B 测试与假设检验

A/B 测试原理 & 使用 Python 进行假设检验


Data Scientist vs. Data Engineer vs. Statistician

数据科学家、数据工程师以及统计学家的相似点和不同点


Jekyll 学习笔记

通过 Jekyll 框架搭建个人博客站点


2021

淘宝平台数据分析

电商平台业务分析的思路与实践


链家二手房市场分析

纵得广厦千万间 难使天下寒士俱欢颜


京东手机市场分析

华为一家独大,小米力压苹果


APP 数据分析指标体系

设计数据指标 & 搭建指标体系


创业公司如何构建指标体系

第一关键指标法 & AARRR模型


数据分析三大原理

数据分析三个原理两个例子


互联网数据分析实战

互联网数据分析工具、方法与案例


一名合格的数据科学家

什么是“数据科学家”?


商业数据分析

关于商业数据分析的几个要点总结


Neural Network and Deep Learning

Coursera 神经网络入门课程学习笔记


卷积神经网络基础(上)

Coursera 卷积神经网络入门课程学习笔记


卷积神经网络基础(下)

Coursera 卷积神经网络入门课程学习笔记


概率论与数理统计(下)

数理统计部分:数理统计基本概念 | 参数估计 | 假设检验


概率论与数理统计(上)

随机事件 | 随机变量与随机向量 | 数字特征 | 大数定律 | 中心极限定理


Python 处理 PDF 文件

再也不需要 Office、WPS 或 Adobe 啦!


卷积神经网络学习笔记

CNN 的结构层次和定义


Java 编程入门(下)

Swing | 多线程 | 网络通信 | 数据库


Java 编程入门(中)

面向对象 | 类 | 异常处理 | IO


R 三维数据绘图

如何使用 R 直观地可视化三维数据?


Python 编程技巧

有效利用 Python 的数据结构和内置功能


Java 编程入门(上)

语法基础 | 数据类型 | 流程控制


MATLAB 范例集锦

MatLab 基本语法与常用功能


Python 爬虫快速入门(下)

一个可复制的爬虫工作流 -- 解析与存储数据


Python 爬虫快速入门(上)

一个可复制的爬虫工作流 -- 理解与请求数据


Python DataScience CookBook -- Learning Notes (III)

Bagging | Boosting | Random Forest | Perceptron | Gradient Descent


Python DataScience CookBook -- Learning Notes (II)

数据预处理 | KNN | NBM | 决策树 | Ridge | lasso | CV


Python DataScience CookBook -- Learning Notes (I)

PCA | SVD | 随机映射 | NMF | 距离度量 | 核函数 | LVQ | LOF


Python 入门知识补充

总结 Python 基础中不太熟悉的知识点


R 编程实用技巧

数据处理进阶 | 爬虫 | 数据库


Plotly 绘图基础

使用 Plotly 创建交互式可视化作品


Matplotlib 绘图例子

关联 | 偏差 | 排序 | 分布 | 组成 | 变化 | 分组


R 统计学习(ISLR)-- Learning Notes (III)

决策树 | 支持向量机 | 无监督学习


R 统计学习(ISLR)-- Learning Notes (II)

重抽样方法 | 子集选择 | 压缩估计 | 降维 | 非线性模型


R 统计学习(ISLR)-- Learning Notes (I)

统计学习简介 | 线性回归 | 分类问题


Seaborn 绘图基础

基于 Matplotlib 的封装,Matplotlib 的补充


2020

Pandas 数据处理技巧

大型数据 | 描述统计 | 代码加速


Pandas-数据处理函数

使用 Pandas 集成的函数更高效地处理数据


SQL-入门学习笔记(下)

数据库进阶知识点 | MySQL


SQL-入门学习笔记(上)

数据库知识点总结 | MySQL常用语法


R for Data Science - Learning Notes (III)

Communications & Cooperations


R for Data Science - Learning Notes (II)

Modeling & R-Markdown


R for Data Science - Learning Notes (I)

Data-processing Basics & Useful Packages


R 统计分析

使用 R 语言进行统计分析