python机器学习快速入门

参考资料:
黑马程序员3天快速入门python机器学习

知乎:人工智能、机器学习和深度学习的区别?

sklearn框架

sklearn 中文文档

摘要:

目录

  • 1.机器学习概述
    • 1.1 人工智能概述
    • 1.2 什么是机器学习
    • 1.3 机器学习算法分类
    • 1.4 机器学习开发流程
    • 1.5 学习框架和资料介绍
  • 2.特征工程
    • 2.1 数据集
    • 2.5 特征降维

python机器学习快速入门_第1张图片

人工智能阶段

机器学习 三天

深度学习 三天

量化交易 四天

人工智能阶段课程安排

python机器学习快速入门_第2张图片

1.机器学习概述

了解机器学习定义以及应用场景
说明机器学习算法监督学习与无监督学习的区别
说明监督学习中的分类、回归特点
说明机器学习算法目标值的两种数据类型
说明机器学习(数据挖掘)的开发流程

1.1 人工智能概述

机器学习和人工智能,深度学习的关系

  • 机器学习是人工智能的一个实现途径
  • 深度学习是机器学习的一个方法发展而来

python机器学习快速入门_第3张图片

机器学习、深度学习能做些什么
机器学习的应用场景非常多,可以说渗透到了各个行业领域当中。医疗、航空、教育、物流、电商等等领域的各种场景。
python机器学习快速入门_第4张图片

  • 用在挖掘、预测领域:
    应用场景:店铺销量预测、量化投资、广告推荐、企业客户分类、SQL语句安全检测分类…

  • 用在图像领域:
    应用场景:街道交通标志检测、人脸识别等等

  • 用在自然语言处理领域:
    应用场景:文本分类、情感分析、自动聊天、文本检测等等

1.2 什么是机器学习

定义:机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测

python机器学习快速入门_第5张图片

我们人从大量的日常经验中归纳规律,当面临新的问题的时候,就可以利用以往总结的规律去分析现实状况,采取最佳策略。

  • 从数据(房屋的各种信息)中自动分析获得模型(判断房屋价格的规律),从而使机器拥有预测房屋价格的能力。
  • 从数据(大量的猫和狗的图片)中自动分析获得模型(辨别猫和狗的规律),从而使机器拥有识别猫和狗的能力。

从历史数据当中获得规律?这些历史数据是怎么的格式?

数据集构成
特征值 + 目标值

1.3 机器学习算法分类

如果按照学习方式分类可分为
python机器学习快速入门_第6张图片

如果按照学习任务分类可分为以下三类:
python机器学习快速入门_第7张图片

1.4 机器学习开发流程

python机器学习快速入门_第8张图片
python机器学习快速入门_第9张图片

    1)获取数据

    2)数据处理

    3)特征工程

    4)机器学习算法训练 - 模型

    5)模型评估

    6)应用

1.5 学习框架和资料介绍

    1)算法是核心,数据与计算是基础

    2)找准定位
    大部分复杂模型的算法设计都是算法工程师在做,而我们
    分析很多的数据
    分析具体的业务
    应用常见的算法
    特征工程、调参数、优化

    3)怎么做?
    学会分析问题,使用机器学习算法的目的,想要算法完成何种任务
    掌握算法基本思想,学会对问题用相应的算法解决
    学会利用库或者框架解决问题

机器学习库与框架

python机器学习快速入门_第10张图片

书籍资料—实践类
python机器学习快速入门_第11张图片

提深内功
python机器学习快速入门_第12张图片

2.特征工程

了解特征工程在机器学习当中的重要性
应用sklearn实现特征预处理
应用sklearn实现特征抽取
应用sklearn实现特征选择
应用PCA实现特征的降维

2.1 数据集

    2.1.1 可用数据集

        公司内部 百度

        数据接口 花钱

2.5 特征降维

学习目标
目标
知道特征选择的嵌入式、过滤式以及包裹氏三种方式
应用VarianceThreshold实现删除低方差特征
了解相关系数的特点和计算
应用相关性系数实现特征选择
应用

python机器学习快速入门_第13张图片

你可能感兴趣的