吃瓜教程——task01(概览西瓜书+南瓜书第1、2章)

第一章 绪论

基本术语

数据集(dataset):收集的一批用于机器学习的数据,其中每条记录是关于一个事件或对象的描述。

属性或特征(feature):反映事件或对象在某方面的表现或性质的事项。

学习或训练(learning):从数据中学得模型的过程称为学习或训练。

回归和分类:若数据集中的数据是连续值,则这类学习任务称为回归;若数据集中的数据是离散值,则这类学习任务称为分类。

聚类:将训练集中的样本通过模型学习找到其中隐藏的规律或标签,并分为若干组,聚类过程样本的标签是未知的。

监督学习和无监督学习:根据训练数据是否拥有标记信息,学习任务可以大致分为两大类:监督学习和无监督学习,前者的代表是分类和回归,后者的代表是聚类。

泛化能力:是指通过学习得到的模型在新样本上适用情况,具有强泛化能力的模型能够很好地适用于整个样本空间,即这个模型不仅在训练集上表现好,在样本空间上任何新样本都能有较好的效果。

第二章 模型评估与选择

第二章感觉重点太多,偷懒直接上原文和一些笔记。。。

 吃瓜教程——task01(概览西瓜书+南瓜书第1、2章)_第1张图片

 

 吃瓜教程——task01(概览西瓜书+南瓜书第1、2章)_第2张图片

 吃瓜教程——task01(概览西瓜书+南瓜书第1、2章)_第3张图片

 吃瓜教程——task01(概览西瓜书+南瓜书第1、2章)_第4张图片

 吃瓜教程——task01(概览西瓜书+南瓜书第1、2章)_第5张图片

 吃瓜教程——task01(概览西瓜书+南瓜书第1、2章)_第6张图片

 吃瓜教程——task01(概览西瓜书+南瓜书第1、2章)_第7张图片

 吃瓜教程——task01(概览西瓜书+南瓜书第1、2章)_第8张图片

 吃瓜教程——task01(概览西瓜书+南瓜书第1、2章)_第9张图片

 

你可能感兴趣的