liuyinglxl


  • 首页

  • 归档

KNN K近邻面试整理

发表于 2018-06-27 | 分类于 机器学习 | 阅读次数:
1. 介绍 KNNKNN 是一种基本的分类与回归方法,给定一个数据集,在数据集中找出与新实例最近的 k 个实例,选择这个 k 个实例中出现次数最多的类别作为新实例的类别。 KNN 主要有三个基本的要素:k 值的选择、距离度量、分类决策规则 2. KNN 实现过程 计算当前待分类实例与训练数据集中的每 ...
阅读全文 »

朴素贝叶斯面试整理

发表于 2018-06-27 | 分类于 机器学习 | 阅读次数:
1. 介绍朴素贝叶斯朴素贝叶斯是一种生成式模型。基于贝叶斯定理与特征条件独立假设(在已知分类Y的条件下,各个特征变量取值是相互独立的)的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入 x,利用贝叶斯定理求出后验概率最大的输出 y. ...
阅读全文 »

决策树面试整理

发表于 2018-06-27 | 分类于 机器学习 | 阅读次数:
口述决策树决策树一种基本的分类与回归方法。它可以看作是 if-then 规则的集合,也可以看作是定义在特征空间与类空间上的条件概率分布。决策树是一种树形结构,由节点和有向边组成,结果有内部节点和叶子结点,内部节点表示的是一个特征,叶子节点表示的是一个类别。决策树学习的本质就是从训练数据中训练归纳出一 ...
阅读全文 »

SVM支持向量机面试整理

发表于 2018-06-18 | 分类于 机器学习 | 阅读次数:
口述 SVMSVM 叫做支持向量机,它是一种二分类模型。它的基本模型是定义在特征空间的间隔最大的线性分类器。 根据训练数据的不同,SVM 主要分为三种情况: 第一种情况就是,当训练数据线性可分的时候,我们是通过硬间隔最大化,来学习一个线性分类器,也就是线性可分的支持向量机。硬间隔就是说,硬性要求所有 ...
阅读全文 »

特征工程

发表于 2018-06-11 | 分类于 机器学习 , 特征工程 | 阅读次数:
1. 特征构造提取相关信息出来,再人工构造一些特征 2. 特征清洗2.1 异常值检测1. 基于统计的检测四分位数间距,箱形图 2. 基于距离的检测 K-means,得到聚类结果之后,然后选出每个簇中,大于阈值的点,即为离群点 3. 基于聚类的检测 DBSCAN,最后不属于任何簇的那些样本,为异常点 ...
阅读全文 »

LR逻辑斯蒂回归面试整理

发表于 2018-06-08 | 分类于 机器学习 | 阅读次数:
简单介绍 LR 模型LR 是一个经典的分类算法,LR 是假设输入数据(标签)是服从伯努利分布的。LR 的形式就是 $P(Y=1 | x) = \frac {\exp (w \cdot x)}{1 + \exp {w \cdot x}}$. 可以从三个方面来理解 LR: 可以将 LR 看作是参数化的 ...
阅读全文 »
12

liuyinglxl

16 日志
7 分类
22 标签
© 2019 liuyinglxl
由 Hexo 强力驱动
|
主题 — NexT.Muse v5.1.4
博客全站共31.7k字