大杀器XGBoost 发表于 2019-03-06 | 分类于 Machine Learning 字数统计: 3.1k 字 | 阅读时长 ≈ 12 分钟 GB、GBDT、XGBoost之间紧密相关,GBDT是以决策树CART为基学习器的GB算法,XGBoost扩展和改进了GDBT. Gradient boosting(GB)机器学习的学习算法的目标就是优化或者最小化loss function,Gradient boosting的思想是迭代多个(M个) ... 阅读全文 »
剑指offer(十) 发表于 2019-03-05 | 分类于 offer 字数统计: 2.7k 字 | 阅读时长 ≈ 12 分钟 剑指Offer刷题(二十六)题目输入一棵二叉搜索树,将该二叉搜索树转换成一个排序的双向链表。要求不能创建任何新的结点,只能调整树中结点指针的指向。 思路首先我们可以知道二叉搜索树的特点是:左子节点<根节点<右子节点,则显然有该树的中序遍历即为排序.然后对每个节点进行重新构造连接. C++ ... 阅读全文 »
NLP中的注意力机制 发表于 2019-03-05 | 分类于 NLP 字数统计: 1.5k 字 | 阅读时长 ≈ 5 分钟 2019.4.10:感觉自己这篇好渣啊,特此修改 Attention的发展Attention首先起源于视觉图像领域,早在上世纪九十年代就提出来了.但现在的attention,主要指深度学习出现以后的attention.(之前做过的基于脉冲神经网路的工作记忆的研究也有用到attention,不过与 ... 阅读全文 »
每日一问(一) 发表于 2019-03-05 | 分类于 面试 字数统计: 2.7k 字 | 阅读时长 ≈ 9 分钟 采用EM算法求解的模型有哪些,为什么不用牛顿法或梯度下降法?EM的求解原理:因为在求解一个含有隐变量的概率模型时,目标是极大化观测数据关于参数的对数似然,而极大化的主要困难是还有未观测数据并有包含和的对数,而EM通过迭代,不断求解下界极大化,而逐步求解对数似然函数极大化. 用EM算法求解的模型有哪些 ... 阅读全文 »
葫芦娃的葫芦书刷题(一) 发表于 2019-03-04 | 分类于 面试 字数统计: 4.1k 字 | 阅读时长 ≈ 14 分钟 特征工程 什么是特征工程?特征工程是对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用.旨在去除原始数据中的杂质和冗余.设计更高效的特征以刻画求解的问题与预测模型之间的关系. 什么是特征归一化特征归一化是对数值型的特征做归一化处理可以将所有的特征都统一到一个大致相同的数值区间内 ... 阅读全文 »
统计学习方法(一) 发表于 2019-02-28 | 分类于 ML 字数统计: 3.1k 字 | 阅读时长 ≈ 11 分钟 统计学习方法概述统计学习的主要特点:(1)统计学习以计算机及网络为平台,是建立在计算机及网络之上的(2)统计学习以数据为研究对象,是数据驱动的科学(3)统计学习的目的是对数据进行预测和分析(4)统计学习以方法为中心(5)统计学习是概率论、统计学、信息论、计算理论、最优化理论及计算机科学等多个领域的交 ... 阅读全文 »
花书重读(三) 发表于 2019-02-23 | 分类于 DL 字数统计: 4.1k 字 | 阅读时长 ≈ 14 分钟 深度前馈网络深度前馈网络也叫作前馈神经网络.之所以被称为前向的,因为信息流过x的函数,流经用于定义f的中间计算过程,最终到达输出y.在模型的输出和模型本身之间没有反馈连接.当前馈神经网络被扩展成包含反馈连接时,它们被称为循环神经网络.前馈神经网络之所以被称作网络,是因为它们通常用许多不同函数复合在一 ... 阅读全文 »
《推荐系统》阅读(一) 发表于 2019-02-23 | 分类于 Reading 字数统计: 6.9k 字 | 阅读时长 ≈ 23 分钟 引言个性化推荐:每个访问者由于其个人偏好不同会看到不同的列表.相对而言,许多其他在线商店或新闻门户提示你的,可能只是它们的畅销商品或热门文章.本书中重点讨论的是个性化推荐. 提供个性化推荐要求系统知道每个用户的信息.推荐系统必须开发并维护一个用户模型(user model) 或用户记录(user p ... 阅读全文 »
剑指offer(九) 发表于 2019-02-22 | 分类于 offer 字数统计: 917 字 | 阅读时长 ≈ 3 分钟 剑指Offer刷题(二十四):二叉树中和为某一值的路径题目输入一颗二叉树和一个整数,打印出二叉树中结点值的和为输入整数的所有路径。路径定义为从树的根结点开始往下一直到叶结点所经过的结点形成一条路径。 思路深度优先搜索.使用前序遍历,使用两个全局变量result和tmp,result来存放最终结果,t ... 阅读全文 »
Object-Detection(五) 发表于 2019-02-22 | 分类于 Deep Learning , CV 字数统计: 1.1k 字 | 阅读时长 ≈ 3 分钟 写在前面常见计算机视觉的任务: 图像分类(image classification) 物体检测(object detection) 语义分割(Semantic Segmentation) 实例分割(Instance Segmentation) 图像分类就不做介绍了,就是输入一张图,输出该图的类别 ... 阅读全文 »