NLP论文阅读(一) 发表于 2019-01-31 | 分类于 Paper 字数统计: 3.1k 字 | 阅读时长 ≈ 11 分钟 # Summary近几年,向量空间的词表示能提高NLP任务的性能.但是,对于大多数现有工作,单词都被视为独立实体,在被建模的形态相关的单词之间没有明确的关系.因此,导致罕见和复杂的单词通常估计不佳。本文通过提出一种新颖的模型来解决这个缺点,该模型能够构建来自其语素的形态复杂单词的表示.本文提出一种将 ... 阅读全文 »
推荐系统论文阅读(三) 发表于 2019-01-30 | 分类于 Paper 字数统计: 3.1k 字 | 阅读时长 ≈ 11 分钟 DeepFM: A Factorization-Machine based Neural Network for CTR PredictionAbstract学习用户行为背后的复杂特征交互对于最大化推荐系统的CTR至关重要.尽管取得了很大进展,但现有方法似乎对低阶或高阶交互有强烈的bias,或者需要 ... 阅读全文 »
花书重读(二) 发表于 2019-01-29 | 分类于 DL 字数统计: 6.2k 字 | 阅读时长 ≈ 22 分钟 数值计算上溢和下溢当接近0的数被四舍五入为0时发生下溢.当大量级的数被近似为∞或-∞时发生上溢. 对上溢和下溢进行数值稳定的一个例子是softmax函数. Softmax(x)_ i=\frac{exp(x_i)}{\sum_{j=1}^nexp(x_j)}考虑一下当所有$x_i$都等于某个常数c时 ... 阅读全文 »
FCN project 发表于 2019-01-29 | 分类于 Project 字数统计: 5k 字 | 阅读时长 ≈ 21 分钟 FCN 论文阅读Summary本文的重点在于构建”fully convolutional” network,该网络可以接收任意大小的输入并通过有效的推理和学习产生相应大小的输出.作者定义了一种新颖的架构,它将来自深层粗糙层的语义信息与来自浅层精细层的外观信息相结合,以生成准确而详细的部分。 从粗略推 ... 阅读全文 »
剑指offer(二) 发表于 2019-01-27 | 分类于 offer 字数统计: 2k 字 | 阅读时长 ≈ 6 分钟 面试需要的基础知识何为基础知识: 数据结构和算法 编程能力 数学知识 问题分析和推理能力编程语言在面试过程中,面试官要么直接问语言的语法,要么让应聘者用一种编程语言写代码解决一个问题,通过写出代码来判断应聘者对他使用的语言的掌握程度. 通常语言面试有3种类型. 第一种题型是面试官直接询问应聘者 ... 阅读全文 »
花书重读(一) 发表于 2019-01-27 | 分类于 DL 字数统计: 3k 字 | 阅读时长 ≈ 10 分钟 引言层次化概念能让计算机构建较简单的概念来学习复杂概念.如果绘制出表示这些如何建立在彼此之上的图.我们将得到一张”深”(层次很多)的图。基于这个原因,我们称这种方法为AI深度学习. 一些人工智能项目力求将关于世界的知识用形式化的语言进行硬编码.计算机可以使用逻辑推理规则来自动地理解这些形式化语言的声 ... 阅读全文 »
剑指offer(一) 发表于 2019-01-26 | 分类于 offer 字数统计: 619 字 | 阅读时长 ≈ 2 分钟 面试的流程面试的三种形式 电话面试能清楚表达自己的想法,特别是在解释复杂算法的时候。尽可能用形象化的语言把细节说清楚.当不确定面试官的问题的时候,应大胆地向面试官多提问,直到弄清楚面试官的意图为止. 共享桌面远程面试面试官能通过共享桌面观看应聘者编程和调试的过程。这一part主要是关心应聘者的编程 ... 阅读全文 »
推荐系统论文阅读(二) 发表于 2019-01-23 | 分类于 Paper 字数统计: 1.9k 字 | 阅读时长 ≈ 7 分钟 Neural Collaborative FilteringSummary之前的论文用深度学习for recomendation都是用它们来对辅助信息建模.当要对协同过滤中的关键因子——(user和item的特征的相互作用)建模时它们仍采用matrix factorization(MF)并且运用us ... 阅读全文 »
机器学习(六)——采样 发表于 2019-01-23 | 分类于 Machine Learning 字数统计: 2.5k 字 | 阅读时长 ≈ 9 分钟 采样采样的作用采样的本质是随机现象的模型,根据给定的概率分布,来模拟产生一些随机时间.另一方面,采样得到的样本集也可以看作是是一种非参数模型,即用较少量的样本点(经验分布)来近似总体分布,并刻画总体分布中的不确定性. 从这个角度来说,采样其实也是一种信息降维,可以起到简化问题的作用。 对当前的数据集 ... 阅读全文 »
推荐系统论文阅读(一) 发表于 2019-01-22 | 分类于 Paper 字数统计: 1.3k 字 | 阅读时长 ≈ 5 分钟 ITEM2VEC: NEURAL ITEM EMBEDDING FOR COLLABORATIVE FILTERINGSummary本文对NLP中的Skip-gram with Negative Sampling(SGNS)方法做了极小的修改来推断推荐系统中item-item的关系(在user信息不 ... 阅读全文 »