tag

机器学习

本文原作者:尹迪,经授权后发布。 1牛顿法 设f(x)是二次可微实函数,又设$x^{(k)}$是f(x)一个极小点的估计,我们把f(x)在$x^{(k)}$处展开成Taylor级数, 并取二阶近似。 上式中最后一项的中间部分表示f(x)在$x^{(k)}$处的Hesse矩阵。对上式求导并令其等于0,

本文原作者:尹迪,经授权后发布。 梯度下降(GD)是最小化风险函数、损失函数的一种常用方法,随机梯度下降和批量梯度下降是两种迭代求解思路。 1 批量梯度下降算法 假设h(theta)是要拟合的函数,J(theta)是损失函数,这里theta是要迭代求解的值。这两个函数的公式如下,其中m是训练集的记录

本文作者:branxu,腾讯 CDG 应用研究员 2018 年和 2019 年腾讯算法广告大赛都可以看做推荐系统问题。这类问题最重要的特征是点击率,最大的难点是冷启动。文本结合 2018 年比赛亚军方案和 2019 年比赛冠军方案中的一部分技巧,提出了一种新的点击率建模方案,试图解决一部分冷启动问题

关于作者 辛俊波,腾讯算法数据中心\应用算法组 导语I推荐系统和搜索应该是机器学习乃至深度学习在工业界落地应用最多也最容易变现的场景。而无论是搜索还是推荐,本质其实都是匹配,搜索的本质是给定 query,匹配 doc;推荐的本质是给定 user,推荐 item。本文主要讲推荐系统里的匹配问题,包括传

早前针对疫情的影响情况,各地教育局纷纷发布了延迟开学的通知。为了让广大学子们在家也能线上学习,腾讯课堂助力“停课不停学”,推出了“老师极速版”,全方位帮助学校、老师、学生进行在线教学,助力保障学校与教育机构的教学进度与教学效果。 线上授课,最担心的莫过于: 小明同学,您来回答下这道题目... 小明?

作者:arlencai,腾讯 WXG 应用研究员 微信“扫一扫”识物已上线一段时间,在公司内外均受到极大的关注。相比于行内相关竞品的“拍”,“扫一扫”识物的特点在于“扫”,带来更为便捷的用户体验。“扫”离不开高效的移动端物体检测,本文将为你揭秘。 一、背景 “扫”是“扫一扫”识物的亮点,带来更为便捷

本文原作者:孟朋,经授权后发布。 随着深度学习的应用场景不断拓展,应用规模的不断扩大,模型推理服务的性能也受到越来越多重视。同样一个模型在同样的硬件上,专业的模型优化在同样的推理精度下可能会带来几倍甚至几十倍的性能提升。一般来说,使用专用推理框架比如TensorRT、OpenVINO等,推理性能会好

本文原作者:尹迪,经授权后发布。 假设向量`v`是方阵`A`的特征向量,可以表示成下面的形式: ​ ​ 这里lambda表示特征向量v所对应的特征值。并且一个矩阵的一组特征向量是一组正交向量。特征值分解是将一个矩阵分解为下面的形式: ​ ​ 其中Q是这个矩阵A的特征向量组成的矩阵。sigma是一个对

本文原作者:岳夕涵,经授权后发布。 导语 做模型的同学基本都会使用tensorflow,不知道大家是否会像我一样对tensorflow的模型存储感到疑惑:各种模型保存的方法、保存出的模型文件名称和结构还不一样、加载模型的时候有的需要重新定义一遍计算图而有的不需要、有的格式tfserving能用有的不

本文原作者:尹迪,经授权后发布。 1 主成分分析原理 主成分分析是最常用的一种降维方法。我们首先考虑一个问题:对于正交矩阵空间中的样本点,如何用一个超平面对所有样本进行恰当的表达。容易想到,如果这样的超平面存在,那么他大概应该具有下面的性质。 最近重构性:样本点到超平面的距离都足够近 最大可分性:样

本文原作者:尹迪,经授权后发布。 1 奇异值分解 在了解特征值分解之后,我们知道,矩阵A不一定是方阵。为了得到方阵,可以将矩阵A的转置乘以该矩阵。从而可以得到公式: 现在假设存在M*N矩阵A,我们的目标是在n维空间中找一组正交基,使得经过A变换后还是正交的。假设已经找到这样一组正交基: A矩阵可以将

本文原作者:岳夕涵,经授权后发布。 背景 用户搜索的关键词是对其兴趣的一个很重要的反映。然而我们发现,当用户搜索“阿丽塔”、“猫爪杯”等新词后,之后的推荐中却始终没有相关的文章出现。 这些新词在新入库文章中出现之后很快就会加入到tag表中。然而我们并没有直接将tag作为特征(之前实验过将tag作为特

本文原作者:孙雨豪,经授权后发布。 导语 NFL Big Data Bowl是Kaggle上的一个数据比赛,本文旨在通过回顾比赛,梳理和学习其中的建模思路(点数据挖掘、图挖掘)、数据处理技巧(对抗验证、数据增强)、模型集成技巧(Snapshot Ensembles)。 一.背景 笔者之前与队友der

本文原作者:彭浩源,经授权后发布。 导语 Google-research开源的BERT代码中,微调BERT进行文本分类的demo代码是基于TPUEstimator的单卡实现,即使机器上有多块GPU,也无法并行训练,不满足大规模训练的要求。本文分析开源demo代码无法多卡训练的原因,并给出修改代码,支

本文原作者:王伟,经授权后发布。 导语 近些年推荐系统领域已经有不少序列化建模的实践,本文将选择部分论文进行简单的分析和整理,旨在产生指引的作用。 背景 传统推荐系统从content-based和social-based等基本模式所衍生出的多种多样的方法,都是将user-item所产生的behavi