零基础理解QKV注意力机制的原理和代码示例
本文面向数学零基础的读者理解QKV机制的原理,并附加python代码,python的环境安装和语法不会过多介绍。
本文面向数学零基础的读者理解QKV机制的原理,并附加python代码,python的环境安装和语法不会过多介绍。
现在让我们尝试自己实现一个多层感知机。 为了与之前softmax回归获得的结果进行比较, 我们将继续使用Fashion-MNIST图像分类数据集。
我们之前已经对线形模型有了一定的了解,现在我们可以开始对深度神经网络的探索。
就像我们从零开始实现线性回归一样, 我们认为softmax回归也是重要的基础,因此应该知道实现softmax回归的细节,这一篇博客可以与上一篇原理介绍的博客对照着看。
回归可以用于预测多少的问题。 比如预测房屋被售出价格,或者棒球队可能获得的胜场数,又或者患者住院的天数。
事实上,我们也对分类问题感兴趣:不是问“多少”,而是问“哪一个”:
本节一起跟随李沐老师的课程动手学习线形回归的基本思想,并从零实现。
从这一篇博客开始介绍一些机器学习常用的算法的原理及其实战代码,本次博客介绍的是决策树以及从决策树上发展出来的随机森林和Gradient Boosting决策树
这篇博客简单梳理下机器学习的算法,训练方法和训练一个模型的步骤。
最近在玩Agent,用LangChain写了一个简单的DEMO,可以实现根据输入文档和之前的聊天记录来进行问答,之所以记录一下,实在是因为Langchain的文档非常差,这段代码耗时三天才成功运行。