什么是激活函数? 神经元节点中的函数f把输入信号的总和转化输出信号,这种函数一般称作激活函数。 激活函数的输出一般位于一个范围内(通常为 0 到 1 或 -1 到 1),具体取决于函数。因此,激活函数将节神经元节点输出归一化到设定的范围内。 选择何种激活函数将影响神经网络模型的结果和准确性。神经网络 ...
在统计学的世界里,参数估计一直是数据分析的核心任务之一。 极大似然估计(MLE)作为一种经典的参数估计方法,被广泛应用于各种领域。 然而,极大似然估计并非只有一种实现方式,它在频率学派和贝叶斯学派中有着不同的理论基础和应用场景。 本文将探讨这两种学派的区别,并通过实际代码示例展示它们在极大似然估计中 ...
数据科学与 ML、AI、NLP、DL 的关系 机器学习(Machine learning) 人工智能(rtificial intelligence) 自然语言处理(Natural language processing) 深度学习(Deep learning) 我们经常看到数据科学、人工智能、机器学 ...
0 引言 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比,表现极具竞争力结果。 小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 ...
0 前言 Transformers设计目标是简单易用,让每个人都能轻松上手学习和构建 Transformer 模型。 用户只需掌握三个主要的类和两个 API,即可实现模型实例化、推理和训练。本快速入门将带你了解 Transformers 的核心功能,包括: 加载预训练模型 使用 Pipeline 进 ...
本书前半部分介绍强化学习的重要思想和基础知识,后半部分介绍如何将深度学习应用于强化学习,遴选讲解了深度强化学习的全新技术。全书从适合入门的多臂老huji问题切入,依次介绍了定义一般强化学习问题的马尔可夫决策过程、用于寻找答案的贝尔曼方程,以及解决贝尔曼方程的动态规划法、蒙特卡洛方法和TD方法。 ...
“鱼书”《深度学习入门:基于Python的理论与实现》作者又一力作。手把手带你创建深度学习框架,直击现代深度学习框架本质!
深度学习框架中蕴藏着惊人的技术和有趣的机制,本书旨在揭开这些技术和机制的神秘面纱,帮助读者正确理解技术,体会它们的有趣之处。为此,本书会带领读者从零开始创建一个深度学习框架—... ...
本篇笔记总结了最基本,同时也是推导比较容易理解的机器学习中线性模型的部分。 许多非线性模型也是在线性模型的基础上做了结构等方面的补充和引入。 本笔记随学习进度的跟进将持续更新:) 基本形式 \[f(\bf{x}) = \bf{\omega^T x + b} \]线性回归 主要内容:主要是学得\(\o ...
0 报错信息 Installing packages into 'Python 3.9' requires administrator privileges. Configure a per-project virtual environment as your project interprete ...
概要 本文聚焦如何使用spring-AI来开发大模型应用一些进阶技能,包含一套可落地的技术设计模式,读完你将会学习到: 如何使用Spring-AI 开发大模型对话应用 如何综合设计一套适用Spring-ai的代码结构,为应用提供更好的扩展能力 本文假设读者已经熟悉spring-ai的基本功能以及 ...
AgentMesh 是一个开源的多智能体 (Multi-Agent) 平台,核心目标是解决多个智能体之间的通信和协同问题,真正实现 "1+1>2" 的效果。能够帮助用户快速创造自己的多智能体团队,或是让已有的多个单一智能体获得协同能力,最终解决更为复杂的任务。 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
写在前面 事情是这样的,就在五一假期开始前夕,DeepSeek放出了模型DeepSeek-Prover-V2-671B: 这是延续了节假日狂飙的传统? 言归正传,我们看看这次放出了哪些核心技术。 最直接的方法是参见技术报告,也在半夜放出来了(真是一群勤奋的家伙啊)。 链接:https://githu ...
什么是深度学习? 深度学习是人工智能和机器学习的子集,但它已经超越了传统的机器学习方法,是近十多年最热门的研究和应用领域。比如图形识别,自动驾驶,聊天机器人等等。 了解深度学习之前,我们先学习一下生物学上神经元的概念,因为深度学习就是模拟神经元的工作原理,来实现神经网络,从而实现人工智能。 神经元 ...
在数字化浪潮汹涌澎湃的今天,视频合成技术如同一颗璀璨的明星,照亮了内容创作的广阔天地 Kairos是一款顶级数字人制作工具,它基于先进的 AI 算法,能够快速克隆出用户的数字分身,并且精准匹配外貌、声音和口型。它可以帮你做直播、互动,如果你懒得自己出镜拍视频,直接让数字人上场,省时省力,效果逼真自然 ...
蚂蚁百宝箱 3 分钟上手 MCP:6 步轻松构建 Qwen3 智能体应用并发布小程序 想象一下,一个能说 119 种语言的 AI,不仅能为你规划旅行路线、讲解异国风情,还能自然地向用户收取小费。 借助 Qwen3 的强大语言理解与生成能力,结合支付宝 MCP 的支付能力,你的智能体,终于可以“收钱” ...
Hugging Face Hub 已成为 AI 协作的核心平台,托管了数万个模型、数据集以及交互式应用程序 (Space)。 在开放生态系统中,用户知情同意的管理方式与那些更 "数据饥渴" 的科技公司的封闭产品截然不同。本文将通过分析 Hugging Face Hub 平台,探讨由官方主导项目与社区 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
本书着眼于计算机视觉教学实践,系统地介绍了计算机视觉的基本内容及其代码实现。本书将计算机视觉算法原理与实践相结合,以大量示例和代码带领读者走进计算机视觉的世界,让读者对计算机视觉的研究内容、基本原理有基本认识。 ...
大家好,我是汤师爷,专注AI智能体分享~ 短视频小白经常会遇到这样的困扰。 每天花大量时间刷视频,想要找到你所在赛道的爆款内容,却总是难以系统地整理和分析? 想要批量获取某个关键词的爆款视频数据,但是市面上的采集工具要么特别贵,要么操作极其复杂? 或者,已经尝试过各种方法,但始终找不到一个高效、低成 ...