机器学习与深度学习
深度学习确实是机器学习的一个分支领域。
机器学习旨在让计算机系统通过数据学习规律,从而能够对新的数据进行预测或决策等,它包含了众多方法和技术,比如传统的基于规则的机器学习算法(像决策树、支持向量机等),通过人工提取特征后让模型学习特征与目标之间的关系。
深度学习则侧重于利用深度神经网络结构,它能够自动从海量的数据中学习到层次化的特征表示,不需要人工去刻意设计和提取复杂特征。例如在图像识别中,深度学习模型可以直接从原始图像像素数据里逐步挖掘出如边缘、纹理、物体形状等不同层次的特征,进而判断图像中的物体类别。
深度学习基础知识
感知机:早期的简单神经网络模型,由单个神经元构成,可用于简单的线性分类任务,如区分两类线性可分的数据点。
神经元:是神经网络的基本构成单元,模拟生物神经元工作原理。它接收多个输入信号,每个输入乘以相应的权重,然后将这些乘积求和,再通过激活函数处理后输出结果。
神经网络结构:
神经网络是由大量神经元按照一定的层次结构和连接方式组织起来的计算模型。它一般包含输入层、隐藏层以及输出层。例如下
激活函数
无论神经网络有多少层,其本质上都只是对输入数据进行线性变换的组合,而现实世界中的很多问题,比如图像识别中物体特征的复杂映射、自然语言处理里语义的复杂关联等,都是高度非线性的,无法通过单纯的线性关系去准确拟合。
而激活函数作用于神经元的输出端,对神经元加权求和后的结果进行非线性变换,使得神经网络能够拟合各式各样复杂的非线性函数关系,从而具备强大的表达能力,可用于处理各类复杂的实际任务.
常见的激活函数
模型评估指标:
分类任务常用准确率(预测正确的样本数占总样本数的比例)、精确率(预测为正例且实际为正例的样本数与预测为正例的样本数之比)、召回率(预测为正例且实际为正例的样本数与实际正例样本数之比)、F1 值(综合精确率和召回率的指标)等。
回归任务常用均方根误差(RMSE)等指标衡量模型预测值与真实值的偏离程度。
模型部署与应用:
部署:将训练好的模型部署到相应的平台或设备上,如将图像识别模型部署到移动端应用中,让手机可以实时识别拍摄图像中的物体。
应用领域:深度学习在图像识别、自然语言处理、语音识别、推荐系统等众多领域都有广泛且成功的应用,极大地推动了人工智能技术的发展和落地。