微信登录

深度学习概述 - 神经网络 - 神经网络的基本结构

深度学习概述 - 神经网络 - 神经网络的基本结构

一、深度学习与神经网络的缘起

在当今科技飞速发展的时代,深度学习已成为人工智能领域的核心驱动力之一。它让计算机能够从大量数据中学习模式和规律,从而实现图像识别、语音识别、自然语言处理等诸多复杂任务。而神经网络则是深度学习的重要基石,它的灵感来源于人类大脑的神经元结构和工作方式。

想象一下,人类的大脑就像一个超级复杂的生物计算机,由数以亿计的神经元相互连接组成。这些神经元通过电信号和化学信号进行信息传递和处理,使得我们能够感知世界、思考问题、做出决策。科学家们受到大脑神经元工作原理的启发,设计出了人工神经网络,希望计算机能够模拟人类大脑的智能。

二、神经网络的基本单元——神经元

(一)神经元的结构与功能

神经元是神经网络的基本构建块,类似于人类大脑中的神经元。一个简单的神经元接收多个输入信号,对这些输入进行加权求和,然后通过一个激活函数处理这个总和,最终产生一个输出。

例如,假设我们要构建一个简单的神经网络来判断一个水果是否是苹果。输入信号可以是水果的颜色、大小、形状等特征。每个输入信号都有一个对应的权重,权重表示该输入特征对于判断结果的重要程度。比如,颜色这个特征的权重可能会比较高,因为苹果通常有比较典型的红色或绿色。

神经元会将所有输入信号乘以对应的权重后相加,得到一个总和。然后,激活函数会对这个总和进行处理,决定神经元是否被激活。常见的激活函数有阶跃函数、Sigmoid 函数、ReLU 函数等。以阶跃函数为例,如果总和大于某个阈值,神经元就输出 1,表示是苹果;如果小于阈值,就输出 0,表示不是苹果。

(二)数学表达式

设输入信号为 (x1,x_2,\cdots,x_n),对应的权重为 (w_1,w_2,\cdots,w_n),偏置为 (b),则神经元的输入总和 (z) 可以表示为:
[z = \sum
{i = 1}^{n}w_ix_i + b]
经过激活函数 (f) 处理后的输出 (y) 为:
[y = f(z)]

三、神经网络的基本结构层次

(一)输入层

输入层是神经网络接收外部数据的入口。它的神经元数量通常取决于输入数据的特征数量。例如,在上述判断水果是否是苹果的例子中,如果我们使用颜色、大小、形状这三个特征作为输入,那么输入层就有 3 个神经元。输入层的神经元只是简单地将输入数据传递给下一层,不进行任何计算。

(二)隐藏层

隐藏层位于输入层和输出层之间,可以有一层或多层。隐藏层的神经元通过对输入信号进行非线性变换,提取数据中的复杂特征。每一层隐藏层的神经元都会对上一层的输出进行加权求和,并通过激活函数处理,然后将结果传递给下一层。

隐藏层的存在使得神经网络能够学习到数据中的深层次特征和模式。例如,在图像识别任务中,第一层隐藏层可能学习到图像的边缘、角点等简单特征,第二层隐藏层可能将这些简单特征组合成更复杂的形状,如圆形、方形等,后续的隐藏层可能进一步组合这些形状,形成对物体的整体认知。

(三)输出层

输出层是神经网络的最终输出部分,它的神经元数量取决于具体的任务。在分类任务中,输出层的神经元数量通常等于类别数。例如,在手写数字识别任务中,需要将数字分为 0 - 9 这 10 个类别,那么输出层就有 10 个神经元,每个神经元对应一个类别,输出值表示输入数据属于该类别的概率。

四、神经网络结构示例:简单的三层神经网络

假设我们要构建一个简单的三层神经网络(输入层、一个隐藏层、输出层)来进行二分类任务,如判断一个人是否患有某种疾病。

(一)数据输入

输入层有 3 个神经元,分别对应患者的三个特征:年龄、血压、血糖。假设我们有一个患者的年龄为 50 岁,血压为 130,血糖为 100,这些值就作为输入层的输入信号。

(二)隐藏层处理

隐藏层有 4 个神经元。每个输入层神经元与隐藏层的每个神经元都有连接,并且每个连接都有一个对应的权重。隐藏层的神经元会对输入信号进行加权求和,并通过 ReLU 激活函数处理。例如,隐藏层的第一个神经元接收输入层三个神经元的输入信号,经过加权求和得到一个总和,然后通过 ReLU 函数(当输入大于 0 时,输出等于输入;当输入小于等于 0 时,输出为 0)处理,得到该神经元的输出。

(三)输出层输出

输出层有 1 个神经元,因为是二分类任务,输出值表示患者患有疾病的概率。隐藏层的输出作为输出层神经元的输入,同样进行加权求和,然后通过 Sigmoid 激活函数处理,将输出值映射到 0 - 1 之间。如果输出值大于 0.5,则判断患者患有疾病;否则,判断患者未患有疾病。

五、总结

层次 功能 神经元数量 示例
输入层 接收外部数据 取决于输入数据特征数量 判断水果例子中,输入层有 3 个神经元(颜色、大小、形状)
隐藏层 提取数据复杂特征 可根据任务调整 图像识别中,不同隐藏层学习不同层次特征
输出层 给出最终结果 取决于具体任务 二分类任务输出层有 1 个神经元,多分类任务输出层神经元数量等于类别数

神经网络的基本结构虽然看似简单,但通过不同的组合和调整,可以构建出非常强大的深度学习模型,解决各种复杂的实际问题。随着研究的不断深入,神经网络的结构也在不断创新和发展,为人工智能的进步提供了源源不断的动力。