中医治疗中风

注册

 

发新话题 回复该主题

AI开发者指南丨如何正确理解神经网络和深 [复制链接]

1#
北京看白癜风医院哪里好 https://disease.39.net/yldt/bjzkbdfyy/

神经网络定义

神经网络是一组算法,可以模仿人脑,旨在识别其模式。它们通过一种机器感知、标记或聚类原始输入来解释感官数据。他们识别的模式是包含在向量中的数字,无论是图像、声音、文本还是时间序列,都必须转换成向量。

神经网络帮助我们进行聚类和分类。你可以将它们视为存储和管理的数据之上的聚类和分类层。它们有助于根据示例输入之间的相似性对未标记的数据进行分组,并在有要训练的标记数据集时对数据进行分类。(神经网络还可以提取特征,这些特征会被提供给其他算法进行聚类和分类;因此,你可以将深度神经网络视为涉及强化学习、分类和回归算法的大型机器学习的组件。)

一些具体的例子

深度学习将输入映射到输出。它找到相关性。它被称为“通用逼近器”,因为它可以学习在任何输入x和任何输出y之间逼近未知函数f(x)=y,假设它们完全相关(例如通过相关性或因果关系)。在学习过程中,神经网络会找到正确的f,或者将x转换为y的正确方式,无论是f(x)=3x+12还是f(x)=9x-0.1。以下是深度学习可以做什么的几个例子。

1)分类

所有分类任务都依赖于标记数据集;也就是说,人类必须将他们的知识转移到数据集,以便神经网络学习标签和数据之间的相关性。这被称为监督学习。

检测人脸,识别图像中的人物,识别面部表情(生气、高兴)

识别图像中的物体(停车标志、行人、车道标记……)

识别视频中的手势

检测语音、识别说话者、将语音转录为文本、识别语音中的情绪

将文本分类为垃圾邮件(在电子邮件中)或欺诈性(在保险索赔中);识别文本中的情绪(客户反馈)

2)聚类

聚类或分组是对相似性的检测。深度学习不需要标签来检测相似性。没有标签的学习称为无监督学习。机器学习的一条定律是:算法可以训练的数据越多,它就越准确。因此,无监督学习有可能产生高度准确的模型。

搜索:比较文档、图像或声音以显示相似的项目。

异常检测:检测相似性的另一方面是检测异常或异常行为。在许多情况下,异常行为与您想要检测和预防的事情高度相关。

3)预测分析:回归

通过分类,深度学习能够建立图像中的像素与人名之间的相关性。你可以将其称为静态预测。同样的道理,如果有足够多的正确数据,深度学习能够在当前事件和未来事件之间建立关联。它可以在过去和未来之间运行回归。未来事件在某种意义上就像标签。深度学习不一定在意时间,也不一定在意尚未发生的事情。给定一个时间序列,深度学习可能会读取一串数字并预测接下来最有可能出现的数字。

硬件故障(数据中心、制造、运输)

健康问题(基于重要统计数据和可穿戴设备数据的中风、心脏病发作)

用户流失(根据网络活动和元数据预测用户流失的可能性)

我们预测得越好,我们就能越好地预防和预防。借助神经网络,我们也正在迈向一个更智能的世界,将神经网络与其他算法(如强化学习)相结合以实现更多的目标。

通过对深度学习用例的简要概述,让我们看看神经网络是由什么组成的。

神经网络元素

深度学习是我们用于“堆叠神经网络”的名称;即由多层组成的网络。

层由节点组成节点只是计算发生的地方,类似人脑中的神经元,当它遇到足够的刺激时就会激活。一个节点将来自数据的输入与一组系数或权重相结合,这些系数或权重可以放大或抑制该输入,从而为算法尝试学习的任务赋予输入重要性。这些输入权重乘积被求和,然后总和通过一个节点的所谓激活函数,以确定该信号是否以及在多大程度上应该通过网络进一步传播以影响最终结果,例如分类行为。如果信号通过,则神经元已被“激活”。

大致流程如下图所示:

节点层是一排类似神经元的开关,当输入通过网络馈送时,这些开关会打开或关闭。每个层的输出同时是后续层的输入,从接收数据的初始输入层开始。

将模型的可调整权重与输入特征配对是我们如何根据神经网络如何对输入进行分类和聚类来为这些特征分配权重。

深度神经网络的关键概念

深度学习网络与更常见的单隐藏层神经网络的区别在于它们的深度;也就是说,在模式识别的多步骤过程中,数据必须通过的节点层数。

早期版本的神经网络(如第一个感知器)是浅层的,由一个输入层和一个输出层组成,中间最多有一个隐藏层。超过三层(包括输入和输出)就可以称为“深度”学习。Sodeep不仅仅是一个流行词,它让算法看起来像是在读萨特,听你还没有听说过的乐队。这是一个严格定义的术语,表示多个隐藏层。

在深度学习网络中,每一层节点都根据前一层的输出在一组不同的特征上进行训练。越深入神经网络,节点可以识别的特征就越复杂,因为它们聚合和重新组合来自前一层的特征。

这被称为特征层次结构,它是一个复杂性和抽象性不断增加的层次结构。它使深度学习网络能够处理具有数十亿个通过非线性函数的参数的非常大的高维数据集。

最重要的是,这些神经网络能够发现未标记、非结构化数据中的潜在结构。非结构化数据的另一个词是原始媒体。即图片、文字、视频和录音。因此,深度学习最能解决的问题之一是处理和聚类世界上原始的、未标记的媒体,辨别数据中的相似之处和异常,这些数据没有人在关系数据库中组织过或从未命名过。

例如,深度学习可以拍摄一百万张图像,并根据它们的相似性对它们进行聚类:一个角落是猫,另一个角落是破冰船,还有三分之一是你祖母的所有照片。这就是所谓的智能相册的基础。

现在将相同的想法应用于其他数据类型:深度学习可能会聚类原始文本,例如电子邮件或新闻文章。充满愤怒抱怨的电子邮件可能会聚集在向量空间的一个角落,而满意的客户或垃圾邮件消息可能会聚集在其他角落。这是各种消息过滤器的基础,可用于客户关系管理(CRM)。这同样适用于语音消息。

对于时间序列,数据可能会聚集在正常/健康行为和异常/危险行为的周围。如果时间序列数据是由智能手机生成的,它将提供对用户健康和习惯的洞察;如果它是由汽车零件产生的,它可能被用来防止灾难性的故障。

与大多数传统机器学习算法不同,深度学习网络无需人工干预即可执行自动特征提取。鉴于特征提取是一项需要数据科学家团队数年才能完成的任务,深度学习是一种绕过有限瓶颈的方法。

在对未标记数据进行训练时,深度网络中的每个节点层都会通过反复尝试重构从中抽取样本的输入来自动学习特征,尝试最小化网络猜测与输入数据本身的概率分布之间的差异。例如,受限玻尔兹曼机以这种方式创建所谓的重建。

在这个过程中,这些神经网络学会识别某些相关特征与最佳结果之间的相关性——它们在特征信号和这些特征代表的含义之间建立联系,无论是完全重建还是标记数据。

然后,在标记数据上训练的深度学习网络可以应用于非结构化数据,使其能够获得比机器学习网络更多的输入。这是提高性能的秘诀:网络可以训练的数据越多,它就越准确。(在大量数据上训练的糟糕算法可以胜过在很少数据上训练的好算法。)深度学习处理和学习大量未标记数据的能力使其比以前的算法具有明显的优势。

深度学习网络在输出层结束:逻辑或softmax分类器,为特定结果或标签分配可能性。我们称之为预测,但它是广义的预测。给定图像形式的原始数据,深度学习网络可能会决定,例如,输入数据有90%的可能性代表一个人。

1)前馈网络

我们使用神经网络的目标是尽可能快地到达误差最小的点。举个例子,跑步比赛中,比赛围绕着一条赛道进行,所以我们在一个循环中反复通过相同的点。比赛的起点是我们的权重被初始化的状态,终点是那些参数能够产生足够准确的分类和预测时的状态。

比赛本身涉及许多步骤,而这些步骤中的每一步都类似于之前和之后的步骤。就像跑步者一样,我们会一遍又一遍地进行重复的动作以到达终点。神经网络的每一步都涉及猜测、误差测量和权重的轻微更新,对系数的增量调整,因为它会慢慢学会

分享 转发
TOP
发新话题 回复该主题