教AI做件简单的事：从零开始构建首个神经网络

本文转载自公众号“读芯术”(ID：AI_Discovery)。

很长时间以来，我一直对构建神经网络跃跃欲试，现在终于有机会来研究它了。我想我并没有完全掌握神经网络背后的数学原理，所以先教人工智能做一些简单的事情吧。

7n26Rj3.jpg!mobile

代码原理

神经网络并不是一个新概念，1943年，由沃伦·麦卡洛克(WarrenMcCulloch)和沃尔特·皮茨(Walter Pitts)首次提出。

我们将构建一个没有隐藏层或感知器的单层神经网络。它由一个包含训练示例、突触或权重以及神经元的输入层和一个含有正确答案的输出层组成。神经网络图形如下所示：

M77Vnyv.jpg!mobile

此外，需要了解一些如sigmoid和导数之类的数学概念，以清楚神经元的学习方式。神经元只需进行简单操作，即取一个输入值，乘以突触权重。之后，对所有这些乘法结果求和，并使用sigmoid函数获得0到1内的输出值。

神经元表示：

6VBjm22.jpg!mobile

Sigmoid函数：

RnYfQ37.jpg!mobile

问题界定

输入层上有数字序列。我们预期的理想结果是，在数据集样本中，如果输入第一个数字是1，则神经网络返回1;如果第一个数字是0，则返回0。结果在输出层中显示。问题集如下图：

ya6zimA.jpg!mobile

先决条件

开始编码的前提——在概念上达到一定程度的理解。

NumPY安装:

pip install numpy

安装成功，即可进入编码部分。首先，将NumPy导入Python文件中：

import numpy as np

训练神经网络

首先，创建一个sigmoid函数：

I3eIB3Q.jpg!mobile

其次，定义训练示例、输入(4×5矩阵)和输出：

vY3YJvf.jpg!mobile

接下来，通过生成随机值来初始化突触权重，并将结果排列在4×1的矩阵中：

2IryQnv.jpg!mobile

最后，构建训练模型。使用for循环，所有的训练都将在此循环中进行。调用sigmoid函数，并将所有输入的总和乘以sigmoid权重。然后采用Np.dot进行矩阵乘法。过程如下图：

UZZniu3.jpg!mobile

输出结果如下图：

rymIjyZ.jpg!mobile

现在进行神经网络模型训练，方法是计算sigmoid函数的输出和实际输出之间的差值。之后可以根据误差的严重性调整权重。多次重复这个过程，比如说一万次。定义sigmoid导数：

RnUjaif.jpg!mobile

以下是计算和调整权重的方法：

qqyUBvJ.jpg!mobile

开始学习，观察学习时长会如何影响结果。从100次迭代开始：

A3Q3m2j.jpg!mobile

开始情况比较乐观——我们的人工智能已经学会了识别模式，但错误率仍然居高不下。现在进行1000次迭代：

Q7f67rR.jpg!mobile

情况好转，继续进行10000次迭代：

fEjmayb.jpg!mobile

10万次迭代：

eENf6bi.jpg!mobile

我们可以继续更多次的学习迭代，但永远无法达到100%的准确性，因为这需要进行无限次的计算。但即使在最坏的情况下，准确率也达到了99.77%，这相当不错。

对于最终代码，我写得很漂亮，并通过函数将其分开。除此之外，在文本文件中，我还添加了一种非常复杂方法以存储权重。这样只需进行一次学习，而且需要使用AI时，只需导入权重并利用sigmoid函数即可。

import numpy as np 
from tempfile import TemporaryFile 
def sigmoid(x): 
    return 1 / (1 + np.exp(-x)) 
def sigmoid_der(x): 
    return x * (1 - x) 
def training(): 
    training_inputs = np.array([[0,0,1,0], [1,1,1,0], [1,0,1,0], [0,1,1,1], [0,1,0,1]]) 
    trainign_outputs = np.array([[0,1,1,0,0]]).T 
    np.random.seed(1) 
    synaptic_weights = 2 * np.random.random((4,1)) - 1 
            for i in range(50000): 
        inputs = training_inputs 
        outputs = sigmoid(np.dot(inputs, synaptic_weights)) 
        error = trainign_outputs - outputs 
                adjustments = error * sigmoid_der(outputs) 
        synaptic_weights += np.dot(inputs.T, adjustments) 
    data_file = open("data.txt", "w") 
    for row in synaptic_weights: 
        np.savetxt(data_file, row) 
    data_file.close() 
def thinking(inputs): 
    synaptic_weights = np.loadtxt("data.txt").reshape(4, 1) 
    outputs = sigmoid(np.dot(inputs, synaptic_weights)) 
    print(outputs) 
    return outputs 
training() 
thinking(np.array([1,1,0,1]))

ERvUzqr.jpg!mobile

图源：Pixabay

我的第一个人工智能已经准备就绪，随时可以投入生产。即使它只能在极小的数据集上识别非常简单的模式，但现在我们可以扩展它，例如，尝试教授人工智能识别图片中的内容。学无止境，精进不休!

BFNrIzV.jpg!mobile

【责任编辑：赵宁宁 TEL：（010）68476606】

代码原理

问题界定

先决条件

训练神经网络

Recommend

今日头条优化实践： iOS 包大小二进制优化，一行代码减少 60 MB 下载大小

联邦学习之一

微信直播，直奔带货？

挖大坑填不回去！Win10这王牌功能为何失败

在线陪练平台爆雷背后：AI教学难实现，25分钟课仅卖20几元

痛骂苹果的脸书，却被戳破了互联网广告的神话

AirPods Max: 数字游民的港湾

传松下最早明年开始为特斯拉生产4680新电池

央视曝光窃听黑色产业链：毫无隐私可言分分钟被监听

没想到，盲盒也成了顶流

About Joyk