万字长文，探索建筑智能前沿

这一篇总结自郑豪公众号：建筑智能研究组

是 2018-2020 年的文章精华集锦

基础知识

理论分类

对于设计认知

研究的目的是学习设计数据并将网络应用于设计的认知或理解。主题包括，提取设计中的关键特征，计算环境评估数据，校准机械臂和3D打印机的工作路径，分类或评估设计，和在设计中理解人类行为。

对于设计生成

建筑师主要使用神经网络用于生成与训练数据相似的设计方案。主题包括，生成设计图纸或模型，生成机械臂和3D打印或激光切割的工作路径。

对于辅助工具，研究的目标是为对机器学习了解有限的设计人员构建框架和插件，帮助建筑师在设计领域快速应用神经网络。

CNN

首先，卷积神经网络（CNN）是最常用的图像处理网络，其将设计数据认知为2D像素化图像或3D体素化模型（3D CNN）。只要输入数据可以表示为2D或3D矩阵并且输出数据可以表示为向量（或向量集合），我们就可以使用它，因此大多数与提取设计中的关键特征的工作都是基于CNN。

比如，当输出数据包含多个神经元时，网络可以预测图像中的多种特征。(Kim, Song, and Lee 2018)训练CNN来识别建筑家具的图像及其特征参数，例如材料和可以容纳的人数。例如，通过向神经网络输入椅子的照片，网络将反馈一系列参数，告诉用户家具的预测特征。

640?wx_fmt=jpeg

CNN 还有可能与机械臂协同工作。(Bard, Bidgoli, and Chi 2018) 通过捕捉实时图像并将其输入网络来检机械臂测制造时的缺陷。机器人抹灰工具头首先在墙上抹灰。然后将相机和投影仪的校准工具头连接到机械臂上，用于拍摄墙壁照片，然后将图像发送到网络，最后将缺陷区域投射到墙壁上，这样用户可以清楚地看到抹灰的质量，并进一步调整机械臂的工具路径，以纠正这些缺陷。

640?wx_fmt=jpeg

CNN 不仅可以处理2D矩阵，还可以通过3D卷积核进行3D矩阵运算，我们称之为3D CNN。(Newton 2018)应用3D CNN将建筑根据形状特征分类。基于三种建筑的类型，扁平的，蜂窝状的，或塔状的，3D CNN采用3D矩阵作为体素数据，并输出三种形式类型的可能性。网络结构如图2-2-3所示。由于第三维数据的扩大，需要更多的计算能力来训练这个网络，因此矩阵的大小非常受限，只有（32X32X32），它只能近似代表一个3D模型。

640?wx_fmt=jpeg

GAN

除了CNN之外，生成对抗网络（GAN）是另一种图像数据处理的机器学习网络。在网络结构中，输入和输出都是图像数据，因此GAN通常用于生成设计。

(Huang and Zheng 2018)使用GAN来寻找人工标记过的公寓平面图与真实图纸之间的关系。从标签到平面的映射展示了神经网络的设计生成能力，而从平面到标签的映射展示了设计识别能力。然而训练数据集仅包含100张图像，输入和输出数据的收集和标记还存在很大的人力困难，所以由于输出图像中仍存在模糊区域。缺乏训练数据，亦或是平面图本身的设计规则的多样性导致结果其实并不那么令人满意。

640?wx_fmt=jpeg

当然，GAN也有与机械臂相关的应用。(Rossi and Nicholas 2018)应用GAN来学习机械臂的工作路径和弯曲金属板的形态之间的关系。其中RGB值表示金属板表面上每个控制点的坐标。首先使用机械臂根据不同的路径来弯曲金属板，然后将这套数据用于训练GAN，训练后的网络可以用于生成机械臂工作路径以达到特定的弯曲效果，或者反过来根据给定的机械臂的路径预测可能的弯曲效果。

640?wx_fmt=jpeg

ANN

人工神经网络（ANN）是几乎所有神经网络的起源，它将数据视为单纯的向量或实数。因此，当应用于建筑设计时，它不能像CNN或GAN那样直接带来可视化的效果。但实际上计算机本身就是将数据储存为实数，图像只是矩阵的可视化表达，所以图像的渲染仅对人类更容易理解。因此，使用适当的数据结构来转译和概括一个设计，然后使用ANN来学习和生成设计，通常是一种更有效，更准确的方法。

(DANHAIVE and MUELLER 2018)将ANN应用于预测3D形态。通过输入16个形态控制点，网络将返回生成的结果，其中包含64个移位点。这篇论文是一个很好的案例，将设计数据转换为向量。使用线性回归最为算法核心，随机森林作为激活函数的模板，并将归一化均方根误差（NRMSE）设置为损失函数。网络结构包含具有16个神经元的输入数据和具有172个神经元的输出数据，通过该数据可以在建模软件中重建曲面。

640?wx_fmt=jpeg

(Sjoberg, Beorkrem, and Ellinger 2017) 将建筑师对设计的偏好结合到ANN的训练中，理解用户的设计偏好然后从随机生成的数据中自动选择更好的设计。对于每个训练循环，系统将根据不同的参数生成16种形式，例如每个组块的位置，然后要求设计者选择最佳的3个模型，并将它们打分为1，0.66，和0.33。然后，网络将根据设计师的分数进行训练，并自动评估下一批生成的方案，以选择最佳结果。相比传统的遗传算法或模拟退火，通过设计者给出的规则来评估数据，使用ANN的优化模式只关心评估的结果，而不是评估标准。

通过从原因到结果的学习，神经网络能确定隐藏在设计者选择背后的设计规则。设计师可能很难说出评估一个设计的具体策略，但更容易说出哪个设计更好，哪个设计不好。因此，使用神经网络来学习设计策略，也将会是本文作者之后的主要研究方向。

640?wx_fmt=jpeg

此外，当然少不了ANN与机械臂的结合。(Brugnaro and Hanna 2018)开发了一种独特的ANN，用于从人类木匠那里学习木材加工的知识，然后为机械臂生成工作路径来模拟加工木材的过程，模拟人造工艺。这种基于人类知识的机器学习来生成工作路径的方法比直接观察和模拟更有说服力。

640?wx_fmt=jpeg

RNN

上面介绍的三个网络，CNN，GAN和ANN，都需要固定数量的输入和输出神经元。如果输入或输出数据的长度发生变化，则需要将数据填充到相同的长度，或者应该使用循环神经网络（RNN）。尤其是当数据按顺序排列的情况下。所以RNN最初是为语言处理而开发的。

只有少数研究侧重于RNN的应用。比如(Luo, Wang, and Xu 2018)将LSTM网络应用于学习弯曲橡胶棒的材料特性。输入的数据是弯曲杆中80个均匀分布的点和初始材料的高度，输出的数据是每个对应点的材料厚度。

对于训练后的网络，用户可以输入任意曲线，并获得未弯曲橡胶棒的形状作为反馈。然后用户可以用输出的数据切割橡胶并根据曲率固定起点和终点，然后材料会在自身内力的作用下弯曲成输入的曲线形状。在这里使用RNN是非常合理的，因为弹性材料的棒状弯曲形式可以被重建为一系列点坐标，它们的顺序适合RNN的框架。

此外，为了获得训练数据，研究者还使用两台机械臂精确弯曲材料，确保训练的精确性。

640?wx_fmt=jpeg

聚类

之前提到的所有四种类型的神经网络都具有非常清晰的输入和输出数据，因此我们需要给定训练集来告诉网络输入和输出之间的对应关系。

我们将四个网络称为监督学习。然而，除了监督学习之外，还有一些算法可以解决特定问题，这些算法中有些不需要带有标签的数据支持学习，我们将其称为无监督学习。它们通常将输入数据聚类为几个类别，以达到标记类似的数据的作用。

(Yetiş et al. 2018)使用了K-Nearest Neighbors（KNN），一种类似于K-Means的聚类算法，用于从未标记的3D模型中对建筑元素（如柱子和墙壁）进行分类，为建筑师标记混乱的模型文件提供了一种便捷的方式。但与K-Means Clustering不同，KNN需要从标记数据进行训练。

因此，作者随机生成了建筑元素，并将数据输入KNN来训练神经网络。然后通过输入一个未标记的模型，KNN将对模型中的不同元素进行分类。

640?wx_fmt=png

另一方面是分析社会行为数据。(Yin et al. 2018)将K-Means聚类应用于分类参观者在展览空间中的停留点。

首先使用UWB跟踪记录每个访客的位置，然后将数据输入给K-Means Clustering，分为五组，找到停留位置的中心。聚类显示了访客观看展品的首选位置，这有助于改变展览空间的布局来改善用户体验。

640?wx_fmt=jpeg

上述主要讲述了常用的神经网络的基础知识和理论分类，并且举例了已经在建筑设计中应用的机器学习案例。

下面的部分，将会按照年份，来介绍最新的人工智能+建筑设计的研究论文和成果。

建筑师又在用人工智能做什么？（2019年第一期）

设计认知方向：

(Karoji et al. 2019)非常巧妙的使用了RNN这一序列模型，将行人在商场内的行为作为数据，训练了一个行为预测器，能根据行人目前的位置和朝向等信息，推断他的前进方向，进而指导商场的设计，使得在行人预计路线上有更高的商业价值。很难得看到一个RNN在建筑上的应用，将时间作为序列的导线。可以说这个研究是很有启发性的，之后在预测动态的，长度不定的，和时间有关的数据时，RNN会有很好的表现。

640?wx_fmt=jpeg

(Kato and Matsukawa 2019)使用了基于图像的神经网络，从Google地图中抓取街景图，然后使用encoder概括街景的色彩倾向。算法类似图像分类器，不过多阐述。类似的，(Cao, Fukuda, and Yabuki 2019)同样使用了基于图像的神经网络GAN来提取一张图片中的天空部分，然后快速导入算法中计算Sky View Factor (SVF) 参数，评价城市环境。(Kim, Song, and Lee 2019a)一如既往的专注CNN算法，识别建筑图像中的设计元素，比如室内照片中的椅子属性什么的。(Kim, Song, and Lee 2019b)还是延世大学的三人组，他们还用CNN对BIM模型中的元素提取出的图像做分类，然后训练了自动化分类BIM模型的神经网络。(Ng et al. 2019)同样用CNN进行图像分类，把建筑平面和剖面图区分开来。(Peng, Liu, and Jin 2019)则使用CNN来分类城市地图，对城市不同区域的平面图像的属性做标签，比如建筑密度和功能分区。

640?wx_fmt=jpeg

(Ferrando et al. 2019)把建筑理解为图结构（graph），提取建筑物中各个空间的可达性，并生成关联矩阵。然后使用基于图结构的SVM算法对建筑空间进行切割和分类，分析建筑空间设计的合理性。图结构明显要比图像结构更节省算力，但是相关的高级算法和数据结构从2018年才开始成熟。

640?wx_fmt=jpeg

(Zheng 2019)关注建筑师本身对设计的审美倾向，通过建筑师对形态的评分调查，使用神经网络拟合了特定受访者的潜在审美参数。

原先被认为无法量化的美学因素，在神经网络的辅助下得以量化被评价。计算机可以模拟建筑师的美学判断来筛选方案。

640?wx_fmt=jpeg

设计生成方向：

(Koh, Amorim, and Huang 2019) 这是一篇个人觉得特别有意思的文章。讲起来不得不提到两款游戏，一是GBA平台上的神奇宝贝（童年记忆啊），二是PC平台上的暗黑破坏神2（又是童年记忆）。

先说暗黑破坏神2，它和别的游戏不同点在于，它的地图系统是根据玩家的操作和位置即时生成的，而不是预先设计好的。它将地图元素理解为坐标和种类，然后使用重复出现的图块来生成地图。而神奇宝贝之类的远古游戏也都是这样理解地图的。这样做的好处是，地图可以被向量化，然后就有了算法介入的可能。所以这篇文章讲的是，在类似神奇宝贝的地图模式下，使用强化学习的方式来生成地图。

在现有地图的情况下，计算机决策是否扩大地图并加入新的元素，进而生成合理的城市空间。这种对建筑和城市数据的游戏性理解大大扩展了生成式设计的可能性。

640?wx_fmt=jpeg

(del Campo et al. 2019)是一篇使用style transfer做设计的文章。秉承了一贯的UPenn设计导向的做法，风格迁移算法在这里起到了生成建筑风格化图像的作用，然后建筑师依据生成的图像做二次设计，生成建筑方案。

这里需要批判一下，AI在这类的研究中并没有实质上生成什么，而是起到启发建筑师的作用，决定设计的还是建筑师本身。而算法本身的误差带来的图像模糊，却转身一变成为了所谓“参数化形态”的来源，极具讽刺性啊。

640?wx_fmt=jpeg

(Steinfeld et al. 2019)巧妙的把三维建筑形态转化成二维的三视图数据，然后通过二维的CNN神经网络作为一个设计的评价者，并使用遗传算法找出当前评价体系下（比如最像香蕉的设计）的最优房屋形态解。

区别于直接把模型给到3DCNN学习，这种数据的转译方式虽然不能描述所有形态，但却提高了形态储存的精度，加快了算法的速度。

640?wx_fmt=jpeg

辅助工具方向：

(Jiaxin et al. 2019)开发了一套ANN框架，对复杂的环境计算进行了简化，并直接得到建筑节能的应对策略。

同样的，(Lin et al. 2019)也使用了ANN框架来寻找变化的风环境下，建筑形态设计的最优应对策略。和去年张砚同学的论文比较类似，(Lorenz et al. 2019)也使用ANN来简化环境运算，得到环境模拟数据的实施反馈。

640?wx_fmt=jpeg

(Dobbs 2019)使用了聚类算法，把收集到的行为数据进行清理，剔除了不合法的数据。同样的，(Willemse, Tuncer, and Bouffanais 2019)也对他们收集到的行为位置数据做了聚类，分析城市空间中的人口密度信息。

(Sánchez-Vaquerizo and Llach 2019)除了聚类行为数据外，还使用了类似YOLO的CNN算法，利用城市摄像头来采集数据，这样大大降低了数据采集的难度。(Cheng and Hou 2019)还是使用了聚类算法，不过他们关心的是如何把无人机三维扫描得到的建筑城市模型进行简化，去除不必要的多余信息，然后重构城市模型。(Yousif and Yan 2019)的聚类算法则是关心形态的聚类，比如在生成的众多形态中，有些是相似的，不需要反复出现，因此就可以先用聚类剔除相似的形态，然后给到用户更精确的，没有重复的推荐。

640?wx_fmt=jpeg

继18年一篇研究grasshopper论坛中的主题关键词的文章后，19年也有一篇研究建筑类论文的关键词的统计学研究。

(Papasotiriou 2019)使用聚类算法对人工智能相关的词汇在建筑设计研究中出现的次数和频率等进行分析，说明近年来AI在AD领域的高速发展。

640?wx_fmt=jpeg

建筑师又在用人工智能做什么？（2019年第二期）