利用人工神经网络在纳秒级时间内完成图像分类，已经成为现实！

访客2年前 (2024-04-18)AI生活220

近日，奥地利维也纳工业大学光子学研究所 Lukas Mennel 博士等人研发的一种超高速机器视觉设备——自带神经网络的图像传感器，将图像处理速度提升了几十万倍。

当地时间 2020 年 3 月 4 日，上述团队的一篇名为 Ultrafast machine vision with 2D material neural network image sensors（基于二维材料神经网络图像传感器的超快机器视觉）的研究论文发表在《自然》杂志（Nature）上。

该团队设计的视觉设备如同大脑一样处理信息，40 纳秒即可分辨出两张不同的图像。

视觉是人类认识世界最重要的一个途径，受此启发的「机器视觉」近年来方兴未艾。

所谓机器视觉，就是用机器代替人眼来做测量和判断。但机器视觉并非只是人眼的简单延伸，它还有人脑的一部分功能一一从图像中提取、处理、理解信息，从而用于实际的测量和控制。

就机器视觉技术本身而言，其主要流程是——相机逐行扫描像素，然后将视频帧转换为数字信号，再将其传输到计算机中进行分析。

不过其中存在的问题是，由于传感器与处理单元之间大量数据的移动，信息往往无法得到快速的处理、决策，这也就是机器视觉经常面临的延迟。

考虑到上述因素，研究团队在图像传感器中引入了可同时获取并分析图像的人工神经网络（Artificial Neural Network，ANN ）。

说到人工神经网络，实际上它是一种运算模型，由大量的节点（也称神经元）相互连接构成。其中，作为核心的神经元接收并处理数据，在图像识别、智能机器人、自动控制、预测估计等领域发挥着重要作用。

具体来讲，人工神经网络可以反复调整神经元之间的连接强度或“突触”，并观察当前的行为模式是否能更好地解决问题，从而发现哪些模式最擅长计算解决方案。接着，人工神经网络会将这些模式设为默认值，模仿人脑学习过程。

实际上，当天《自然》杂志的 News and Views 专栏还发表了香港理工大学博士 Yang Chai 的评论文章 In-sensor computing for machine vision（机器视觉的传感器内计算）。

在其文章中，Yang Chai 博士通过下面这幅图清晰地展现出了两种视觉处理方式的区别：

传统及其视觉处理过程（下图 a 部分）：传感器收集信号，通过模数转换器（ADC）将模拟信号转换为数字信号，放大后输入到外部人工神经网络，经参数调优训练神经网络。神经网络输入层接收编码简单物理元素的信号（点、线），随后这些信号优化为中级特征（简单形状），最终在输出层上形成图像（3D 形状）；
Lukas Mennel 团队图像传感器处理过程（下图 b 部分）：芯片上的互连传感器（图中的正方形）收集信号，并用作人工神经网络识别简单特征，减少传感器和外部电路之间的冗余数据移动。