大家好,今天为大家分享一篇2026年4月10日发表在Advanced Science的文献,题目为"Ambipolar Organic–Inorganic Heterostructure Transistor Array for Integrated Visual Information Processing"。本文的第一作者是Wen-Min Zhong,本文的通讯作者是Fengyun Wang、Chi-Ching Kuo和Ye Zhou。
摘要
人工智能的快速发展既带来了前所未有的机遇,也带来了重大的技术挑战,特别是在下一代计算硬件的开发方面。为了克服这些障碍,迫切需要能够提供超低功耗和高计算效率的新型芯片架构。受人脑神经结构启发的神经形态计算,代表了超越传统冯·诺依曼框架的范式转变,有望在处理能力上实现显著提升。在此,我们报道了一种基于垂直堆叠的聚合物/氧化物异质结构的双极性晶体管阵列,该阵列经过精心设计,旨在单个器件内集成电学计算与光学传感。这种晶体管能够实现电学和光学的同步调制,支持电刺激下的突触传递和光输入下的动态视觉信息处理。该集成阵列系统展示了对视觉处理、分类和预测任务的高效、低功耗执行,凸显了其在实时交通分析等神经形态计算应用中的潜力。我们的研究结果为开发能够弥合传感与计算之间鸿沟的多功能、高能效的神经形态硬件铺平了道路。
图文导读
1. 仿生原理与系统架构

图1. 仿生原理与系统架构。a) 人眼视觉系统示意图。b) 人脑与突触神经元示意图。c) 基于这些器件用于动态视觉任务的硬件神经网络示意图。
本文的设计灵感源于人眼视觉系统的高效处理机制。如图1a所示,人眼的视锥细胞能将光信号转化为电信号,并在视觉皮层中进行处理,从而感知丰富的色彩。大脑的神经网络(图1b)能高效压缩视觉信息,保留关键特征。为模拟这一过程,研究团队开发了一种基于ZnO/P3HT异质结的双极性晶体管阵列(图1c)。该器件结合了突触晶体管的电学可编程性与光敏材料的视觉适应性,构建了一个集成了前端感知与内存计算的光电神经形态计算系统,能够处理带有时间特性的图像序列。
2. 器件结构与电学性能

图2. 器件结构与电学性能。(a) ZnO和(b) P3HT层的原子力显微镜图像。(c) 晶体管的转移特性曲线。(d) 负栅压和(e) 正栅压下晶体管的输出特性曲线。(f) 器件在正栅极电压脉冲下的漏极电流(I_ds)响应。(g) 器件在负栅极电压脉冲下的I_ds响应。(h) 器件的耐久性性能。(i) 器件的保持性能。
图2展示了器件的微观形貌与基础电学特性。器件由底部的金栅极、Al₂O₃绝缘层、n型半导体ZnO层和p型半导体P3HT层堆叠而成。AFM图像(图2a, b)显示了ZnO和P3HT层的表面形貌,其平整度对载流子传输至关重要。转移特性曲线(图2c)证实了器件的双极性(ambipolar)工作模式,即在正负栅压下分别导通电子和空穴。输出特性(图2d, e)符合典型的晶体管行为。对器件施加正负电压脉冲(图2f, g)时,其电流响应分别模拟了生物突触的兴奋(增强)和抑制(减弱)行为。耐久性和保持性测试(图2h, i)表明,该器件可承受超过10⁵次脉冲循环,且状态稳定超过10⁴秒,显示出优异的可靠性。
3. 阵列集成与神经形态计算应用

图3. 阵列集成与神经形态计算应用。(a) 16×16晶体管阵列的光学显微镜图像。(b) 阵列在低电导状态和(c) 高电导状态下的电导分布图。(d) 通过脉冲调制实现的长时程增强(LTP)和长时程抑制(LTD)特性,展示了多级电导调控能力。(e) 10个LTP/LTD循环的重复性测试。(f) 使用该阵列进行俄罗斯方块图案识别任务的示意图。(g) 训练前的电导状态分布。(h) 经过50个训练周期后的电导状态分布。(i) 训练后由电导差异表示的突触权重图。(j) 俄罗斯方块任务在50个训练周期内的识别准确率。
研究团队将单个器件集成为一个16×16的阵列(图3a),用于执行识别任务。阵列显示出良好的均匀性(图3b, c),其变异系数在低电导态和高电导态下分别为1.40%和1.81%。通过施加连续的脉冲,可以精细地、可逆地调节器件的电导,模拟生物学习和遗忘过程中的长时程增强(LTP)和长时程抑制(LTD)(图3d, e)。为了验证阵列的学习能力,研究人员设计了俄罗斯方块图案识别任务(图3f)。经过50轮训练后,阵列的突触权重从随机分布演变为结构化图案(图3g, h, i),识别准确率从最初的14%提升至100%(图3j),证明了该阵列具备有效的学习能力。
4. 光响应特性与动态行为

图4. 光响应特性与动态特性。(a) 开尔文探针力显微镜(KPFM)测量示意图。(b) P3HT薄膜在红、绿、蓝单色光照射下的KPFM表面电势图像。(c) 不同波长光照下载流子产生机制示意图。(d) 光电响应测试示意图。(e) 单个光脉冲照射后的短时程记忆(STM)性能和衰减时间常数。(f) 配对脉冲易化(PPF)特性。(g) PPF指数随脉冲间隔的变化。(h) 绿光脉冲数量对STM的影响(脉冲宽度=10 ms)。(i) 三种颜色光连续50次脉冲照射后器件电导的比较(脉冲宽度=10 ms)。
器件在光照下表现出独特的动态响应。KPFM测量(图4a, b)表明,器件对不同波长的光有不同的响应强度,其中绿光(525 nm)响应最强,这与P3HT材料的光吸收特性一致(图4c)。在单个光脉冲下,器件电导瞬时升高后非线性衰减,表现出短时程记忆(STM)特性(图4d, e)。同时,器件还展示了配对脉冲易化(PPF)现象(图4f, g),即第二个脉冲引起的响应强于第一个,这是一种短时程突触可塑性。连续的光脉冲可以非线性地累积,使电导基线逐步抬高(图4h, i)。这些依赖于波长和脉冲历史的动态光响应特性,为器件模拟生物视觉的颜色分辨和动态感知功能提供了物理基础。
5. 动态视觉处理与行为识别

图5. 动态视觉处理与行为识别。(a) 器件在强度递增的红光、(b) 绿光和(c) 蓝光顺序照射下的光响应。(d) 微型汽车的5级量化俯视图图像与用于视觉处理的16×16晶体管阵列。(e) 阵列对汽车的光电响应和短时程记忆。(f) 阵列的可视化动态视觉效果图。(g) 汽车驾驶行为的光电联合识别任务。
该器件的动态光响应可用于处理动态视觉信息。器件的光电流不仅依赖于波长,还依赖于光照强度(图5a-c)。利用这一特性,研究人员展示了如何识别移动物体的运动方向。如图5d-f所示,当一个移动的物体(如汽车)经过传感器阵列时,由于器件的短时程记忆效应,会在其运动路径上留下一个衰减的“轨迹”或“残影”。通过分析这个残影的亮度梯度,就可以判断物体的运动方向。基于这一原理,研究团队构建了一个包含8种运动方向的数据集,并利用硬件模拟的卷积神经网络进行训练,最终实现了100%的分类准确率(图5g),证明了该阵列能够仅从颜色特异性的残影中可靠地判别运动方向。
6. 真实世界交通场景验证与预测

图6. 真实世界交通场景验证与预测。(a) 器件在不同光强的红光、(b) 绿光和(c) 蓝光照射下的光电响应。(d) 真实世界车辆驾驶场景的视频帧。(e) 器件在视频376帧内的红光、(f) 绿光和(g) 蓝光照射下的光响应。(h) 阵列在第5帧时红色通道、(i) 蓝色通道和(j) 绿色通道的光响应可视化图。(k) 选取七辆处于不同状态的车辆用于实时交通状况预测。(l) 七辆车的实际轨迹与预测轨迹的比较。
为了验证其在复杂场景中的应用潜力,研究团队将该阵列用于处理真实的交通监控视频。器件对光强的线性响应(图6a-c)保证了对真实世界光线变化的准确捕捉。如图6d-j所示,当视频播放时,阵列的输出图像中清晰地呈现了移动车辆的运动轨迹(残影),而这些轨迹在原始的静态视频帧中是不存在的。这些残影内嵌了车辆的历史运动信息。通过分析这些时空信息,可以预测车辆的未来位置。研究团队选取了视频中的七辆车,利用其位置和光响应数据训练了一个前馈神经网络,成功预测了它们在下一时刻的轨迹,且预测结果与实际轨迹高度吻合(图6k, l),展示了该技术在智能交通等领域的应用前景。
7. 储备池计算与颜色信息编码

图7. 储备池计算与颜色信息编码。(a) 大写字母“A”的六种颜色变化及使用红光照射的8位脉冲编码方案。(b) 使用绿光照射。(c) 使用蓝光照射。(d) 对编码“11111111”进行50次试验的稳定性测试结果。(e) 带有脉冲编码的字母“A”示意图。(f) 使用8位脉冲编码进行字母识别的混淆矩阵,准确率达到100%。
除了作为突触阵列,该器件还可用于储备池计算。通过将信息编码为一系列光脉冲(例如8位二进制码),利用器件的非线性动态响应,不同的输入序列会演化为不同的最终电导状态。如图7a-c所示,由于器件对不同颜色的光响应不同,相同的编码在红、绿、蓝光下会产生不同的电导值,从而实现了更丰富的信息表达。研究团队设计了一个识别不同颜色组合的字母“A”的任务。实验证明,该编码方案稳定可靠(图7d, e),并且在分类任务中取得了100%的识别准确率(图7f),验证了这种光电编码方法的有效性。
总结与展望
本文系统地介绍了一种基于ZnO/P3HT双极性晶体管的仿生光电神经形态阵列,该阵列在单一平台上实现了传感、存储和计算的一体化。
本文的主要创新点包括:
- 1. 新型器件架构:提出了一种垂直堆叠的ZnO/P3HT有机-无机异质结双极性晶体管,能够在单个器件内同时实现电学调制(用于计算)和光学调制(用于传感)。
- 2. 感算一体化:器件在电学模式下可模拟突触功能,实现低至1.2 fJ/次的超低功耗和高达95.6%的MNIST手写数字识别准确率;在光学模式下,可直接处理视觉信息,实现了真正意义上的“传感器内计算”。
- 3. 动态时空信息处理:首次利用器件固有的“光学动态响应”(即短时程记忆和残影效应)直接在单帧图像中编码时空历史信息,成功应用于移动物体的运动方向识别和轨迹预测,超越了传统的静态图像处理。
- 4. 多功能计算范式:展示了该阵列不仅能作为传统的突触权重矩阵,还能用于储备池计算,通过8位光脉冲编码实现了对复杂颜色和时间序列信息的100%准确识别。
未来研究方向与改进:
- 1. 规模化与集成:将阵列规模从目前的64×64扩展至更大尺寸(如晶圆级),以处理更复杂的现实世界视觉任务,并探索与CMOS技术的单片集成方法。
- 2. 材料与性能优化:探索其他有机/无机半导体材料组合,以进一步优化器件性能,例如拓宽光谱响应范围、提高响应速度、增强在复杂环境下的长期稳定性。
- 3. 算法-硬件协同设计:开发专门针对此类硬件固有时空处理特性的新型神经形态算法,以最大化发挥其在动态视觉任务中的能效和性能优势。
- 4. 多模态融合:在现有光电响应的基础上,尝试集成对其他物理或化学信号(如压力、温度、气体分子)的响应能力,构建功能更强大的多模态仿生感知计算系统。