「探境科技」发布存储优先架构SFA,未来或推智能语音交互芯片
探境科技成立于2017年初,是36氪此前曾持续跟进的一家AI芯片领域的创业公司。与当前行业的不少AI芯片公司不同,探境科技提出了一种新的芯片架构和存储解决方案——在有效降低芯片功耗的同时,大幅提高硬件资源利用率的适用于各种终端设备的嵌入式AI芯片解决方案。简单来说,就是希望同时解决AI芯片的计算与存储问题。
在今天的IC world “芯星新锐专场论坛”上,公司也正式公布了其芯片采用的存储优先架构SFA。
根据探境提供的信息,对比“类CPU架构”采用的基于总线的映射方法,在同等条件下, SFA架构数据访问可降低10~100倍;28nm工艺条件下,系统能效比达到4T OPS/W,计算资源利用率超过80%,DDR带宽占用率降低5倍。
探境表示,SFA架构实现了将存储、计算、调度算法一体化,通过软硬件协同工作,控制器在各存储和计算节点进行最优的映射,可以通过OTF的方式动态更新调度算法;使用了分布式的存储和分布式的计算,可以达到较高的内部带宽和计算效率;采用数据驱动的方式,可以支持未来的可计算SRAM或其他新型存储,进一步提高计算效能。
之所以选择这一架构,与探境科技对行业的判断有关。在探境看来,当前绝大多数的AI芯片,都是基于冯诺依曼架构,与最初的CPU架构并无本质差异,其解决问题的思路在于解决计算的问题,降低计算指令衔接上的控制冗余,提高效率,以指令为中心或以计算为中心进行优化,以计算驱动存储,通过编译器构建虚拟机的思想,树立AI芯片指令集的抽象标准,对于存储资源的使用和调度,依然或依赖于编译器,或依赖于传统的缓存管理算法,这相当于用较为富裕的计算资源驱动较为稀缺的存储资源,无法解决存储墙的问题的。
CEO鲁勇分析,从更高的层面来看,在特定的工艺条件下,一定精度的计算操作下,最终的功耗都来自于MAC,所以每瓦功耗得到的算力是相对固定的,而存储所消耗的功耗和资源超过了计算部分,因此当前大多数AI芯片的能效比差别并不大,在“存储墙”问题解决前,如果在以计算为中心的指令抽象化的方向做文章,结果只能是让抽象层更加远离任务调度的实质,使得存储问题更加的恶化;换句话说,是“类CPU架构”适用于计算复杂度高,存储复杂度低的环境,当面对深度学习这个新形势时,其本身的局限性导致稀缺资源没有得到很好的利用和处理,只有重新思考深度学习所面临的存储墙问题,才能得到突破的AI芯片架构。
鲁勇告诉36氪,目前业界对“存储墙”也看到了一些解决思路,有的加大存储带宽,采用高带宽的外部存储,例如HBM2,这样不惜功耗,仅提高性能;有的采用分布式片上存储,抛弃DDR,达到几百MB的SRAM,成本非常可怕;有的以算法精度、应用范畴为代价,设计低比特权重的神经网络,无法满足通用神经网络的计算;有的在存储单元内部的设计计算单元的新型存储器,进行存算一体化(In Memory Computing),商用化道路较长;因此,探境科技重新思考存储和计算的关系,以存储驱动计算,直接从应对“三高”特性出发设计与“类CPU架构”完全不同的计算架构,即存储优先架构SFA。
探境规划,未来将围绕安防市场、工业智造、消费类市场、自动驾驶等几个领域开拓市场,并推出相关产品。值得关注的是,此次语音芯片也被提及。
延伸阅读:
《AI芯片之争白热化的当下,如何设计一款真正适用于终端的AI芯片?》