产品新闻

诺磊科技 Raymond Wu:解决 AI 应用落地“小”芯片也能办大事情

时间:2023-11-01 19:55:53 文章来源: BOBAPP官网下载IOS

  9 月 14 日 -15 日,2023 全球 AI 芯片峰会(GACS 2023)在深圳市南山区圆满举行。在第二日的高能效 AI 芯片专场中,诺磊科技创始人、CEO Raymond Wu 分享了主题为《感算一体 AI 光谱分析芯片阵列技术解析》的主题演讲。

  诺磊科技推出的集成 CIS+AI+MCU 光谱识别功能的感算一体 AI 光谱分析芯片阵列技术 Eye with Brain,能做到 1 个眼睛照顾 8 个大脑 ,还能实现对多频段光谱的检测与分析。有别于 AI 业界的传统算法,诺磊科技的产品配合高度集成机器影像辨识传感器,能独立运行实现影像侦测、追踪及识别。

  诺磊科技创始人、CEO Raymond Wu 谈道,诺磊科技在首款 110nm 工艺量产芯片 NB1001 上,结合 WLO(晶圆级光学)技术,将光学元件集成到半导体晶圆上,设计为类似于麦克风阵列的光谱检测阵列。

  Raymond Wu 还提到曾经一枝独秀的影像解决方案 CCD 由于系统体积大、成本高、功耗大、落地难逐渐被 CIS(CMOS 图像传感器)取代。这与当下 AI 应用有相似性,他认为高算力并不是能百分之百解决所有 AI 应用的手段,AI 应用的算力需求取决于具体应用的场景,单一化应用没有必要做复杂的 AI 芯片。

  大家好!你们可以叫我 Raymond,今天我要讲的不单是一个产品,我要讲的是一个市场应用的未来方向,大概至少要三四十年,这个方向都不会变。

  我不知道大家有没有用过 CIS,我是 OmniVision(美国豪威科技)的联合发起人,所以 OmniVision 的名字是我取的,在 1995 年。

  我今天讲的是方向,大家都在往这个方向走,不单是说哪一个人的产品特别,跟别人不一样,我相信我们大家几乎都一样。用豪威科技的 CIS 来说,我 1995 年的时候做出了 CIS,你们可以看,1995 年到 2023 年,二十几年了,CIS 还是没有被替换掉,各位手机上假如没有 CIS,手机就没有摄像头,摄像头完全依赖于 CIS。

  为什么讲到 CIS?我先讲一下历史,CIS 是一个方向,在 1995 年的时候市场上只有一种解决方案,叫 CCD,CCD 在市场上活了快二十年,一直到 1995 年慢慢被 CIS 替换了。

  为什么会被替换?几个大问题:一是系统体积很大,二是成本高,三是功耗很大,四是落地很难。所以要把 CCD 的解决方案做好,全世界真的没多少人会做,所以说 CCD 一直在世界上占着不可或缺的地位。

  一直到了 1995 年,CIS 出来了,CIS 就把这四个最大的问题:体积、成本、功耗、落地一次全解决了。当然你可以说,1996 年就有奇迹出现了吗?其实不是,CIS 替代 CCD 大概花了 15 年的时间,差不多到了 2005 年左右,CCD 慢慢就消失了,取代的全是 CIS。

  我今天讲的是边缘计算,我相信我们大家一定都知道 AI 应用,我们现在很多的 AI 应用,人工智能的应用,你会发现跟 CCD 有同样的问题:功耗大、体积大、又贵、落地难,这样一些问题跟 CCD 是一样的,只是 CCD 是 1995 年发生的,人工智能的应用是我们现在看到的。

  我要讲的就是,我们现在一直追求高算力,为什么一定要追求高算力呢?高算力越走越高,那应用场景是不是越来越小了。所以高算力并不是一个百分之百解决所有应用的唯一手段。

  我认为,AI应用的存在一定不是靠算力,人工智能的应用完全取决于应用。比如我今天走进门的时候,门要自己开,门开了以后门关起来了,就这么简单,我需要 20T 的算力吗?当然不用,要多少 T?像这种简单的应用,大概 0.1T、0.2T 就做完了。所以这些算力取决于你的应用,应用很单一化的话,真的没有必要去做这么复杂的芯片,简单的就可以了。

  src=我先讲一下功能,我相信在座的大家都是做 IC(集成电路)的,第一行 110nm 工艺,现在大家讲的最小也要到 22 纳米,或者 10 纳米,甚至到 7 纳米,目的是在追求算力。

  我今天要讲的是,我这 110nm 的只有 0.3T 的,我能做什么,大家有空可以到外面看一下,我们有一些方案,就是用单一芯片就能够达到人眼的追踪、手势识别,我们都可以做到。

  我们的解析度现在是 320 × 320 CIS,像素尺寸是 3um × 3um,Always on 工作模式功耗 300mW,内存 288K SRAM,就跟刚才存算一体的有很大的差别,里面除了这 288K 以外,我们在外面是没有一点芯片的,就是单一芯片。我也不要说把所有东西存在内存,所有的一颗芯片全搞定。

  这是两个完全不同的方向,一个追求高算力,另一个是怎么集成,以诺磊首款量产芯片 NB1001 为例,这个芯片连镜头都做在里面了,所以只需要在 PCB 上面打件,就可以做人脸(识别)。外面有展示,你们可以看。

  我想说的是有很多解决方案,高算力是一种解决方案,低算力在应用上假如对的话,也是一个很好的解决方案。

  我们公司做的就是把信息输入眼睛里,因为我们的眼睛已经放在 IC 里面了,所以眼睛能够正常的看到所有的东西,然后眼睛看到的东西传到 IC 里面来,大脑也在里面,记忆也在里面,所有的判断也在里面,算法也在里面,最后就是输出一个结果,比如说做剪刀石头布,它就直接跟你说剪刀石头布,外面什么都不要。所以这个做法跟想法,和现在高算法的 AI SoC 有很大的不同。

  (见 PPT)右边上面这个是我们这颗 IC 的做法,第一个,图像处理,因为只有 288k,所以单次仅读取 4 列,这 288K 里面还含着所有的固件、软件,所有的都直接灌到这 288k 里面。

  src=其中 144k 是里面的 Operation 用的。它的开发时间很短,功耗当然很低,需求量就会做得很大,因为它是最基础的 IoT 的解决方案。现在想到的,不想做的重复的动作,几乎这颗芯片都帮你做掉了。

  那这跟高算力有很大不一样,高算力第一个问题是有隐私的问题,我们因为没有存整幅的影像,隐私度非常高。另外芯片外面没有内存,开发成本也更低。

  我们公司因为是卖 IC 的,所以我们把我们的 SDK 完全公布出来了,不管任何一个人想要研发任何一个应用,想要用我们的芯片,可以来我们公司,我们会给你们一个 SDK,不收钱,也会教你怎么用,目的就是我们是卖 IC 的。

  我刚才讲的是很简单的,接下来讲的更专业。因为(芯片)面积很小,我能做出一个阵列,就跟麦克风阵列一样的,我们这个是光的阵列,这个在外面也有展示,大家等下可以去看,因为这是一个非常新的想法。

  这个芯片有一个优点,它是 WLO(Wafer Level Optic),怎么做呢?各位明白我们的 IC 都是一片一片的,现在就是把一片 8 寸的镜片直接叠在晶圆上,连续两片,就等于两片重叠,然后胶水一浇,一切,切完就是大家手上看到的东西。

  src=所以它的生产变得很快,而且非常准,它不用再调焦了,因为上面有眼睛,可是需要镜头,镜头需要调焦,用这样的做法都不需要调焦了,只要拿来以后,SMT 打在板上就可以用了,连镜头都含在里面了。这是一个预估,这是一个最快最好最准的解决方案。

  src=这个是黑白的,大家别把它当作高解析度的照相,它是一个机器识别,一般来说机器识别的解析度并没有必要到 4000 万象素或者 1000 万象素,320 × 320 就已经解决了 60%、70% 的 IoT 应用。

  大家可以看一下,人眼可以做的,我们这个 IC 都可以做得到。所以最下面这一行,它就是人眼的延伸,所以它能够做 GIGI,GIGI 的意思是能够做引导、检查、测量、识别,这四样东西完全在一个里面就能做到。

  我们公司把它取了一个名字,叫 Eye with Brain,我们现在人类是眼睛跟大脑分开,所以一个大脑要照顾两个眼睛,英伟达的芯片是一个大脑要照顾 8 个眼睛,我们是一个眼睛一个大脑,要是有两个眼睛就有两个大脑,四个眼睛就是四个大脑,完全平行处理,每个眼睛可以定义它,让它做不同的事情,所以四个眼睛可以同时做四个不同的事情。

  src=每个眼睛有它自己的大脑,它不需要 3T、5T,每个眼睛可能 1T 就够了。需要五个眼睛就用 5T,要是需要 10 个眼睛就用 10T,它是分布式的,所以每个眼睛就是 1T。

  这个影像阵列必须经由刚才的一颗一颗的小芯片来实现。我们现在做的是 2 × 3,就是 6 颗。我凭什么可以做到 6 颗,第一个是我们单颗 IC,在自然风室温下的 IC 温度只有 40 度,因为它 0.3W 的关系,所以它的整颗 IC 温度只有 40 度。也因为这样,我才有办法做成 2 × 3,因为它不会很热,所以加起来的温度散热仍旧能达到 40 度的平均温度。

  2 × 3 的并行能力、运算能力,现在不是单一芯片的高算力了,而是现在有 6 颗一般算力的加在一起用,所以它可以做海量的图像数据的并行处理。第二,它的扩展性很高,采用模块式的设计。

  诺磊 NB100X 系列中的 2 × 3 阵列有 6 颗(小芯片),大家看到为什么 18mm,因为一颗是 6mm,3 颗就是 18mm,它的宽度是 4mm,所以两颗就是 8mm,所以这边有 6 颗,所以六个大脑六个眼睛放在一起。假如说其中一颗坏了,另外一颗可以取代,所以说不用怕坏了以后总系统就坏了。

  功耗也可控,为什么?因为这六颗可以每时每刻关掉一颗两颗,用的时候再开,所以非常好控制。

  热管理对我们来说很容易,我们的应用绝对不需要风扇或者水冷,就是一般的温度就可以了。结构很规整,大家看得到,这个是在 wafer 上面的,它不是在 PCV 板上焊在一起的,是 wafer 上就连在一起的。

  可以看一下 2 × 2 阵列,所以我们测试也很快,这四颗在一个测试板上就可以测试完了。设计也可以重复利用。

  这是 3 × 3 的阵列也一样,因为我们是在晶圆上,所以它的平整度非常高,晶圆平整度绝对是世界上最高的。而且它的间距绝对不会变,它的间距一致性比在 PCB 板上的一致性好。

  还有 4 × 1 的阵列,制造简单,材料利用效率高,这方面都实现了。这也是一些它的优点:封装、良率可以提高。

  我现在讲一下结论:上面的是单颗芯片的 IC,下面是经过 IC,经过 WLO,组成 3 × 2 的产品,所以下面这个有六个大脑、六个眼睛,上面这个是一个大脑、一个眼睛。

  刚才讲的是小的应用,我现在讲一下另外一个应用,这跟刚才那个还不一样,因为我们的 IC 里面有 AI,所以能在 IC 上面加上光谱,就可接受很特定的光谱。

  比如今天要看看黄金买的是真假,那可以用这颗 IC,上面有定义好的专门检测黄金真假的光谱,一照这个 IC 就会跟你讲,你今天买的黄金是真是假。或者你买到的玉是玻璃还是石头,都可以从光谱里面直接抓出来。

  甚至以后买的肉是好是坏,多久了,坏了没有,都可经过光谱议测试出来。但是有一个差别,这个光谱议可以像一根手电筒一样照它,跟你说玉是好还是坏,黄金是真是假,都能做出来,因为每一个都有它特定的光谱,所以只要把这样的一个东西放在 IC 上的话,就可以测出来特定光谱在特定应用的真实性。

  src=(见 PPT)除了这个,我还能做成光谱的矩阵。人是两个眼睛的,所以能看到立体,四个眼睛看的立体更强烈,这是用在光谱上,所以说这一个里面可以做不同镜头的角度;第二可以做不同的光谱;第三可以把它当成很多应用来用。应用就很多了,可以做医疗健康、环保、自然生态等。

  src=这里讲的是 spectrum(光谱)可以用在哪里,可以用在调光、摄像头图像增强、增强现实等方面,刚才单颗的就是放在 VR 里面,等一下给大家放一个视频。这个就是我们实际上放在眼镜里面,追踪你眼球的移动。这是眨眼,再看另外一边。不管眼球转多快,都会跟得上。这里面没什么所谓的高算力,对 IC 来说是很简单的事。

  不知道大家有没什么问题,没有问题的话我在后面有一个展台,欢迎各位过来看,不能说黑科技,都是很普通的东西,只是大家没有讲过而已。谢谢大家!

Bob官网
bob苹果app
BOBAPP官网下载IOS