半导体失效分析（Failure Analysis）简介_专业集成电路测试网-芯片测试技术-ic test

为什么先进芯片越难做，越离不开FA？半导体失效分析全景图

很多人第一次听到半导体失效分析FA（Failure Analysis），脑子里会自动浮现一个画面：工程师拿着工具，把坏芯片切开、磨开、看一看，然后找出哪里烧了、裂了、短了。

这个画面不算错，但只说对了最表层的一小部分。

真正的FA，更像一场“芯片法医”式破案。

它不是单纯证明“这颗芯片坏了”，而是要回答三个更难的问题：坏在哪里、为什么会坏、怎样才能不再坏。

Intel 公开资料很早就指出，FA直接关系到产品量产爬坡、缺陷率和上市节奏；

Sony 的失效分析资料则用一个非常形象的比喻来说明今天做FA有多难：在高集成芯片里，把失效位置缩到约1微米量级，难度就像在“一个棒球场大小、八层楼高的建筑里找一枚掉落的硬币”。

也正因为如此，FA从来不是“拿到坏样就上刀”。

相反，优秀的FA流程最看重两件事：第一，尽量保留失效证据；第二，尽量在不破坏样品的情况下，把故障范围一步步缩小。

从收集失效背景、复现故障现象、判定失效模式，到电性定位、无损成像、局部开盖、逐层去层、截面观察、材料成分分析，最后再回到设计、工艺、封装、可靠性和测试环节去闭环，这才是现代半导体FA真正的样子。

文章篇幅原因，作者分享了几篇相关资料，感兴趣的小伙伴可以在公众号【芯域前沿】对话框输入：306，获取资料研读。一张表先看懂：FA到底在“干什么”

环节	典型手段	主要解决的问题	最擅长发现什么	最大限制
失效现象确认	电测、I-V（Current-Voltage，电流-电压）特性、功能复现	这颗样品到底怎么坏	开路、短路、漏电、时序异常	只能看到“症状”，看不到结构根因
无损检查	X-ray（X射线）、XRM（X-ray Microscopy，X射线显微成像）、C-SAM（Confocal Scanning Acoustic Microscopy，共焦扫描声学显微镜）、LIT（Lock-In Thermography，锁相热成像）	不拆样先看内部	分层、空洞、焊线异常、热点	分辨率或对特定结构的可见性有限
电性定位	EMMI（Emission Microscope，发光显微镜）、PEM（Photon Emission Microscopy，光子发射显微镜）、OBIRCH（Optical Beam Induced Resistance Change，光束诱导电阻变化）	把“坏的大概位置”变成“坏的具体区域”	漏电、结击穿、局部电阻异常	并非所有故障都能发光或对激光刺激有响应
物理剖析	Decap（开盖）、Delayer（逐层去层）、FIB（Focused Ion Beam，聚焦离子束）、SEM（Scanning Electron Microscopy，扫描电子显微镜）、TEM（Transmission Electron Microscopy，透射电子显微镜）	结构层面到底坏在哪里	金属断裂、空洞、桥连、栅氧损伤、接触异常	样品一旦处理不当，证据可能被破坏
材料与成分分析	EDX/EDS（Energy Dispersive X-ray Spectroscopy，能量色散X射线谱）等	坏点到底是什么材料、少了什么、混进了什么	污染物、异常元素、扩散、残留	往往要结合截面与显微观察一起解释

这张表综合了 Sony 的FA流程资料、SGS 的方法分类、Jim Colvin 的FA教程，以及 Thermo Fisher、Bruker 的器件分析资料。

01FA不是“把芯片切开”，而是先把问题问对

一颗芯片失效，表面上可能只是“功耗偏高”“不启动”“某个接口失灵”或者“通过老化后突然漏电”。

但在FA工程师眼里，这些都只是外在表现。

真正重要的是：它是稳定漏电还是偶发异常，是热相关还是时序相关 ，是电压一升就坏还是特定工作模式才坏。

Jim Colvin 的教程里提到，I-V特性实际上是选择后续分析路线的重要依据：线性响应更适合热方法，非线性问题往往更容易在光发射类方法里出现信号。

也就是说，FA第一步不是“拆”，而是“先把故障性格摸清楚”。

Sony 给出的通用流程也非常典型：先理解失效信息，再确认并复现失效现象，接着判定失效模式，之后才进入失效位置隔离，最后再做物理分析并形成报告。

这个顺序看似啰嗦，其实非常关键——因为一旦你在没有定位的情况下盲目去层、抛光或切截面，等于在一个本来就极小的嫌疑区域里又主动“抹掉现场”。

FA最怕的，不是找不到，而是把本来能找到的证据亲手破坏掉。

02先不拆：无损方法是FA里最像“医学影像科”的部分

现代FA的一个核心原则是：能不破坏，就先不破坏。

因为封装一旦被打开、金属一旦被去掉、介质层一旦被刻蚀，原始失效状态就可能改变。所以很多分析会先从无损方法入手。

X-ray与3D XRM

最常见的一类是 X-ray（X射线）与 3D XRM（X-ray Microscopy，X射线显微成像）。

它们特别适合看封装级问题，比如焊线断裂、焊线偏移、焊点空洞、die attach（芯片贴装）异常、内部裂纹等。

Matsusada 的资料提到，在树脂封装后，细至20到30微米量级的焊线已经无法通过肉眼直接观察，只能依赖高分辨率X射线系统；

ZEISS 的封装FA资料则说明，3D X-ray可以把一系列二维投影重建成三维体数据，实现数字化“虚拟切片”，在不真正切开器件的情况下查看内部结构。

C-SAM

第二类是 C-SAM（Confocal Scanning Acoustic Microscopy，共焦扫描声学显微镜）。

如果说 X-ray 更像“透视骨骼”，那 C-SAM 更像在找“层间脱粘”。

它利用声波在不同材料界面的反射差异，去识别封装内部的分层、空洞、die crack（芯片裂纹）、underfill（底部填充）空洞、bump（凸点）异常等问题。

Sage 的说明很直接：C-SAM 是一种非破坏、非侵入式方法，尤其适合在进入破坏性步骤之前，先确认这些界面缺陷是否原本就存在。

对封装分析来说，这一步很重要，因为它可以帮助区分“产品本来就坏了”与“样品在后续处理里被弄坏了”。

LIT
第三类是LIT（Lock-In Thermography，锁相热成像）。

Fraunhofer IISB 的资料显示，它通过给被测器件施加周期性激励，再用红外相机测量热响应的幅值和相位图，从而锁定电活性缺陷产生的热点。

短路、ESD（Electrostatic Discharge，静电放电）损伤、氧化层损伤、边缘终端缺陷、导电污染等，都可能在热图里露出马脚。

它的强项不是“看见金属长什么样”，而是“告诉你哪里在异常耗能”。在很多案例里，这一步恰恰是后续FIB截面的导航图。

03给芯片“通上电”追凶：EFA是把坏点缩到足够小的关键一步

如果无损方法解决的是“里面可能哪里有问题”，那么 EFA（Electrical Failure Analysis，电性失效分析）解决的就是“哪一块区域真的在电学上不正常”。

EMMI

其中最经典的方法之一，是 EMMI（Emission Microscope，发光显微镜），

也常被称作 PEM（Photon Emission Microscopy，光子发射显微镜）。

它的原理并不神秘：当器件内部某些缺陷区域在偏压下发生电子—空穴复合、结击穿或局部高场效应时，会发出极其微弱的光；

EMMI 用高灵敏度探测器把这种“失效微光”抓出来，再叠加到版图或显微图上，工程师就能看到热点在哪里。

iST 和 MA-tek 的公开说明都指出，EMMI 对 gate oxide（栅氧）缺陷、ESD失效、latch-up（闩锁）、junction leakage（结漏电）等特别有用，但对纯欧姆短路、金属短路，或者被大面积金属遮挡的埋藏点，效果可能有限。

OBIRCH

另一把“电学手电筒”是 OBIRCH（Optical Beam Induced Resistance Change，光束诱导电阻变化）。

iST 的定义非常清楚：它在器件功能测试期间，用激光从正面或背面扫描芯片，激光造成的局部温升会让异常区域的电阻变化比正常区域更明显，系统再把这种变化转成图像，定位可疑缺陷。

说得更直白一点，EMMI擅长“找会发光的异常”，OBIRCH更擅长“找受热后电阻反应异常的地方”。

很多不太发光、但有局部高阻、微短、漏电路径的故障，用 OBIRCH 反而更容易抓住。

为什么很多先进器件喜欢从背面做这些分析？

Springer 的经典章节给了答案：硅对红外光有相对透明性，因此背面访问在不少情况下更容易接近电活性区域，尤其当正面被多层金属和复杂互连遮挡时，这一点格外重要。

也正因为工艺越来越先进、金属层越来越复杂，背面分析的重要性这几年只会越来越高，不会下降。

04真正剖开真相：PFA的本质，是把“怀疑”变成“证据”

当故障位置已经被缩小到足够小的范围，PFA（Physical Failure Analysis，物理失效分析）才真正登场。

这个阶段才是很多人想象中的“把芯片拆开看”。

但严格来说，它不是粗暴拆解，而是带着定位信息的精密手术。

开盖与逐层去层

PFA通常从 decap（开盖）开始。

Sony 的资料提到，针对常见树脂封装，基本思路是通过化学方法去除封装树脂，暴露芯片表面。

拿到芯片表面后，很多故障还看不见，因为真正的问题可能埋在多层互连和介质下面，于是就要做 delayering（逐层去层）。

这一步是把金属层和层间绝缘层一层一层拿掉，尽量保持表面平整、层次清楚。

Thermo Fisher 的页面进一步说明，先进的去层强调系统性、平坦性和端点控制，否则表面一旦起伏过大，原本极小的缺陷就会被“地形噪声”淹没。

FIB

接下来，FIB（Focused Ion Beam，聚焦离子束）往往是最关键的工具之一。

Sony 的说明显示，FIB通常以镓离子束为主，能把离子束聚焦到数百纳米量级，对指定区域做亚微米级蚀刻；它不只可以切截面，还能沉积导电膜或绝缘膜，甚至用于局部电路修补。

Thermo Fisher 也强调，FIB适合对先进逻辑器件做选择性截面，配合 SEM（Scanning Electron Microscopy，扫描电子显微镜）可以快速找到表面和近表面电学故障的物理根因。

通俗地说，FIB就是那把“只切你怀疑那一小刀”的手术刀。

TEM与EDX/EDS

如果还要继续往纳米甚至原子尺度深挖，就轮到 TEM（Transmission Electron Microscopy，透射电子显微镜）和 EDX/EDS（Energy Dispersive X-ray Spectroscopy，能量色散X射线谱）出场了。

Sony 资料写得很直接：先用 FIB 从目标区域切出超薄样片，再把它装到 TEM holder（透射电镜样品杆）里做细节观察；

NIST 也指出，TEM 和 STEM（Scanning Transmission Electron Microscopy，扫描透射电子显微镜）已经是行业里识别结构与形貌特征的重要手段，只是随着结构越来越复杂，传统二维观察也面临挑战。

至于 EDX/EDS，本质上是在显微观察基础上再加一层“元素地图”，Bruker 的说明强调它特别适合做快速、可靠的半导体材料元素分析。

于是你不仅能看到“这里裂了”，还能进一步问：

o 这里是不是混进了异常元素？

o 阻挡层是不是缺了？

o 金属组成是不是不对？

这时候，FA才真正从“看见异常”走到“证明异常”。

05最难的不是“看到坏点”，而是把坏点讲成一个完整故事

做FA的人都知道，最危险的误区，就是迷信某一种工具。

看到了热点，不等于知道根因；看到了裂纹，不等于知道裂纹为什么会在那里；检测到某个元素异常，也不等于已经证明确实是它导致失效。

Jim Colvin 在教程结尾特别强调，不同FA数据之间的交叉验证非常重要，因为只有把电学、热学、光学、结构和材料证据互相对上，结论才真正站得住。

这也是为什么成熟的FA报告，通常不是“某图显示某点异常，所以结案”，而是会给出完整链条：

样品在什么条件下失效、失效是否可复现、无损手段把范围缩到哪里、EFA把热点或异常响应定位到哪一层附近、PFA在什么截面看到什么结构异常、成分分析发现了什么材料证据、这些证据如何回指到设计、工艺、封装或可靠性应力。

真正优秀的FA，最后不是产出一张漂亮的显微照片，而是产出一个经得起质疑的因果链。

而在先进制程与先进封装时代，这条因果链正在变得更难。

NIST 关于 TREM（Time-resolved Emission Microscopy，时间分辨发光显微）项目的公开说明指出，随着晶体管尺寸继续缩小、供电电压降低，发光信号变得更弱，而且一个衍射极限光斑内可能同时混入大量晶体管信号；

另一方面，NIST 也在推进面向复杂器件的电子断层与AI重建方法，试图让TEM/STEM从“看二维切片”升级到更可靠的三维定量表征。

ZEISS 的封装资料则说明，先进封装的层次复杂度已经在持续抬高无损定位和后续PFA的门槛。

换句话说，未来的FA不会减少工具，只会更强调多模态联合、自动化、三维化和AI辅助解释。

06结语

半导体失效分析FA（Failure Analysis，失效分析）真正迷人的地方，就在于它把看似冰冷的芯片，变成了一桩桩需要证据、逻辑与耐心的“技术案件”。

o 一颗异常漏电的芯片，背后可能是栅氧击穿；

o 一个突然飙高的功耗，背后可能是局部短路；

o 一个封装可靠性失效，背后可能是界面分层、焊点空洞或应力裂纹。

FA的价值，不只是找出“哪儿坏了”，更是把这次失败变成下一次设计、制造、封装和测试优化的起点。对今天的半导体行业来说，FA不是生产线末端的“补救动作”，而是贯穿研发、量产、可靠性与品质闭环的一种核心能力。

搜索

热门标签:

半导体失效分析（Failure Analysis）简介