孤独症谱系障碍(autism spectrum disorders,ASD)是一种广泛性发育障碍疾病,又称为孤独症或自闭症,其主要症状为社会人际交往障碍、言语沟通表达障碍、刻板动作、兴趣活动局限以及智力障碍[1]。
近年来,ASD患病率呈上升趋势,据世界卫生组织统计,全球儿童(14岁以下)ASD患病率为0.67%。2018年美国8岁儿童ASD患病率为2.27%,2011年韩国7~12岁儿童ASD患病率为2.63%,2019年我国6~10岁儿童ASD患病率不到1%[2,3,4,5,6]。
ASD病因复杂多样,至今尚不完全清楚其发病机制,遗传因素、环境因素、围产期因素均是诱发ASD的主要原因,其中遗传因素包括家族遗传、父本基因突变遗传、染色体异常等,环境因素包括儿童家庭周围环境(空气污染程度)、母亲职业毒物接触史、孕期疾病史、孕期生活地点与儿童出生地点等,围产期因素包括胎儿早产、窒息和母亲服用药物等。
ASD患儿一般起病于出生后36个月内,3~5岁时会呈现部分明显病症[7]。
ASD的发现和治疗不及时会影响患儿终生,给其家庭带来巨大的经济负担和沉重的精神压力,因此科学有效的ASD量表对ASD患儿的前期筛查与诊断尤为重要。
研究表明,ASD量表有利于家长早期发现ASD,使患儿尽早接受专业人士的诊断和干预[8]。目前美国《精神障碍诊断与统计手册(第五版)》(DSM-5)[9]和《国际疾病分类第十一次修订本》(ICD-11)[10]是应用最为广泛的两个诊断标准。
本文基于专业使用与家庭使用的双视角对几种常见儿童ASD量表进行深层次地解析与重构,探索可用于儿童ASD筛查和诊断的新方法,旨在缓解专业人员资源短缺的问题,提高筛查与诊断的准确性,并降低误诊率和假阳性率,为儿童ASD早期干预数据的收集以及后期治疗提供可靠的科学依据。
ASD的早期筛查分为两级,一级筛查是在普通儿童里筛查出疑似ASD患儿,筛查量表有幼儿孤独症筛查量表(CHAT)、修订版幼儿孤独症筛查量表(M-CHAT)、幼儿孤独症筛查量表-23(CHAT-23)、社交反应量表(SRS)等。
若一级筛查结果为阳性则进行二级筛查,进一步筛查出疑似ASD患儿,筛查量表有儿童孤独症行为量表(ABC)、克氏孤独症筛查量表(CABS)、两岁儿童孤独症筛查量表(STAT)、孤独症谱系商数量表(AQ)等。
若二级筛查结果为阳性,则需要进行早期诊断,诊断量表有孤独症诊断访谈问卷修订版(ADI-R)、孤独症诊断观察量表(ADOS)、儿童孤独症评定量表(CARS)等,一旦确诊则需要尽早进行干预和治疗。
量表的准确性主要体现在其灵敏度和特异度。灵敏度反映量表正确诊断出阳性患者的能力,特异度反映量表正确诊断出阴性患者的能力。
相同量表筛查和诊断ASD的灵敏度和特异度不一致的原因有以下3个方面:
(1)现在最新的诊断标准是DSM-5,而目前的量表均是基于DSM-4及之前的标准编制的,与最新的标准无法对接。
例如DSM-5将DSM-4中的"社会互动"和"语言沟通"合并为"社会交往",且加入了对ASD的描述,将ASD程度划分为三个等级:需要支持(Ⅰ级)、需要较多支持(Ⅱ级),需要极大支持(Ⅲ级)[11]。这可能会影响量表的灵敏度和特异度。
(2)量表中的一些项目不适用于所有的研究对象。
如ABC中的一些项目(不会穿衣服、不会控制大小便、不能发展任何友谊等)对于12~24个月的正常儿童不能独自完成。
(3)量表的界值会影响灵敏度和特异度
国外的筛查界值不一定适用于中国的ASD筛查,原因包括人种差异、文化差异、生活习惯差异(例如中国家长哄抱孩子的频率远高于西方国家)、对孩子教育方式差异等。ABC经过汉化后将筛查分数线由原来的53分调整到31分时,信效度最高;CARS汉化后诊断界值为30分时,信效度、灵敏度、特异度均良好,使用价值最高;中文版CABS将诊断界值改为14分时,具有较好的信效度。
1.1CHAT的演变
1992年BARON-COHEN等[12]编制了CHAT,该量表由两部分共14个项目构成。第一部分由专业人士询问儿童抚养人,完成9个是非判别问题,涉及象征性游戏、社交兴趣、运动发展、指向性行为和共同注意力等方面;第二部分有5个项目,需要专业人士观察儿童的行为,根据目光接触、注意力、假装游戏、原始指向和搭积木等表现进行评定。完成该量表大约需要5 min,耗时短、易操作。但是>24个月的患儿就诊时,需要抚养人回忆或调用患儿18个月时的表现和活动录像来判断。2000年BAIRD等[13]以ICD-10和ADI-R为标准,采用CHAT筛查ASD患儿的灵敏度和特异度分别为0.38和0.98。
2001年ROBINS等[14]将CHAT修改成M-CHAT,在CHAT的第一部分增加了14个项目,即一共23个是非判定问题。增加的项目涉及眼神交流、声音敏感性、模仿能力、共同注意力、社交回应,以及指令性行为等方面。2016年KIM等[15]以ADOS-2和ADI-R为标准,证实M-CHAT筛查ASD患儿的灵敏度和特异度分别为0.52和0.84。2016年黄春等[16]以DSM-5和ABC为标准,采用M-CHAT筛查ASD患儿的特异度为0.95。
CHAT-23是将M-CHAT的第一部分与CHAT的第二部分结合起来的一种新的中文筛查量表[17]。CHAT-23分为两部分,A部分是家长自填问卷,有23个是非判定问题;B部分由专业人士直接观察,有4个项目,包括眼神交流、原始指向、假装游戏和无陈述指向。CHAT-23的创新点是将筛查分两步,先通过A部分确定可能为阳性病例,然后再经过专业人士进行B部分的观察。2016年龚俊等[18]以DSM-5和CARS为标准,采用CHAT-23筛查ASD患儿的灵敏度和特异度分别为0.85和0.98。2018年龚俊等[19]以DSM-5和CARS为标准,再一次采用CHAT-23筛查ASD患儿,结果表明CHAT-23的灵敏度和特异度均为0.97。
1.2 SRS
2005年CONSTANTINO等[20]编制了SRS,该量表主要强调儿童的社交行为能力,将社交能力进行量化从而评估儿童的社交情况。SRS由社交知觉、社交认知、社交沟通、社交动机和ASD行为方式[21]5个子量表构成,共包含65个项目。2018年LI等[22]以DSM-4和ABC为标准,采用SRS筛查ASD儿童的灵敏度和特异度分别为0.60和0.78。自2010年以来,彭新贤等[23]以DSM-5、ABC和CARS为标准,采用SRS筛查ASD患儿的原始切点、灵敏度和特异度分别为59.80、0.95和0.90。
2.1 ABC
1978年KRUG等[24]编制了ABC,该量表主要强调ASD患者的感觉、行为、情绪及语言,共包含57个条目,涉及5个方面:感觉能力、沟通能力、语言能力、运动能力和社会生活自理能力。杨晓玲等[25]在1993年对ABC进行汉化,与原版相比,虽然内容没有改变,但是建议筛查的分数由原来的53分调整为31分,使ABC更适用于中国ASD患儿的筛查。2005年李建华等[26]以DSM-4为标准,采用ABC筛查ASD患儿,结果表明ABC以31分为筛查界值最好,灵敏度和特异度分别为0.89和0.97。2013年王冰等[27]以DSM-4为标准,采用ABC筛查ASD患儿的灵敏度为0.5,特异度高达1.0。
2.2 CABS
1969年CLANCY等编制了CABS[28],该量表共包含14个项目,由抚养人根据孩子最近1个月的情况填写。2005年李建华等[26]以DSM-4为标准,采用CABS筛查ASD患儿,结果表明CABS以6分为筛查界值最好,灵敏度和特异度分别为0.82和0.91。2006年张琴[29]把65例已确诊ASD的患儿和65例非ASD患儿混合在一起,采用CABS来筛查ASD患儿,结果表明CABS的灵敏度和特异度分别为0.82和0.88。
2.3 STAT
1997年STONE等[30]编制了STAT,该量表共12个项目,涉及4个方面:游戏能力、共同注意能力、模仿能力和要求能力,主要用于筛查24~36个月的ASD患儿。2008年STONE等[31]以DSM-4-TR(DSM-4修订版)和ADOS为标准,采用STAT筛查24个月龄以下的ASD患儿,结果表明STAT以2.75分为筛查界值最好,灵敏度和特异度分别为0.95和0.73
2024年第二期ADOS-2孤独症诊断国际认证培训报名中
2.4 AQ
2001年BARON-COHEN等[32]编制了AQ,该量表包括儿童版(AQ-Child)、青少年版(AQ-Adol)和成人版(AQ-Adult)。AQ由社交技巧、注意转移、细节关注、言语交流和想象力5个子量表构成,共50个项目。AQ-Child包含的项目与AQ-Child和AQ-Adult基本是一致的,分数越高表明ASD的可能性就越大。BARON-COHEN等[33]研究表明,AQ-Child以76分为筛查界值最好,灵敏度和特异度均为0.95。2018年李洪成等[34]以DSM-4为标准,采用AQ-Child筛查ASD儿童发现37分为筛查界值最好,灵敏度和特异度分别为0.96和0.90。
3.1 ADI-R
1994年LORD等[35]在孤独症诊断访谈问卷(ADL)的基础上修订成ADI-R,该量表被欧美国家认定为诊断ASD的金标准之一,该量表共有56个项目,其中有3个核心部分,分别为社会交往(16项)、语言和沟通(13项)、刻板重复行为(8项),另外还有判断起病的年龄(5项)、非诊断项目(8项)以及特殊天赋(6项)。目前,ADI-R在国外被广泛使用,但因ADI-R的诊断需要具有较高的专业知识和从业技能的专业人士评测,所以该量表在国内还未被广泛使用。2006年RISI等[36]以Best Estimate临床诊断为标准,采用ADI-R诊断3岁以上美国ASD患儿的灵敏度和特异度分别为0.89和0.59。
3.2 ADOS
1989年LORD等[37]在其本人前期编制的ADOS基础之上,通过观察儿童在游戏中的行为、语言交流、交往和想象力进行诊断。ADOS分为4个模块(M1、M2、M3和M4),使用模块取决于儿童的发育状况和表达能力。M1主要针对的是没有短语能力,但是能交流的儿童;M2针对的是有短语能力,但语言不流畅的儿童;M3针对的是语言流畅,且能用玩具进行游戏的儿童;M4针对的是有社交和情感感受的青少年和成人。目前,2006年修订的ADOS最新版本在全世界被广泛使用[38]。2004年BÖLTE等[39]以ICD-10和DSM-5为标准,采用ADOS筛查ASD患者,结果表明其对ASD和非典型ASD的灵敏度和特异度分别为0.90和0.48。
3.3 CARS
1980年SCHOLER编制了CARS,该量表共有15个项目,涉及与他人关系、模仿、情绪、肢体动作、适应能力、视觉反应、听觉反应、嗅觉反应、语言交流、智力等方面。评估者通过观察、询问,以及从病史中收集数据,根据行为的古怪、频率、严重程度、持续时间进行打分,CARS具有高灵敏度(0.98)和高特异度(0.85)[40]。2003年李建华等[41]以DSM-4为标准,引进汉化CARS并诊断ASD儿童,结果表明CARS以30分为诊断界值的灵敏度和特异度均为1。目前,该量表也是我国常用的ASD诊断工具。
综合前期各类ASD筛查和诊断量表的功能性与差异性,可从相应量表的适用年龄、评估方式、计分方法和评定标准等方面进行综合考量。
目前ASD儿童的发病年龄逐渐提前,甚至在24个月之前就会出现ASD的相关症状。研究表明≤24个月的儿童神经塑性强,行动问题还不突出。
早期行为干预能够明显改善ASD患儿的认知、语言和适应能力。因此表1以24个月为界点分类,适用于≤24个月的儿童筛查量表有CHAT、M-CHAT、CHAT-23、STAT和ABC,这些量表均可以在早期筛查出ASD患儿,从而尽早地进行诊断和干预,得到有效治疗;适用于>24个月的儿童筛查量表有M-CHAT、SRS、ABC、CABS、STAT、AQ,其中M-CHAT、ABC和STAT使用的范围广,不仅适用于≤24个月儿童,还适用于>24个月的儿童,ABC、SRS、CABS和AQ更加针对的是>24个月的儿童。
这些量表均涉及儿童的三大类核心症状,即社会沟通、社会交往和重复的行为及兴趣。由于适用年龄的不同,量表的内容上也有部分不同。≤24个月的儿童语言表达不够流利,行动不够自如,所以CHAT系列量表和STAT中的内容更加适用。
例如M-CHAT中第6项,"孩子曾用手指指着东西,要求要某样东西吗?";CHAT-23中第14项,"当你叫孩子的名字时,孩子会回应你吗?";STAT中点心时间和泡泡活动均只需要儿童有目光的伴随及发声即可。>24个月的儿童语言表达、理解能力和行动能力均较好,所以ABC、SRS、CABS、AQ中的内容更加适用。例如ABC中第56项,"在日常生活中至少会用15个但又不超过30个短句来进行交往。";CABS中第6项,"以手势表达需求"(正常的儿童是可以用语言清楚的表达);SRS中第44项,"不能理解事件的相互关系"和第48项"有幽默感,能理解笑话"。
适用于≤24个月儿童的诊断量表只有ADOS,所以≤24个月儿童的诊断还不够完善。适用于>24个月儿童的诊断量表有ADI-R、ADOS和CARS,其中ADOS使用的范围更广。众所周知,幼儿期女童的生理发育与心理发育速度均普遍快于男童,尤其表现在语言能力和小动作行为能力上[42]。例如女童比男童开始说话早,说话的流利程度比男童好。男童和女童在大脑发育上存在很大的差异,女童更容易立体分析和处理信息,男童的精力更加旺盛,在大动作的发育中远超过女童。因此在24个月以内,男童和女童是否能够用同一个量表,还有待研究。
目前,常用的ASD筛查量表和诊断量表可以分成三类,第一类是由抚养人填写问卷,第二类是由专业人士观察评估,第三类是将抚养人填写问卷和专业人士观察结合起来评估。
如表1所示,M-CHAT、SRS、ABC、CABS、AQ是由抚养人根据患儿平时的行为和语言沟通及抚养人的回忆填写的,这样更加便捷,在家里就可以完成。
STAT由专业人士通过游戏互动的方式观察患儿在评估中的表现,例如STAT中的娃娃游戏,即给患儿娃娃或布偶,再加上家具、饮食器皿,观察患儿能否做出一些功能性的游戏(过家家);气球活动,即在患儿面前吹气球后放气,使气球在室内飞,观察患儿是否伴随目光移动和发声;以及汽车模仿,即在桌子上来回滑动汽车,鼓励患儿模仿动作,这样会使筛查更具有专业性。
CHAT和CHAT-23将抚养人填写问卷和专业人士观察结合起来进行评估,如CHAT中的A部分是询问抚养人,如"孩子喜欢玩躲猫猫吗?""孩子喜欢爬楼梯吗?"和"孩子能拿件东西走到你面前给你看吗?";B部分是专业人士通过游戏和指令性行为观察患儿的情况,如"见面时,孩子与你有眼神接触吗?",给孩子一个茶杯和茶壶,说"你能给洋娃娃喝茶吗?"观察孩子是否假装倒茶给洋娃娃喝和孩子是否可以用积木搭建城堡。虽然这样花费的时间较长,但是更具有准确性、全面性和专业性。
每个家庭的生活环境和每个诊疗室的环境不尽相同,即使同一个儿童在不同的环境下进行同样的量表筛查,其分数亦会有所差异,这会影响ASD筛查的准确性。因此场景标准化是必要的,即制订标准化的氛围场景以及交谈剧本,让患儿在相同的氛围下进行量表筛查,以减少外部环境的特异化影响,降低筛查与诊断中的主观性,提高量表的准确性。
目前所用的ASD诊断量表均需要医院专业人士观察、评估才能进行诊断,可能使专业人士在短期内不能全面了解患儿。因此抚养人填写问卷、专业人士观察和两者结合的评估对筛查与诊断效能有所影响。
3.1 ASD筛查量表的计分方法和评定标准
目前,常用的ASD筛查量表的计分方法主要包括两种:2点计分法和4点计分法。如表2所示,CHAT、M-CHAT和CABS属于2点计分法,分为两个方面"是"或"否"。其中CHAT和M-CHAT设置了关键项目,即判定是否患ASD的决定性项目。如M-CHAT,6个关键项目(2、7、9、13、14、15)中有2项及以上为"是"时,即为高度疑似ASD患者;若第11、18、20、22个项目为"是",其余项目为"否",即为疑似ASD患者。
CHAT-23、SRS和AQ属于4点计分法,分为4个方面"没有""偶尔""有时"和"经常"。如CHAT-23中第16项为2点计分法,其余各项为4点计分法。CHAT-23中的4点计分法有所不同,将"没有"和"偶尔"算作"否",将"有时"和"经常"算作"是"。而且CHAT-23有3种评定标准,第一种是A部分23个项目中有6项及以上项目为"是";第二种是A部分中的7个关键项目(2、5、7、9、13、15、23)中有2项及以上为"是";第三种是B部分4个项目中有2项及以上为是,就可以判定为高度疑似ASD患者。
ABC量的计分方法是每项的评分根据其在量表中的负荷大小给予1、2、3、4级评分。国外版的评分标准是总分>53分为疑似ASD患者,总分>67分为高度疑似ASD患者;中文版的评分标准是总分>31分为疑似ASD患者,总分>67分为高度疑似ASD患者。
3.2 ASD诊断量表的计分方法和评定标准
常用的ASD诊断量表的计分方法和评定标准如表3所示,其中CARS共有15个项目,根据使用者异常行为表现的严重程度进行7点计分,即1、1.5、2、2.5、3、3.5、4分制;总分<30分无ASD,总分为30~35分为中度ASD,总分≥36分为重度ASD。虽然这些计分方法和评定标准很灵活,但存在较大的主观性,其有效性有待大规模临床证据来验证。
2点计分法是从正面和负面2个点展开,如"是"或"否"和"通过"或"未通过",有利于计分者便捷地计分,不需要考虑程度,但同时也模糊了是与否的边界。4点计分法同样是从正面和负面两个点展开,但是分别在正面和负面中再展开2个点,一共4个点,如"没有""有时""经常""总是"。这样可以使计分者根据患者的表现程度更加具体、准确地进行计分,但同时也提高了计分者对患儿的了解程度和对这4个点的判断能力,从而使量表更具主观性。
因此可以对"偶尔""有时"和"经常"进行一个标准量化,例如CHAT-23中第14项,"当你叫孩子的名字时,他会回应你吗?"可以将"偶尔"标准化为一周1~3次,"有时"标准化为一周4~8次,"经常"标准化为一周8~15次,但对于具体标准化的量值还有待研究。
目前大部分的量表可以大致分为两类:一类是家庭用的量表,在家里就可以填写问卷,同时可以根据儿童的年龄选择相应的量表,例如M-CHAT、SRS、ABC、CABS、AQ等量表。这些量表的缺点在于家长没有相关的专业知识,对量表的把握程度不高。另一类是专业人士使用的量表,需要在医院或机构进行筛查,如CHAT、CHAT-23、STAT、ADI-R、ADOS、CARS,其中ADI-R和ADOS的检测人员是需要考取相关资格证后才能进行评估,所以这类量表在我国应用的范围比较小。
在医院或机构进行筛查,患儿会因为环境和与人交流产生恐惧和退缩等情绪,从而影响量表的准确性。为此可以设想将量表与人工智能结合起来,分别应用于家庭场景、学校和机构场景、医院场景。在这三个场景中分别安装云台系统,用摄像头识别和记录患儿在三种环境下的行为和面部情绪,通过深度学习算法进行诊断,做到对ASD患儿的动态评估,也为后续的干预治疗提供数据支持。
人工智能诊断可以对患儿每一刻的行为和表情进行记录,若超出预警线,则先做出标记,通过多次记录进行机器学习等算法计算,将得到的数据进行分析处理可以及时做出诊断使诊断并的时间减少,提高了诊断速度,具有更好的稳定性、准确性和精确度。同时避免了专业人士的主观性和偏向性,提高了专业人士的工作效率,降低了成本、误诊率和假阳性率。虽然人工智能应用于ASD的筛查、诊断和治疗干预对目前很多ASD患儿的家庭来说还处于犹豫状态,需要很长的过程才能被医生和家长认可,但是这种交叉技术必将正面影响ASD早期筛查的发展方向。