象征性游戏测试的心理测量学特性研究
来源:中国循证儿科杂志 2007年3月第2卷第2期
杨红1 史惟1 徐秀娟1 王素娟1 周水珍2 丁艳华1 徐秀1 李慧蓉1
摘要 目的 分析象征性游戏测试(SPT)的信度、效度和项目难度等心理测量学特性。方法 共有484名幼儿,年龄13~ 72个月,平均(33. 4± 12. 3)个月,参加了此项研究,包括正常组30名,年龄15~ 38个月,平均(25. 4± 7. 1)个月;脑性瘫痪(脑瘫)组138例,年龄13~ 63个月,平均(30. 1± 11. 3)个月;精神发育/语言发育迟缓组316例,年龄15~ 72个月,平均(36. 2± 12. 2)个月。以484名被测试幼儿的SPT测试结果为样本进行内在信度研究;随机选取12名幼儿进行重测信度研究(间隔4~ 11 d);随机选取18名幼儿进行评分者间信度研究(3名评分者间);分别以30名正常组幼儿的贝莉婴儿发育量表-Ⅱ(BSID-Ⅱ)和87脑瘫和精神发育/语言发育迟缓组幼儿的雷妮语言发育量表(RDLS-Ⅲ)的测试结果为效标,确定SPT的平行效度;通过分析相同月龄段正常幼儿、脑瘫幼儿和精神发育/语言发育迟缓幼儿的SPT相当月龄差异来确定SPT的结构效度(样组间差异分析);对484名被测试幼儿的SPT测试结果进行Rasch分析,确定SPT的24个测试项目在此样本群中的项目难度顺序,同时与原著提供的项目难度顺序进行比较分析。结果 SPT有良好的内在信度(克朗巴赫α系数为0. 897 2);同时有良好的重测信度(ICC= 0. 944 9,95%CI:0. 808 6~ 0. 984 1)和评分者间信度(ICC= 0. 997 2,95%CI:0. 992 6~ 0. 999 0);与BSID-Ⅱ原始分值之间的Pearson r分别为0. 755 4和0. 718 5,与RDLS-Ⅲ原始分值之间的Pearson r为0. 765 0;脑瘫组和精神发育/语言发育迟缓组各随机抽取30例15~ 38个月的患儿,SPT测试时的实际月龄与正常组幼儿的差异无统计学意义,但是脑瘫组和精神发育/语言发育迟缓组的SPT相当月龄明显落后于正常幼儿,通过本研究样本群重新确定的项目难度顺序与原著提供的难度顺序保持良好的一致性(Spearman r= 0. 924 0)。结论 SPT测试具有令人满意的心理测量学特性,包括良好的内在信度、重测信度、评分者间信度、平行效度、结构效度和稳定的项目难度顺序,可以用来测试幼儿的智力和语言发育潜能。
关键词 象征性游戏; 评估; 信度; 效度; 项目难度
对发育障碍幼儿进行早期评估有助于早期发现和诊断,用科学的评估方法可以有效地获取幼儿的可靠信息,确定其是否存在功能障碍,同时也为制定合理的康复干预计划及判断干预和治疗效果提供依据。目前标准化评估工具的引进、研发和使用正成为幼儿康复工作的重点之一[1,2]。在幼儿评估领域中,游戏的作用越来越重要,他是幼儿发展和练习新的行为和技能的主要途径[3],因此对游戏中的幼儿进行观察并与之交往,可以获得该幼儿多方面的发展信息,基于游戏的评估模型(play-based assessmentmodel)是幼儿评估模型中最自然、最符合其发展水平的评估方式,该模型要求专业人员通过与孩子一起参与游戏,在游戏的自然情境中借助玩具观察幼儿的游戏技能,由于游戏性的评估方法相当灵活,评估人员还可以根据幼儿的特殊功能缺陷和特点对游戏的情境和材料进行调整,使之更加适合特殊幼儿。
目前国内针对脑性瘫痪(脑瘫)和精神发育迟缓等发育障碍幼儿的评估工具主要集中于评判粗大运动和精细运动功能[4,5],但是针对早期语言能力的评估工具却很少。为此,我们引进了由Lowe和Costello建立的象征性游戏测试(symbolic play test,SPT)[6],希望通过该项测试了解幼儿的非语言象征性思考能力水平,从而合理地判断幼儿的语言潜能。由于早期概念的形成和发展早于理解性和表达性口语,并与之共同发展,这些能力的发展被认为是具有重要意义的语言基础,临床上可遇到许多不能适时发展出理解性和表达性语言能力的幼儿,为了合理地评价这些幼儿的语言潜在能力,有必要开发一种评估幼儿语言潜能的工具,他应该完全独立于口语的理解和表达,与一般的非语言测试或操作测试不同,他主要观察幼儿对语义关系的理解,早期概念的形成,以及用最简单方式处理符号来表达自我经验和想象的能力。 SPT测试通过观察幼儿玩弄代表日常物品的微型玩具,可以帮助我们评价幼儿对其周围世界的理解能力,该测试应用年龄为1~ 3岁,可以与其他操作或语言测试一起使用,比较幼儿在不同领域内的功能。他有助于区分哪些幼儿已经在游戏中发展出足够概念和符号(他们不能发展语言可能是由于耳聋或环境因素等其他原因);哪些幼儿尚未获得有意义经验并使用符号(他们的语言延迟或缺陷源于整体发育迟缓或某种在象征领域内的特异缺陷,比如婴儿孤独症和发育性失语)。该测试可以区分幼儿在语言潜能方面的优势或不足,通过了解幼儿的非语言象征性思考能力水平,可提示幼儿与口头语言的距离程度,为语言治疗师、老师和家长制定治疗目标提供参考建议[7]。如果测试提示幼儿尚未获得足够有意义的经验以用作语言发展,可以训练其如何有意义地使用游戏物品并把他们联系起来,这样可进一步的为语言治疗奠定基础。该测试完全是非语言的,由于测试物品的吸引力,所以非常适于测试外国语言幼儿以及那些非常害羞,退缩或不合作的幼儿。
Lyytinen等[8]对正常幼儿的研究发现幼儿在14个月时的象征性游戏测试有助于预测在2岁时的语言及认知能力, Doswell等[9]对大龄幼儿的研究也显示象征性测试结果与幼儿的语言能力显著相关。对于各种发育障碍幼儿,国外学者亦采用象征性游戏测试进行研究[10,11],他们发现发育障碍幼儿的游戏发育进程与普通幼儿相似,并且游戏测试结果与幼儿智力之间存在显著性相关。 Lowe和Costello建立SPT测试时使用的样本完全来源于正常人群[6],而SPT测试在临床上却更多地被用于评价发育障碍幼儿的语言潜能[12],所以需要进一步重新确定SPT测试在发育障碍幼儿中的心理测量学特性,包括信度、效度和项目分析,使之更具有针对性。尽管SPT测试已经在使用英语的国家的幼儿中确定了其有效性,但是在使用汉语的中国幼儿中其效度还有待于确定,而且SPT测试中的4个场景都是依据西方国家日常生活中的环境而制定,所以非常有必要确定这些文化生活背景是否影响到测试的信度、效度以及项目的难易程度。为此本研究对SPT测试的信度、效度以及项目难度进行了分析,以确定SPT在中国发育障碍幼儿测试中的心理测量学特性。
1 对象与方法
1. 1 研究对象 以2001年2月至2006年10月在复旦大学附属儿科医院康复中心接受诊治的484名幼儿为研究对象,其中男348名(71. 9%, 348 /484),女136名(28. 1%,136 /484),年龄13~ 72个月,平均(33. 4± 12. 3)个月,所有研究对象均接受过至少1次SPT测试。分为以下3组:正常组30名(6. 2%, 30 /484),年龄15~ 38个月,平均(25. 4± 7. 1)个月,其中男22名(73. 3%,22 /30),女8名(26. 7%,8 /30),均来自于高危新生儿的随访幼儿,在36个月以前常规接受SPT测试;脑瘫组138例(28. 5%, 138 /484),年龄13~ 63个月,平均(30. 1± 11. 3)个月,其中男92例(66. 7%,92 /138),女46例(33. 3%,46 /138),均符合2005年发布的国际脑瘫诊断定义[13];精神发育/语言发育迟缓组316例(65. 3%,316 /484),年龄15~ 72个月,平均(36. 2± 12. 2)个月,其中男234例(74. 0%, 234 /316),女82例(26. 0%,82 /316),36个月以前除明显表现出认知落后外,其余暂且诊断为语言发育迟缓。
1. 2 研究方法
1. 2. 1 象征性游戏测试[6] 该测试应用范围为认知或语言年龄在1~ 3岁的幼儿,测试由4个独立场景(图1)组成,每个场景配有以标准方式呈现的微型玩具,幼儿可以自由玩弄。通过对幼儿在结构化场景中的自发性非语言游戏活动进行评估,基于幼儿有意义操作玩具并将玩具联系起来的数量进行评分。其中场景一有5个测试项目(1.识别娃娃,2.匙与杯/碟,3.喂/梳/刷自己/他人,4.喂/梳/刷娃娃,5.杯子放在碟上);场景二有5个测试项目( 6.识别娃娃,7.娃娃与床,8.毯/枕与娃娃,9.娃娃放上床,10.正确使用枕头);场景三有8个测试项目(11.刀/叉与盘子,12.刀/叉/盘子与桌子,13.桌布与其他物品,14.娃娃放上椅子,15.刀/叉/盘子与娃娃,16.椅子与桌子,17.娃娃与桌子,18.桌布放上桌);场景四有6个测试项目(19.移动拖拉机或拖车,20.木条与拖拉机/拖车/人,21.人放到拖拉机或拖车上,22.人放入司机座位,23.排列拖拉机与拖车,24.联接拖拉机与拖车),共计24项,提供原始分和相当月龄两种分值。评估由指定治疗师或医生进行,环境设定为安静、独立和采光较好的房间,室温控制在20~30℃ ,幼儿衣服为1~ 2层,评估时间约15 min。
1. 2. 2 内在信度研究 以484名被测试幼儿的SPT测试
结果为样本进行内在信度研究,接受过多次测试的对象,以
首次测试结果计入统计样本。
1. 2. 3 重测信度研究 在最初的50名研究对象中依据家长的依从性和幼儿的状态选取病例,共有12例完成了由同一评估者(康复医师或语言治疗师)在第1次测试后间隔4~ 11 d进行的第2次测试,通过分析前后2次SPT的测试结果来检测重测信度。
1. 2. 4 评分者之间信度研究 在最初的50名研究对象中依据家长的依从性和幼儿的状态选取病例,共有18例完成了由3名康复医师或语言治疗师同时进行的SPT测试。在整个测试过程相互不讨论,最后记录各自测试结果。通过不同评估者测试结果的相关性来检测评分者之间的信度。
1. 2. 5 平行效度研究 研究对象中的30名正常组幼儿在接受SPT测试时同时接受贝莉婴儿发育量表测试(bayleyscales of infantdevelopment-second edition,BSID-Ⅱ),该量表适用于1~ 42个月婴幼儿,包括智力量表(178项,原始总分178分)、运动量表(111项,原始总分111分)和行为评定量表(30项)3个分量表,被认为是目前全面评估婴幼儿发育水平最为有效的诊断性工具[14,15]。通过分析BSID-Ⅱ的智力量表原始分和运动量表的原始分与SPT的原始分之间的相关性来确定两者之间的平行效度。
在研究对象中的脑瘫和精神发育/语言发育迟缓组中依据家长的依从性和幼儿的状态选取87例对象,在进行SPT测试的同时进行雷妮语言发育量表[16,17](reynelldevelopmental language scalesⅢ , RDLS-Ⅲ )测试, RDLS-Ⅲ适用于15个月~ 7岁幼儿,用以评估幼儿的语言发育水平,属于常模参照量表。包括理解量表和表达量表2部分。理解量表包括62个项目,由10个分项目组成,测试内容包括:单词理解、词语之间的基本关系(包括物品,行动者和动作)、属性和空间关系的理解、对句子中词干的理解、复杂的语法和推理技能等。表达量表也包括62个项目,由6个分项目组成。两部分量表测试结果都包含原始分、相当年龄、标准分和百分位数。每项如做出正确反应,计原始分1分;如未做出正确反应,则计为0分,原始分满分为62分。通过分析RDLS-Ⅲ理解量表的原始分与SPT的原始分之间的相关性来确定两者之间的平行效度。
1. 2. 6 结构效度研究 由于正常组幼儿的例数为30名,
年龄为15~ 38个月,所以我们从年龄为15~ 38个月的112例脑瘫组幼儿中随机选取30例,同样我们从年龄在15~ 38个月的210例精神发育/语言发育迟缓组幼儿中随机选取30例,用来比较以上两组与30名正常组的实际年龄与SPT相当年龄之间的差异。采用SPSS12.0统计软件通过抽取随机数的方法确定随机研究对象。
1. 2. 7 项目难度顺序研究 对484名被测试幼儿的SPT测试结果进行Rasch分析,确定SPT的24个测试项目在此样本群中的项目难度顺序,同时与原著提供的难度顺序进行比较分析。
1. 3 统计学方法
1. 3. 1 信度和效度 内在信度采用克朗巴赫α信度系数进行检验;重测信度和评分者间信度检测采用等级间相关系数(interclass correlation coefficient, ICC)进行比较;平行效度检测采用Pearson相关系数(r)进行比较;采用F检验和t检验进行结构效度的组间差异比较。
1. 3. 2 项目难度分析 采用Rasch分析中的等级模式(rating scalemodel)进行项目难度分析。作为项目反应理论(item response theory)之一的Rasch分析近年来在康复医学界被广泛地用于量表的信度、效度和项目分析[18、19],Rasch分析与传统项目分析理论相比有以下3个特征:①能够在共同尺度的基础上实现不同项目的能力测定(test-free personmeasurement);②在不同样本群中均可以测定出共同的项目特性测定值(sample-free item calibration);③能够精确地测定项目难易度和被测试者的能力以及他们之间的关系(multiple reliability estimation)。因此在Rasch分析下建立的量表具有良好的信度和效度,并且得出的能力分值具有等距性。传统的项目分析理论是从原始数据中直接推断出项目的难易度、信度和效度,确定原始数据与项目难易度之间的关系;而Rasch是通过对样本总体进行评价后,在被测试者的全部测试结果中确定被测试者的能力和项目的难易度以及他们之间的关系,需要有较多的测试项目和测试结果以确保分析结果的稳定性,因此通过Rasch分析获得的项目难度顺序更为可靠和稳定。本研究首先对484名被测试幼儿的SPT测试结果进行Rasch分析,确定SPT的24个测试项目在此样本群中的项目难度顺序,同时与原著提供的难度顺序进行Spearman秩相关系数(r)分析。Rasch分析采用BIGSTEPS(v2. 82版)软件的等级分模式(rating scalemodel)进行分析。其余数据采用SPSS12. 0统计软件进行分析,P< 0. 05为差异有统计学意义。
2 结果
2. 1 内在信度 以484名被测试幼儿的SPT测试结果为样本,进行内在信度研究,结果显示场景一5个项目的克朗巴赫α系数为0. 629 7,场景二5个项目的克朗巴赫α系数为0. 810 9,场景三8个项目的克朗巴赫α系数为0. 8277,场景四6个项目的克朗巴赫α系数为0. 701 0,SPT测试24个项目的整体克朗巴赫α系数为0. 897 2,表明SPT测试具有良好的内在信度。
2. 2 重测信度 12例幼儿由同一评估者(康复医生或语言治疗师)在第1次测试后间隔4~ 11d[平均(5. 9± 2. 3)d]进行第2次测试,两次测试结果比较后ICC值为0. 944 9(95%CI:0. 808 6~ 0. 984 1),表明SPT测试具有良好的重测信度。
2. 3 评分者间信度 18例幼儿由3名康复医师或语言治疗师同时进行SPT测试,结果显示3名不同评分者的测试结果之间具有很高的一致性, ICC值为0. 997 2(95% CI:0. 992 6~ 0. 999 0),表明SPT测试具有很高的评分者间信度,而且明显高于重测信度。
2. 4 平行效度 30名正常组幼儿的SPT原始分与BSID-Ⅱ的智力量表原始分和运动量表的原始分之间具有良好的相关性,Pearson r分别为0. 755 4和0. 718 5,表明SPT测试原始分与BSID-Ⅱ测试的各项原始分之间在正常幼儿中具有良好的平行效度。 87例脑瘫以及精神发育/语言发育迟缓组的SPT原始分与RDLS-Ⅲ理解量表的原始分之间有良好的相关性,Pearson r为0. 765 0,表明SPT测试的原始分与RDLS-Ⅲ的原始分之间在发育障碍幼儿中有良好的平行效度。
2. 5 结构效度 在脑瘫组中SPT测试时实际月龄在15~38个月的共有112例(81. 2%,112 /138),选取其中30例对象的平均月龄为(26. 4± 4. 2)个月;在精神发育/语言发育迟缓组中SPT测试时实际月龄在15~ 38个月的共有210例(66. 4%,210 /316),随机选取其中30例对象的平均月龄为(26. 7± 4. 8)个月,以上两组随机选取的对象与正常组SPT测试时实际月龄的差异无统计学意义(P>0.05),正常组的SPT相当月龄显著高于相同月龄阶段的脑瘫组和精神发育/语言发育迟缓组患儿,但是脑瘫组和精神发育/语言发育迟缓组患儿之间的SPT相当月龄差异无统计学意义(表1)。表明SPT测试可以有效地区分相同月龄阶段正常幼儿与发育障碍幼儿能力之间的差异。
2. 6 项目难度分析 对SPT测试获得的484个结果和24个项目进行Rasch分析,确定SPT的24个项目在本研究人群中的项目难度顺序。 Rasch分析设定的项目不适合标准(item misfit criterion)为均数平方值(MnSq,mean-squarevalues)在0. 6~ 1. 4,结果显示仅有1项为不适合项目(表2),表明SPT测试具有良好的单维性;项目难度尺度的均值标准误差为0. 16(0. 12~ 0. 26),项目分离系数(itemseparation values)为15. 43,表明24个测试项目具有较好的难度分层。 24个项目的难度顺序与适应性见表2。 通过本研究样本群重新确定的项目难度顺序与原著提供的难度顺序保持良好的一致性(Spearman r= 0. 924 0)(表2和图2),表明SPT具有稳定的项目难度顺序。
图2 原著量表与根据本研究样本群确定的项目难度顺序比较(Spearman r= 0. 924 0)
Fig 2 Comparison of item difficulty order between ourstudy and the English second edition(Spearmanr= 0. 924 0)
表1 3组对象的月龄和SPT相当月龄比较
Tab 1 Comparison ofchronologicalage and SPT equivalentage in three study groups
Group nSex(n)Male FemaleChronologicalage /months(–x± s)SPT equivalentage /months(–x± s)
Normal 30 22 8 25. 4± 7. 11) 23. 7± 6. 8
Cerebral palsy 30 22 8 26. 4± 4. 21) 18. 5± 4. 32)
Mental retardation 30 18 12 26. 7± 4. 81) 17. 4± 3. 82)
or language delaynotes:1)no difference among three groups,P> 0. 05;2) in comparisonwith normal group,F= 13. 16,P< 0. 001
表2 SPT项目难度顺序与适应性
Tab 2 Item difficulty order and item m isfit criterion
【略】
3 讨论
SPT测试是一种简单的针对早期语言阶段幼儿的筛选工具,已经在使用英语国家的幼儿中确定了其有效性,由于在测试工具中使用了适合西方国家的匙子、刀和叉,而东方国家例如中国、韩国和日本等国家在日常生活中更多地使用筷子和碗,所以有必要确定文化和语言学环境因素是否会影响测试的效度,同样也需要确定SPT测试在发育障碍幼儿中的信度,为此本研究总结了近年来收集的近500名幼儿SPT的测试数据进行心理测量学特性研究。据我们所知这是目前为止SPT测试的最大样本量的研究。
3. 1信度研究信度是确定随机测量误差对测量结果的影响程度,是评价量表的主要指标之一,信度的估计方法常用有以下几种:内在信度(内在一致性)、重测信度、评分者信度和单维性。内在信度是测定受测者在单一测试的各题目或分测试之间测试结果的一致性程度,当受测者在同一测试的题目间表现一致时,则认为该测试具有项目同质性,目前认为评价内在信度克朗巴赫α信度系数优于折半信度,一项优秀的测试至少应该具有0. 80以上的内在信度系数值[20],原著者报道的内在信度采用折半信度系数为0.81[6],而本研究得出的内在信度克朗巴赫α信度系数非常接近,为0. 90,表明SPT测试在测试发育障碍幼儿时具有很高的内在信度。重测信度和评分者信度的ICC值均> 0.90,均高于原著者报道的0. 71~ 0. 81[6],表明SPT测试很少受随机测量误差的影响,能够保持良好的稳定性,从结果中还可以发现重测信度的ICC值为0. 944 9(95% CI:0.808 6~ 0. 984 1),明显低于评分者间信度的ICC值0. 997 2(95%CI:0. 992 6~ 0. 999 0),提示SPT测试更多地会受到幼儿情绪和测试环境等因素的影响,在测试过程中应注意控制这些因素。同时从Rasch分析结果可以发现SPT测试具有良好的单维性,表明SPT测试项目之间具有同一的维度,是一种针对性很强的测试工具。
3. 2 效度研究 效度是量表编制者或使用者收集证据来支持根据量表分数所做出各种推论的过程,是量表心理测量学检验中最重要的考察因素。效度通常包括平行效度和结构效度分析。本研究以国内、外最有效的全面评估婴幼儿发育水平的BSID-Ⅱ量表和专项评价语言的RDLS-Ⅲ量表为外在效标,确定SPT与他们的平行效度,结果显示在正常幼儿中SPT测试获得的原始分与BSID-Ⅱ量表中的运动量表和智能量表的原始分之间的r分别为0. 755 4和0. 718 5,表明SPT与BSID-Ⅱ量表在正常幼儿的测试中具有良好的平行效度,为了进一步确定SPT测试在发育障碍幼儿中的平行效度,我们还采用了评价语言能力的RDLS-Ⅲ理解量表进行效度检验,结果他们之间的r为0. 765,与原著中采用相似方法获得的平行效度系数0. 78相当接近[6],提示SPT测试同样在发育障碍幼儿中具有良好的效度。量表的本质特性主要通过结构效度来体现,效度分析中最复杂和最重要的是结构效度分析,其目的是证实量表制定者当初的建构设想与临床评价结果之间的关系。本研究通过比较研究对象中正常幼儿、脑瘫和精神发育/语言发育迟缓患儿的SPT原始分差异的方法来对SPT测试进行结构效度分析。由于正常幼儿的能力较强,一般在36个月后就不适合采用SPT测试进行评价,我们选取的对象中最大年龄为38个月,而其他两组对象由于能力普遍较差,所以SPT测试可在他们超过3岁以后继续被使用,为了排除年龄变量对结构效度研究的影响,我们希望在进行3组对象间比较时,他们的测试月龄大致相似,所以我们首先以接受SPT测试的正常幼儿的月龄范围(15~ 38个月)为标准,在其他两组中各自选出112例和210例,然后再从中随机各选出30例,最后比较3组幼儿的实际月龄和SPT相当月龄之间的差异,结果3组幼儿间的实际月龄差异无统计学意义,正常组的SPT相当月龄显著高于相同月龄阶段的其他两组幼儿,脑瘫组与精神发育/语言发育迟缓组之间的SPT相当月龄差异无统计学意义,表明SPT测试可以有效地区分相同月龄阶段正常幼儿与发育障碍幼儿能力之间的差异,是一种有效的筛选工具。正常组幼儿的SPT相当月龄稍落后于实际月龄(表1),这种现象的发生可能是文化上的差异所致,例如象征性游戏测试所采用的4种测试场景、中国幼儿与国外幼儿象征性游戏经验的差异等。脑瘫组和精神发育/语言发育迟缓组的SPT相当月龄明显落后于正常组,说明这两组发育障碍幼儿的早期概念形成、象征性思维能力以及语言智力能力远落后于实际年龄应有的水平,这与精神发育/语言发育迟缓幼儿一般均存在认知、语言和智力方面的不足有关,也与一部分脑瘫患儿存在认知和语言困难相关,当然脑瘫患儿的运动障碍问题在一定程度上也可能影响幼儿顺利完成整个游戏测试过程。
3. 3 项目难度分析 项目分析是对受测者在各个测验项目上所作的反应进行统计学特征的计算和检验,其主要目的是通过对量表每个项目的检验进一步保持或提高量表的信度和效度。项目难度分析是项目分析的重要组成部分,稳定的项目难度顺序可以有效地提高量表的信度和效度,但是随着受测人群的改变,项目难度顺序也会发生变化,特别在正常人群与异常人群之间以及文化背景差异较大的人群之间更易发生,所以当遇到这些情况时项目难度分析具有重要的意义。 Rasch分析是目前确定项目难度顺序最为科学的统计学方法,在Rasch分析过程中首先需要确定检验项目的适合性,如果检验项目中的不适合项目较多,就难以完成项目难度顺序分析,因为首先需要删除部分不适合项目,在本研究中SPT的24个项目中只有1项为不适合项目(第5项,表2),所以可以在不删除原来项目的状态下确定项目难度顺序,结果显示重新确定的项目难度顺序与原著提供的难度顺序保持良好的一致性(Spearman r=0. 924 0)(图2),表明SPT在不同文化背景以及异常幼儿中依然具有稳定的项目难度顺序,同时也进一步表明SPT测试的有效性。另外从表2中可以发现第5项(杯子放在碟上)为不适合项目,而且与原著提供的难度顺序相比排位上升最为明显(从13位上升至19位),说明与原著研究对象的人群相比第5项在本研究人群中难度更大,可能是由于在中国幼儿的日常生活中“杯子放在碟上”这一情景较为少见,从而相应提高了该项目的难度,另外还可以在内在信度的研究结果中发现与其他场景相比,场景一的5个项目的克朗巴赫α系数最低,为0. 6297,而第5项恰好处于这一场景中,在删除第5项后,场景一的克朗巴赫α系数可升至0. 671 5,而删除场景一中的其他任一项目均不能提高克朗巴赫α系数,但是由于上升的幅度不是特别明显,所以是否应该删除该项目还有待于进一步的研究。
本研究的意义和存在的不足:通过本次大样本研究确立了SPT测试在中国幼儿和发育障碍幼儿中的信度和效度,表明SPT测试可用于发育障碍幼儿的智力和语言潜能评估,既有助于在繁忙的康复临床工作中早期发现、早期诊断语言和智力发育障碍的幼儿,也可以用于随访和观察干预效果,同时建议与其他的操作或语言测试一起使用,以便更加准确地判断幼儿在不同领域内的能力表现,从而制定相应的干预方案。主要不足之处在于没有对发育障碍幼儿进行更加细致地分类和分级,例如区分不同程度的精神发育迟缓,区分各类和各级脑瘫,导致难以进一步确定SPT测试在不同程度障碍幼儿中的区分效度,另外作为平行效度效标的BSID-Ⅱ和RDLS-Ⅲ量表中文版本身没有相关的信度和效度研究报道,降低了平行效度研究的可靠性。
参考文献
[ 1] ShiW(史惟), WangSj, YangH, etal. Study on reliablity andvalidity of the Chinese version of the gross motor functionclassification system for cerebral palsy. Chin J Evid BasedPediatr(中国循证儿科杂志),2006,1(2):122-129
[ 2] ShiW(史惟),LiH, WangSj, eta.l Developing the finemotorfunction measure scale by rasch analysis for children withcerebral palsy. Chin J PhysMed Rehabil(中华物理医学与康复杂志),2005,27(5):289-293
[ 3] BuchananM,CooneyM. Play atHome, play in the classroom:parent/professionalpartnerships in supporting child play. YoungExceptionalChildren, 2000,3(4):9-15
[ 4]Wang SJ(王素娟), Li H, ShiW, et a.l Evaluation of the finemotor functions by PDMS-FM in children with spastic cerebralpalsy. Chinese Journal ofRehabilitationMedicine(中国康复医学杂志),2004,19(12):900-902
[ 5] ShiW(史惟), Wang SJ, Xu XJ, et a.l Application of threegross motor measure scales in children with cerebral palsy.Chinese Journal ofChild Health Care(中国儿童保健杂志),2004,12(3):223-225
[ 6] Lowe M L, Costello AJ. Symbolic play test second editionManua.l England: NFER-NELSON, 1988. 1-20
[ 7] LewisV, Boucher J, AstellA. The assessmentof symbolic playin young children: a prototype tes.t Eur J Disord Commun,1992,27(3):231 -245
[ 8] Lyytinen P, LaaksoML, PoikkeusAM, eta.l The developmentand predictive relations of play and language across the secondyear. Scand J Psychol, 1999, 40(3):177-186
[ 9]DoswellG, Lewis V, Sylva K, et a.l Validational data on theWarwick Symbolic Play Tes.t Eur J Disord Commun,1994, 29(3): 289-298
[ 10]Cunningham CC, Glenn SM, W ilkinson P, eta.lMentalability,symbolic play and receptive and expressive language of youngchildren with Down's syndrome. J Child Psychol Psychiatry,1985, 26(2):255-265
[ 11] Power TJ, Radcliffe J. The relationship of play behavior tocognitive ability in developmentally disabled preschoolers. JAutism DevDisord, 1989,19(1):97-107
[ 12]Chiu SCH, CheungH. TheDevelopmentalRelationship Between
Early Child Language and Symbolic Play. Speech-Language-HearingAssociation of the Republic ofChina. 2001,16(11):20-34
[ 13] Rosenbaum P, Dan B, LevitonA, eta.l Proposed definition andclassification of cerebral palsy, April 2005. the definition ofcerebral palsy. DevMed Child Neurol, 2005, 47(8):571-576
[ 14]HuangHL, ChuangSF, JongYJ, eta.l Applicability ofBSID-IIin diagnosing developmentaldelay atKaohsiung area. KaohsiungJMed Sc.i,2000, 16(4): 197-202
[ 15] SchulerME, NairP, Harrington D. Developmental outcome ofdrug-exposed children through 30 months: a comparison ofBayley and Bayley-II. PsycholAssess, 2003, 15(3):435-438
[ 16]Edwards S, Fletcher P, Garman M, et a.l The reynelldevelopmental language scalesⅢ : The university of readingedition. UK:NFER-NELSON, 1997:1-69
[ 17]Cohen H, Amerine -Dickens M, Smith T. Early intensivebehavioral treatment: replication of the UCLA model in acommunity setting. JDevBehavPediatr, 2006, 27(2):45-55.
[ 18] ShiW, WangSJ, LiaoYG, eta.l Reliability and validity of theGMFM-66 in 0- to 3-year-old childrenwith cerebralpalsy. Am JPhysMed Rehabil, 2006, 85(2):141-147
[ 19] Fitzpatrick R, Norquist JM, Dawson J, et a.l Rasch scoring ofoutcomes of total hip replacemen.t J Clin Epidemiol, 2003, 56(1):68-74
[ 20]Henson, RK. Understanding internal consistency reliabilityestimates: a conceptual primer on coefficient alpha.measurement and evaluation in counseling and development,2001, 34(3):177-189