情景性面试和行为描述性面试的 效度对比 ●郭庆科张爱芹(山东师范大学心理学院) 摘霞:情景性面试(SI)和行为描述性面试(BDI)是结构化面试的两种主要 形式,但对二者哪个效度更高的问题国内外还没有形成一致的意见。本文 ̄'X68名大 学生为被试,平衡设计情景性和行为描述性面试题目,采用多质一多法的验证性因 素分析模型比较两种面试的构想效度,并以管理者评定为效标比较二者的效标关联 效度。结果发现BDI的因素效度更好,且BDI受评委效应和被试面试应答的社会期 望性效应的影响更小;BDI和sI的效标关联效度都较高,其中BDI略好。本研究的结 论是BD1和sI都可以成为有效的人事测评工具。只是sI需要更严格的设计和控制。 关键词:行为描述性面试;情景性面试;构想效度;效标关联效度;MTMM研究 一、问题的提出 的行为之间有非常大的相关性。BD怕勺假设则是“过去行 面试是目前人事选拔和心理健康评估中广泛使用的方 法…。面试一般分为结构化面试与非结构化面试,它们的 为是未来行为的最好预测指标”,面试中让应聘者追忆和表 述过去的某种真实的行为事件,通过对这一事件的描述评 定其心理素质。BDI要求用不带有启发性的问题提问,并 通过带有很高技巧性的追问来挖掘完整的行为信息。 Sl与BDIA9应用越来越广泛,很多研究发现两种面试 的效度都较高,而且没有明显区别。不少元分析研究表明 S『和BD睹睛 预测广泛的效标行为,包括教育年限、任务 主要区别在于允许面试官所提问题的灵活性程度,而这也 是导致非结构化面试的重测信度与复本信度较低的重要原 因 J。结构化面试的效度显著高于非结构化面试,面试的 效度会随着结构化程度的增加而提高 1o 行为描述性面试(behavior description interview, 简称BDI)和情景性面试(situational interview,简称 S1)是结构化面试的两种主要形式。SI最早是1980年由 Latham及其同事为改进传统的非结构化面试而提出的面 绩效、组织公民行为等。如Gibb ̄l:lTaylor_4 在新西兰的 社会工作者中使用匹配的情景性与行为描述性面试题目, 发现SI和BDIR,-J社会工作者的绩效都有较好的预测效度 (r-.60和r=.40 o DayKICarroll 以120名申请某课程 的大学生为被试,以学业成绩为效标,研究发现S『与BDI 试方法。其理论基础是动机理论中的目标设置理论,这一 理论认为,一个人的未来行为会在很大程度上受到他的目 标或行为意向的影响,个体为自己设置的目标或意图是未 来行为很好的预测指标。基于该假设,SlAg要点是给求职 对效标的预测效度同样好(r=_37,r=.36 o Latham ̄ Sue—Chan R,-J20个关于SI ̄I]BDI研究的元分析发现校 正后的效度系数都在.50左右。Tay Lor ̄EISmall…对30个 关于SlAg研究和19个关于BDIA9研究进行总结,发现前者 者设置一系列工作中可能会遇到的事件,并询问“在这种 情况下你会怎么做”,以此来鉴别求职者与工作相关的行为 意向,求职者对他们将来会怎么做的回答与他们将来真实 的平均效度为.45,后者为.56。 也有研究表明Sll ̄g,效度高于BDI。Latham ̄l:]Skadicki 恒 发现在相对基层职位的人才选拔中,Sl与BDIAg效 发现只有Sf与组织公民行为显著相关,BD J则不显著相关。 Klehe ̄E]Latham【。 以79个MBA学生为被试,其中男生 度并没有体现出明显差异;而在中层职位中,BDIA,O效度接 近.50,SIA9效度却出现了负值。这一结果表明SI和BD睹B 29人,女生50人,行为描述性与情景性题目平行设置,各 为9个题目,以MBA期间的团队工作成绩为效标。结果发 现SI ̄EIBDI的评分者信度分别为.83; ̄EI.92,BDI的效度系数 为.34,SlAg效度系数为.41,二者差别不明显。回归方程 中,SI在BDI之外对团队工作绩效提供了更多的变异解释 率,BDI ̄]不然。他们认为出现这一结果的原因是在研究 设计中突出了情景性面试的4个主要特征,即注重应试者的 意图、将应试者置于两难情景中、制订详细的评分细则和 适合简单职位的人事选拔,但是只有BDI适用于相对复杂 职位的人事选拔。但批评者。 认为在多质一多法分析中, 黎恒将测评的四个维度当做特质,将两种面试方法(即行 为描述和情景)当作方法,研究结果的真实性值得怀疑: Sl与BDI各维度得分及总分问均是负相关,而且Sl与效标 问也是负相关,这与国外研究结果相左,令人怀疑面试 的设计和评分的准确性。杜红等 随机抽取了某上市公 司A943位在岗中层管理人员作为面试实验对象,结果发 现SI与BDIA9信度系数都较高,而且没有明显差异。SI在 任务绩效上的回归系数为l35,在总体绩效上的效度系数 为.364;BDI在任务绩效上的回归系数为.395,在总体绩 通过前期研究筛除没有区分性的问题。四个月后,Klehe  ̄13Latham旧 又让同一批面试参与者用同伴评定的方法评 定了每个人在团队工作中的典型绩效和最优绩效,结果发 现BDI(r--.34) ̄EISI(r:.41)都能预测典型绩效,而SI ( 25)可以预测最优绩效,BDI ̄U不能(r=.1 1)。 近年来有些研究者发现SlAg预测效度,尤其是在复杂 工作中的预测效度不 ̄z1]BDI。如PuIakos和Schmitt 在 一效上的效度系数为.537。因此可认为BDIA9预测效度高于 SI。 但与国外相比,国内关于SI ̄EIBDIAg效度研究还不丰 富,我们仍然不知道在中国文化背景下哪种面试更有效, 及是否存在工作复杂性的调节作用等,该领域尚需要大量 研究加以系统探讨。本研究试图通过一个设计严格的模拟 面试,借助先进的统计方法对此问题作出探索,希望研究 结果能为我国的人事选拔工作提供建议。 种复杂工作职位的申请者中实施了SI ̄I:IBDI,每种面试 的参与者都是1O8人,结果发现SlAg效度为一.02,BDIA9 效度为.32,这使人们认为Sl可能不适用于高层职位的人 事选拔。Huffcutt等。 ¨选择59名加拿大海军军官申请人 为被试,其中男性52人,女性7人,以录取后上级对其工 二、研究方法 (一)被试 作表现的评价为效标,研究发现两种条件下SlA9效度系数 分别是_20和.02,而两种条件下BDIA9效度系数分别是.47 和.31,这支持了Sl不适合高层职位选拔的观点。Huffcutt 等¨ 对近期A954个研究进行了元分析,总样本量为 被试为某大学教育学院2005级A968名本科学生,所 有学生都是自愿参加。被试被告知参加的是一个模拟面 试,面试结果只供研究之用,不对其学绩考核等产生任何 5536,研究发现工作复杂性影响S旧勺效度,即随着工作复 杂性的增;bl:JSlA,g效度会降低,但BDIA9效度则不受工作复 杂性的影响。 可见,国外对SI和BD J的效度问题尚存在争议。有人 认为SlAg预测效度在简单工作中与BDI一样好,而在复杂 工作中不 ̄nBDI。 侣】。Klehe ̄-E]Latham等则不同意这一 影响;同时告诉他们面试过程和结果有助于其了解自身的 优势与不足,为将来的工作应聘面试积累经验。这种处理 最大限度地争取了被试的合作,在保证被试较高测验动机 的情况下将面试中的社会期望性反应(social desirability responding,简称SDR)等偏差降低到最小,使研究结 果更加客观真实,所发现的规律更有普遍性。 面试前编排被试序号,被试按照序号随机出场。 (二)面试设计与评分 探索争鸣 观点,他们认为如果严格按照S咱匀原理设计面试,则S J在 复杂职位选拔中也有很好的效度。Klehe ̄13Latham认为之 所以在有些研究中出现SI效度不高的情况,是因为面试题 目中没有设计两难处境(dilemma),或者没有充分的预备 研究(pilot study o两难处境可以起到平衡社会期望性反 应的作用,预备研究则有助于发现区分度不高的面试题目 并加以删除。 SI与BDIA9效度问题也开始引起我国学者的重视。黎 与辅导员一起研讨哪些维度是大学生综合考评的主要 依据,以及哪些维度会影响学生的学绩、职业发展、学校 适应等,以此为依据选择了面试测评维度,分别是言 语表达能力(verba1)、逻辑分析能力(reasoning)、计 划组织能力(organization)、协调能力(coordinating)、 建立伙伴关系(a…ance)、 自我管理能力(SeIf一 7探索争鸣 ●● 鞠溜鞠溺 management)、责任心(responsibility)、应变能力 (flexibility o在每个面试维度上都平行设计情景性和行为 个评分向量定义为观测变量,定义8个面试维度为8个潜变 量,即8个特质效应,5个评委定义为5个潜变量,即5个方 描述性问题各一个,并采用李克特十点量表对情景 I生和行 为描述性面试维度分别进行评分。面试时一半被试先提问 行为描述性问题再提问情景性问题,另一半则是先提问情 景性问题再提问行为描述性问题,以平衡顺序效应。 每个被试面试时间大约为45分钟,在10天时间内完 成所有面试工作,5名评分者都参与了所有68名被试的面 试和评分。面试结束后评委即根据评分标准进行评分。 为保证评分准确性,面试过程中做了录音,间隔半个月后 让每个评委再听录音,根据录音对初次评分进行修正。所 有评委的两次评分都是在研究者的监督下进行的,保证了 每个评分都以被试的行为和情景描述为依据,并严格参照 评分标准。所有评委都是先听全部被试的行为描述性问题 法效应,这样共有1 3个潜变量,比较两套对应的数据(即 由行为描述性面试和情境性面试各自获得的一套数据)与 多个模型的拟合差异情况。 本研究在选择合适的MTMM模型时使用的是可互换方 法(InlerchanqeabIe method),即从一组高度类似的方 法中随机挑选的方法。 本模型中,每个观测变量都同时测量一个特质因素和 一个方法因素。如评委1对维度1的评分向量被设定为在潜 变量1(即面试的第一个维度)和潜变量9(即评委1白勺方 法效应)上有载荷。设置方法因素的依据是每个主试在评 分时都存在不同程度的主观好恶,因此对每个被试评分时 都会出现系统误差,这一系统误差于是被设置为方法因素。 录音,对行为描述性问题的初评结果进行修正,再听全部 被试的情景性问题录音,然后对情景性问题的初评结果进 行修正。行为描述性和情景性面试的录音评分过程中均对 顺序效应进行了平衡,最大限度地减少了两类面试问题在 不同主试体现出的方法因素存在程度上的不同。 由于行为描述性和情景性测评数据都有不同程度违反 正态分布的情况,因此在计算本文中所有模型的拟合度时 采用了Satorra—Bentler ̄出的校正卡方统计量。 1.行为描述性面试的模型拟合度 评分上的相互干扰,使评分准确客观。 (三)试测和对主试的培训 运#2LISREL程序,估计出行为描述性面试多质一多法 研究发现,有经验且专业的主试可以提高面试的信度 和效度 J。因此,本研究面试评委小组为心理测量专业 的5位研究生,都有从事人事测评工作的经验,而且参加 CFA模型的拟合度指标,见表1。 表1行为描述性面试多质一多法CFA模型的拟合度 (含评委效应)模型 2 x2}df NFI NNFI CF| |F| RFI RMsEA sRMR 本研究前都接受了集体培训l(内容包括结构化面试的要求、 误差控制、面试中的人际互动等)。在正式面试之前选择8 名本科生(不属于正式被试)进行了试测。试测时采用与 正式面试相同的程序,试测后让各评委评分,面试结 束后再讨论各自评分的依据,直到评分标准统一。试测使 各评委之间能协调一致,同时也增强了评委在面试过程中 对偶然情况的应变能力。试测后再让评委对面试中存在的 问题进行研讨,进一步熟悉面试要求。集体培训l、试测及 试测后的研讨时间不少于5个工作日。 1208.44 1-79 .91 .97 .97 .97 9O .080 084 表2行为描述性面试验证性因素分析的模型拟合度 (不舍评委效应)模型 X 2 x2 NFI NNFl CF| |F| RFI RMsEA sRMR 1433.94 2.O1 .87 .92 .93 93 .85 12O .13O 从表1中结果可知,行为描述性面试含评委效应的 CFA模型的卡方Idf ̄b率小于2,~~F/、CF/、/F堵B大 于.90,接近.95,唯有RMAES¥1]SRMR大于各自的理想 值.05和.06,但仍处于可接受的临界点上。从这些拟合指 三、结果 (一)行为描述性面试的多质一多法验证性因素 分析 数的取值判断,可认为假设模型是得到了数据的支持的。 就是说从5个评委对8个维度的评分中可以抽离出8个特质 本研究采用多特质一多方法(multiple trait multiple method.MTMM)的设计思路编写LlSREL的验证性因素 因素(即面试A,38个维度)和5个方法因素(即评委效应)。 这一模型的拟合度明显好于不合评委效应的八因素模型 分析(CFA)程序。MTM M是探究构想效度的一种有效 方法,而且在人事测评与选拔及心理健康诊断领域有较为 (即只将8个面试维度设为潜变量),结果见表2。表2中卡 方、NNFI等几个指标的取值尚好,尺MS 4和S尺M尺却 大到了难以接受的地步,即使勉强认为模型拟合,也不得 广泛的应用。本研究借鉴前人研究,将MTMM应用到结构 化面试中。在本研究中,程序中将5个评委R,-J8个维度B940 不承认,观测变量的协方差没有被充分地解释。只有引入 评委因素,即方法效应,模型拟合才能变得更好。这就是 说面试中特质效应和评委效应都存在,但在行为描述性面 (二)情景性面试的多质一多法验证性因素分析 1.情景性面试的模型拟合度 试中评委效应所起的作用并不是很大,因为两个模型间模 型拟合度的差异不太大。这一点有待下文进一步验证。 2行为描述性面试的特质效应与方法效应 采用与行为描述性面试中相同的多质一多法验证性因 素分析模型,对情景性面试的结果也进行了CFA分析,结 果见表5 ̄1:1表6。 表5情景性面试多质一多法CFA模型的拟合度 (舍评委效应)模型 X 2 X2|df NFI NNF| cF| |F| RFI RMSEA sRMR 93 .94 86 .11O .200 以下我们再通过计算MTMM模型中特质效应和评委 效应的因素载荷系数来分析评委效应的大小,见表3和表 4。两表中所列都是标准化的载荷系数,其取值可直接比 较大小,载荷的大小体现了一个观测分数受潜变量影Di ll] ,程度。从表3 ̄II3表4中可以看出与方法效应相对应的载荷都 不大,只有一个超过.50,且绝大多数小于特质效应的载荷。 说明面试评分更多地受特质因素影响而较少受方法因素影 963 32 1.43 88 .93 表6情景性面试验证性因素分析的模型拟合度 (不合评委效应)模型 X 2 X2|df NF{ NNFl CFI IF/ RF{ RMsEA S尺MR .15O .220 响,即被试在行为描述性面试中的得分较多地取决于被试 在各测评维度上能力的高低,而不太受主试者评分主观因 1859.54 2.6O .82 .87 .88 .88 80 素(如感情好恶等)影响。也就是说,方法因素是存在的, 但其影响不大。 从表5中的结果可知,情景性面试(含评委效应的多 质一多法模型)的因素分析结果不很理想,虽然卡方/0 n价/F停指数可以接受,但R^ SE4 ̄I]SRMR的取值已经超 表3行为描述性面试多质一多法CFA模型中各维度的评 委效应(方法效应) 评分向量 言语表达得分 逻辑分析得分 计划组织得分 协调能力得分 建立伙伴得分 自我管理得分 责任心得分 应变能力得分 评委 评委 评委 评委 评委 效应1 效应2 效应3 效应4 效应5 .28 .32 18 .44 26 一04 10 42 30 .33 24 46 .20 .17 28 42 .1O 一O1 .08 2 .11 .23 .73 1O 16 .14 .33 .15 36 .28 .24 .03 34 .32 .35 29 .24 20 27 .12 出了可容许的最大限度,就是说模型很可能是与数据不拟 合的。虽然总体上的因素结构可能是合理的,但至少有一 部分观测变量间的关系没有被模型充分解释。与行为描述 I生面试的多质一多法CFA结果 ̄111;11;,情景性面试的模型拟 合度更差。这说明行为描述性面试有与理论假设更一致的 因素结构,也即有更好的构想效度(construct validity)。 相比之下情景性面试的因素结构则更为复杂。 表6中为不含评委效应ll],CFA模型(只将面试维度作 为潜变量的八因素模型)。对比表5和表6中的结果可知, 情景性面试的验证性因素分析中,合评委效应和不合评委 效应的模型拟合度都不好,但在引入评委效应后,模型拟 合度有所改善。这说明情景性面试中也存在评委效应,即 方法效应,且方法效应也不太大,但大于行为描述性面试 的方法效应。 绝对值的均值 25 .30 21 21 .27 表4行为描述性面试多质一多法CFA模型中各维度的载 荷(特质效应) 评分 。砉 E 逻辑 计划 协调 建立 自我 责任 应变 向量 表达 分析 组织 能力 伙伴 管理 心 能力  ̄.-W-委1 评分 ●●67 .79 l73 66 .68 62 .55 .61 情景性面试中即使将评委效应引入多质一多法CFA模 型,模型拟合度也不是非常理想,说明除8个特质效应和5 评委2 探索争鸣 ‰ 评分 77 .83 81 .69 70 60 .67 70 个评委效应外,可能还有其他因素影响了面试结果。综合 以往文献可知,这一因素可能是社会期望性应答因素或面 评委3 评分 85 .81 86 .8O .79 88 .76 .69 80 试动机因素。为对这一因素进行评估,我们在8个特质因 素和5个评委因素之外设置了第1 4个潜变量,IlISDR因素。 评委4 86 评分 评委5 评分 88 .80 .71 .78 .77 75 .88 SDR因素被设定为在5个评委对8个面试维度的4O个评分 .83 87 .67 .79 95 .87 .90 向量上都有载荷。该模型的拟合度列于表7中,为便于对 平均 值 81 .比,表7中还列出了行为描述性面试引入SDR因素后的模 .82 .80 _71 77 .75 72 .78 型拟合度。 表7引入SDR因素后两类面试的模型拟合度 面试 米 U 特质效应大于方法效应,即情景性面试的结果较多受特质 因素的影响而较少受方法因素的影响,情景性面试的效度 2 X 2f d} NFI NNF| CFI |F| RF/ RMSEA sRMR 也是可以接受的。但与行为描述性面试相比,情景性面试 076 078 .074 .068 SI 872.76 1 38 89 .93 95 95 .87 BDl 888.04 1 41 .90 94 l95 95 87 的方法效应更大一些(行为描述性面试的方法效应平均载 荷量为l25,情景性的平均载荷量为37),而特质效应更小 一从表7可见,情景性面试在引入SDR因素后模型的拟 合度很好,即使按CFI等≥0.951 ̄0'"严格标准,也可认为模 型是拟合的,即有很好的理论构想。这一模型与不合SDR 的模型(见表5)相比拟合度发生了很大变化,说明情景 性面试中SDR因素是存在的,而且起了不小的作用。 而行为描述性面试在引入SDR因素后模型的拟合度虽 然也有改善,但改变量并不很明显,说明行为描述性面试 些(行为描述性面试的特质效应平均载荷量为.78,情景 性的平均载荷量为.69)。 (三)面试数据与行为评定的相关 关于面试数据的多质一多法CFA分析属于对面试内部 结构的分析,虽然也能为面试效度提供较客观的心理测量 学证据,但终究不能代替外部效标研究。研究中我们选择 学生辅导员和学生干部的评定作为效标,请被试所在班级 的2个专职辅导员和3名班级学生干fl ̄,18个面试维度进行 了评定。专职辅导员都有7年以上学生工作经验,对学生 中SDRt ̄9作用没有情景性面试中的大。这给我们的启示是, 情景性面试中更应控 ̄IJSDR。 2.情景性面试的特质效应与方法效应 能力考评有着丰富的经验。作为主评人的班干部也都是工 作出色的优秀学生干部,能很好地理解本研究的目的。评 定前研究者详细讲解了8个测评维度的含义,让主评人根 情景性面试中采用多质一多法CFA模型计算出的各维 度的评委效应(方法效应)和特质效应见表8g:l表9。 表8情景性面试多质一多法CFA模型中各维度的评委效 应(方法效应) 评分向量 评委 效应1 评委 评委 评委 评委 效应2 效应3 效应4 效应5 据对被评定者行为(包括操行、在班级中的表现、与同学 关系、对集体活动的参与和组织等)的观察为依据进行评 定,并强调评定结果只用来做研究。参加本研究的被试都 是大三年级及以上的学生,这为主评人的评定提供了较充 分的行为样本,从而保证了评定的准确性。 1面试评分与辅导员评定的相关 言语表达得分 逻辑分析得分 计划组织得分 协调能力得分 建立伙伴得分 36 34 一-24 .08 19 .74 36 —07 .40 .22 33 34 .44 .66 .47 .30 13 .28 .40 .53 44 45 39 .32 .66 面试结果与辅导员评定I ̄ON关关系见下页表1, 0。 从表1 0可以看出,无论是行为描述性还是情景性面试, 在言语表达、逻辑分析、组织计划能力三个维度上面试结 自我管理得分 责任心得分 应变能力得分 绝对值的均值 54 一17 20 28 —16 —16 .38 32 35 38 .38 40 67 53 .42 .42 .54 40 .29 .43 果与教师评定间都出现了中度以上的相关(r>.50),在应 变能力上相关也都达到了显著水平。而在协调能力、建立 伙伴关系、自我管理三个维度上行为描述性和情景性面试 结果都与教师评定间不存在相关。在责任心维度上,行为 表9情景性面试多质一多法CFA模型中各维度的载荷(特 质效应) 评分 逻辑 计划 协调 建立 自我 责任 应变 向量 表达 分析 组织 能力 伙伴 管理 心 能力 评委1 评分 80 评委2 79 评分 评委3 69 评分 评委4 评分 79 7g 84 92 .93 .90 .95 .92 94 .95 90 描述性面试结果与教师评定间出现了相关,而情景性面试 结果则与教师评定没有相关。情景性和行为描述性面试的 总分也与教师评定问出现了高相关,但行为描述性面试的 .93 .94 93 .94 相关系数更大。 分析这些结果可见,一些易于外显的心理特质,如言 .62 .50 81 .62 67 .52 .47 .42 49 27 .41 53 .46 53 .55 语表达、逻辑分析、组织计划等较易于被评定,面试评委 和辅导员都能对这些特质给以较准确的评定:而责任心和 自我管理是相对内隐的心理品质,不易于被他人评定出来, .47 .42 .41 评委5 评分 81 .75 37 .55 因此可能导致辅导员和面试评委都不能对这两项特质准确 地进行评定。由于辅导员与学生间是上下级关系,可能并 平均值 .78 l76 l72 .66 .64 58 .67 67 从表8 ̄1:1表9中的结果可以看出,在情景性面试中也是 不了解其同学关系,因而对学生在人际交往(建立伙伴关 系、协调能力)方面的能力可能评定不够准确,但这两个 更容易迎合主试的意图,从而导致主试者对测评维度的评 定不准确。Klehe ̄EILatham 叫认为应该设置两难问题 维度在面试中是较容易评定的。当然,出现本研究的结果 也有可能说明面试评委对建立伙伴关系、协调能力维度的 评定不准确。 2.面试评分与班委评定的相关 情景来克服这一问题。两难问题情景类似于人格量表中的 迫选式题目,两个选项的社会期望性相同,设置两难问题 后被试的回答将更体现自己的真实意图。 面试结果与班委评定的相关见表1 1。 行为描述性面试中也存在SDR因素或动机,即使其作 用并不明显。这说明被试在描述自己过去行为时也可能存 在迎合测试者意图的倾向,或者存在面试动机的作用。这 是有待进一步研究的问题。 (二)情景性面试与行为描述性面试中的评委效应 从多质一多法的CF 吉果可以看出,无论是行为描述 从表1 1中可见,行为描述性和情景性面试中的言语表 达、逻辑分析、组织计划能力3个维度与班委评定问也都 出现了中度以上的相关(r>.50),在应变能力维度上为显 著相关,自我管理维度没有相关,这一点与表1 0中的结果 相同。而谐调能力、建立伙伴关系2个维度却出现了显著相 关,说明与人际交往(建立伙伴关系、协调能力)有关的 能力较容易被同学评定。 总结表1 O和表1 1中的结果可知,自我管理能力维度的 效度是最差的,责任心、协调能力两个维度的效度也不好, 言语表达、逻辑分析、组织计划能力3个维度的效度最好。 对比两类面试,可以发现行为描述性面试的效度略好于情 景性面试。 性面试还是情景性面试,引入评委(即方法)效应后模型 拟合度都有所提高。从模型拟合的改善度上对比可知,情 景性面试的拟合度改善量较大,似乎说明情景性面试中评 委效应所起的作用比较大。进一步比较评委效应的因子载 荷,发现行为描述性面试中的方法效应平均载荷量为_25, 情景性方法效应的平均载荷量为.37:而行为描述性面试的 特质效应平均载荷量为_78,情景性特质效度的平均载荷量 四、讨论 (一)情景性面试与行为描述性面试的因素结构 从本研究的结果可以看出,无论是不合评委效应的 CFA模型还是合有评委效应的CFA模型,情景性面试的模 型拟合度都不如行为描述性面试。这说明行为描述性面试 为.69。说明行为描述性面试的结果受测评维度的影响大一 些,而情景性面试中评委效应所起的作用大一些。因此可 以说两类面试中都存在评委效应,但情景性面试中评委效 应可能更为明显。 这可能说明情景性面试中主试的评分更多地受主观因 素的影响,原因是在情景性面试中主试者评定的是被试的 意图或设想,而不是客观存在的行为,使得主试者的宽严 度、情感好恶、态度等起的作用大一些;而在行为描述性 有更符合理论假设的因素结构或构想效度。 本研究发现情景性面试的因素结构更为复杂,这与以 往研究是一致的 。'伯'伯】。根据前人研究的结论,本研究 中将这一因素定义为SDR因素。只有引入SDR因素后,情 景性面试 ̄gCFA分析结果才达到了较理想的程度:而行为描 述性面试在引入SDR因素前模型拟合度就达到了较好的水 平,在引入SDR因素后模型拟合度也没有太大改善。这说 明情景性面试更容易受SDR的影响。 面试中,由于主试评分都是以被试的行为样本为依据,因 而更能做到客观。因此克服评委效应在情景性面试中显得 更为重要。这就要求情景性面试的设计要更加严密,对主 试的培训l也要更加严格,做到严格遵守评分细则。 总体上讲,两类面试中的特质效应都远大于方法效应, 由于情景性面试中让被试回答的是他在将来情景中的 设想,因此更容易受社会期望性的影响,即被试在回答时 说明主试评分中主要是根据被试在各测评维度上的表现评 分,这也证明两类面试的理论基础都是正确的。 探索争鸣 表10两类面试与教师评定间的相关 言语表达 逻辑分析 .521} .506** 组织计划 .558** .643** 协调能力 建立伙伴关系 自我管理 .176 .143 责任心 -224 .307* 应变能力 .360** .296** 总分 .512 .532** 情景性面试 行为性面试 579** .580** .036 一.008 062 .098 表11 两类面试与班委评定间的相关 言语表达 情景性面试 行为性面试 逻辑分析 .603** .602** 组织计划 .672** 769** 协调能力 建立伙伴关系 自我管理 .303* .240 责任心 .154 .258 应变能力 .307* .275* 总分 .573** .585** .536** 544** 350** .333* .058 .085 7探索争鸣 ● 潮 (三)情景性面试与行为描述性面试的效标关联效度 性面试中评定的是被试的意图和设想,更容易受主观因素 影响。 情景性面试与行为描述性面试总体上讲都有较高的效 标关联效度,其总体效度都在.5O以上。两类面试都在言 (四)本研究的结果证实情景性和行为描述性面试都是 有效的面试形式,只要程序设计严谨,过程控制严密,都 可用作有效的人事测评工具。 语表达、逻辑分析、组织计划维度上有很好的效度,而在 自我管理、协调能力、责任心几个维度上效度较差。在有 的面试维度上情景性面试的效度好于行为描述性面试,而 在有些维度上则是行为描述性面试的效度好于情景性面试。 由于情景性更容易受评委效应(如评分宽严度、价值 判断标准等)的影响,因此在设计和控制上应更加谨慎。 Klehe ̄EILatham 叫认为情景性面试实施中要注意以下 但从总体上讲,行为描述性面试的效度略好于情景I生面试。 从两类面试的效度对比中可知,无论是行为描述性还 是情景性面试,都不是在所有测评维度上都有或都没有效 度,通常是在容易外显的维度上效度较好,在相对内隐的 维度上则效度较差。就是说结构化面试存在的传统问题在 问题:即注重应聘者的意图、将应聘者置于两难情景中、 制订详细的评分细则和通过前期研究筛除没有区分性的问 题。这四个方面都会影响情景性面试的效度。 行为描述性面试中也存在一定程度的评委效应和面试 动机(可能也是SDR)效应,因此也应合理设计。行为描 述性面试是否有效取决于能否准确完整地挖掘出被试过去 的与测评特质有关的行为样本。因此在行为描述性面试中 要遵循STAR模式,要突出强调情境、任务、行动、结果 四要素,做到行为信息的完整性和真实 l生。 行为描述性和情景性面试中依然存在。这要求面试者要做 好测评维度的设计。 (四)关于本研究的方法 本研究中的面试属于模拟面试,纯粹是为研究而设计 的,在面试场地的选择、材料的准备、被试选择、主试培训I、 面试过程的控制几方面都做了充分的准备,并进行了严格 的标准化。面试结束后进行了现场评分,又根据录音对评 分进行修正,做到了评分的准确、客观。这些工作在相当 高的水平上保证了本研究结论的严谨 『生。 本研究采用了结构方程建模的方法估计测评维度效应 [1]Macan T.The empIoyment inte rview:A review of cu rrent studies and di rections for future research[J] Human Resou rce Management Review,2009.1 9:203—21 8 和评委效应,较传统的多质一多法分析有方法上的优势,不 仅可以评定特质和方法效应是否存在,还估计出了效应的 具体数量。虽然与验证 性因素分析的样本量要求相比偏少, 但程序运行中没有出现模型不收敛的问题,参数估计结果 没有发现不合理的取值,因此即使样本量较少,也基本不 影响结论的正确性。 [2]王拥军,俞国良l效度概化:预测效度元分析的3O年成果 述评[J]心理科学进展.2008.16(6):964—972 [3]Posthuma R A,Morgeson F P,Campion M A Beyond empIoyment inte rview validity:A comp rehensive na rrative review of recent research and trends over time[_]Personnel Psychology,2002,55(1):1—81 [4]Gibb J,Taylo r P J.Fu rthe r analysiS of st ructu red employment inte rview question types[J]Asia-Pacific Journal of Human Resource Management.2001.41:371—382. 五、结论 (一)情景性面试与行为描述性面试的效标关联效度都 [5]Day A L,Ca r roII S A.SituationaI and Patte rned behavior desc ription interviews:A comparison of their validity, 较好,与辅导员和班委(即上级管理者和班级管理者)的 评定间出现了显著相关。两类面试的总分与辅导员和班委 correlates,and perceived fairness[J].Human Performance, 2003,16(1):25—47. 评定的总分问相关都在.50以上,行为描述性面试的效度略 高些,但不明显。面试的不同维度与辅导员和班委评定间 的相关系数则各不相同。 [6]Latham G P,Sue—Chan C A meta—analysis of the situational interview:An enumerative review of reasons for its validity[J].Canadian Psychology,1999.40(1):56—67 [7]Taylo r P J,Small B.Asking applicants what they would do versus what they did do:A meta—analytic comparison of situational and past behavior employment interview questions (二)行为描述性面试的构想效度好于情景性面试,情 景『生面试受社会期望性P,]ISDR的影响更大。虽然从行为描 述性面试中也抽离出了SDR的成份,但其影响不大。 (三)行为描述性面试也受评委效应的影响,但情景性 面试中评委效应对面试结果的影响更大。其原因是行为描 述性面试评定的是被试的行为,更容易做到客观,而情景 [J]Journal of Occupational and Organizational Psychology, 2002.75:277—294 [8]Latham G P,Skarlicki D Criterion—related validity of (下转第42页) [9]Bell D E Dlsappointment in decision making under economics,2002,31(4):329—342 unce rtainty c J]Operations research.1985,33(1):1—27 [1O]Loomes G,Sugden R.Disappointmenl and dynamic consistency in choice under uncertainty[J]The Review of Economic Studies.1986.53(2):271—282 [17]Ratner R K,Herbst K C When good decisions have bad outcomes:The impact of affect on switching behavior[J] OrganizatiOnaI Behavior and Human Decision Processes,2005, 96(1):23—37. [1 1]Melle rs B,Schwa rtz A,Ritov I Emotion—based choice[J].Jou rnal of Experimental Psychology:Gene ral, 1999,128(3):332-345 [18]Zeelenberg M,Van Dijk W W,SR Manstead A,der Pligt J The expe rience of reg ret and disapp0intmen[J] Cognition&Emotion,1998,12(2):221-230 [12]Johnson E J.Tversky A Affect,generalization,and [19]Lu ce M F.Bettman J R,PaY ne J W C hoice processing in emotionally difficult decisions[J].Jou rnal of Expe rimental Psychology:Learning,Memory,and Cognition, the pe rception of risk[J]Jou rnal of personality and social psychology,1983.45(1):20-31 [13]Isen A M,Patrick R.The effect of positive feelings on risk taking:When the chips are down[J].Organizational Behavior and Human Performance,1983,31(2):194—202. 1997。23(2):384—405 [2O]KIiegeI M.J age r T.PhilIiP s L H EmotionaI develoPment ac ross aduIthood:Diffe rential age—reIated [14]Schwarz N,Clo re G L_Mood.misattribution.and Judgments of well—being:Informative and di rective functions emotional reactivity and emotion regulation in a negative mood induction procedure[J]The International Jou rnal of Aging and Human Development,2007,64(3):21 7—244 of affective states[J]Jou rnaI of pe rsonality and SOCiaI psychology,1 983,45(3):51 3-523. [15]Loewenstein G F,Weber E U。Hsee C K,Welch N Risk as feelings[J].Psychological bulletin,2001,127(2): 267-289. [21]汪明亮论定罪量刑中的法官情感[J].甘肃学院 学报,2004.12:7—13. [22]王迎付法官个人因素对判案影响之考量[D]苏州: 苏州大学.2006 [16]Slovic P,Finucane M.Pete rs E.MacG regor D G. Rational acto rs o r rational fools:Implications of the affect heu ristic fo r behavio ral economics[J]Jou rnal of Socio一 栏目编辑/任玉丹终校/杨怡 (上接第3O页) the situational and patterned behavior description interviews Applied Psychology,2001,86:897—91 3 [14]黎恒行为面试和情景面试的实证比较[J]人类工效 学,2003,9(3):8—12 [15]王雪,王国强,凌文辁对《行为面试和情景面试的实证 with o rganizationaI citizenshiP behavio r[J]Human Performance.1995.8(1):67—80. [9]KIehe U C,Latham G P The P redi ctive and incremental validity of the situational and patterned behavior 比较》一文的商榷[J].人类工效学,2006,12(2):54—56 [16]杜红.洪自强,陆兴海.中层管理人员结构化面试测评效 度的现场研究[J].应用心理学.2007,1 3(3):44—249 desc ription irite rviews fo r team PIaying behavio『[J]. International Journal of Selection and Assessment,2005。1 3(2): 108—115 [17]田效勋.车宏生面试预测效度和构想效度研究述评 [J].心理科学进展。2009,1 7(4):870—876. [18]Conway J M.Peneno G M Compa ring structu red interview question types:Construct validity and appIicant [10]PuIakos E D,Schmitt N Expe rience—based and situational inte rview questions:studies of validity[J] Personnel Psychology,1 995,48(2):289 308 reactions[J]Jou rnal of Business and Psychology.1999. 13(4):485—506 [11]Huffcutt A I,Weekley J A。Wiesner W H.Degroot T G,Jones C Comparison of situational and behavior description [19]Roth P L,Van Iddekinge C H,Huffcutt A I.Eidson C E(Jr),Schmit M.J Personality saturation in structured interviews interview questions for higher—level positions[J]Personnel Psychology,2001,54(3):61 9—644 [J].International Journal of Selection and Assessment,2005, 13(4):261-263. [12】Huffcutt A I,Conway J M,Roth P L.Klehe U C Evaluation and cornparison of the situational and behavio r [2O]KIehe U C,Latham G P What Would You Dom ReallY o r tdealIy?Const ructs unde rIYing the behavio r description interview and the situational interview in predicting desc ription interview fo rmats[J].International Jou rnal of Selection and Assessment,2004.1 2(3):262—273 [13]Huffcutt A I,Conway J M,Roth P L.Stone N J. Identification and meta—anaIytic assessment of psychological tYPIcaI ve r su s maxim um Pe rfo rmance[J].H uman Performance.2006,19(4):357—382 constructs measured in employment interviews[J]Journal of 栏目编辑/丁尧终校/黄才玲