国内外对考官评分的研究主要集中于考官评分心理行为与评分方式两个角度,研究表明面试考官存在特定的评分心理行为和评分方式。那么,公务员面试中考官存在怎样的评分心理行为?这些评分心理行为表现出什么样的评分方式?
这些评分方式是如何组合的?这种组合呈现出什么样的特点?对面试评分决策有什么影响?对于这些问题的探讨能够帮助我们认识分数背后的考官评分心理行为、解释考官评分差异形成的原因,为公务员考官的选拔和培训提供依据,提高公务员面试的效度确保公务员面试录用的公平性和科学性。
一、文献综述
(一)考官评分心理行为与评分方式研究的主要观点
第一类表现为考官将面试中被测者的个人特质和自己内心的理想原型进行比较的过程。研究表明考官内心存在理想原型,理想原型表现为考官心中目标岗位理想人选所具备的系列特质,有些考官对不同职组使用了不同的理想原型,有些考官对不同职组使用了相同的理想原型。考官评分时,被测者的表现越接近于理想原型,面试评分越高,反之越低。
第二类是考官将被测者表现出来的个体特质与岗位所需个体特质进行比较的过程。岗位所需个体特质分为大众标准和特殊标准两种类型,大众标准指的是不同组织都普遍接受的个人特质,特殊标准指的是某个组织或职位所需的个人特质。面试中,考官评分方式表现为考官以大众标准和特殊标准为参照给被测者打分,被测者个人特征与岗位所需个人特征的匹配程度越高,考官评分越高,反之越低。
第三类是考官在预设的“评分区间”内,根据被测者的表现判断其所属区间值的过程。考官评分行为表现为考官内心预设“什么样的表现给多少分”的“评分区间”并根据面试刚开始形成的第一印象确定一个分数,形成“基准值”。随着面试的推进,考官根据考生回答的内容对“基准值”进行调整,一直调整到考官认为给出了合适的分数。
第四类是考官在评分过程中对被测者外貌、语言或非语言行为进行观测的过程。在评分过程中,考官根据岗位性质确定观测内容。如果目标岗位是对外接触频率比较低的岗位,考官评分时更关注被测者的语言内容而不是外貌和非语言行为。对于考官认为外貌与绩效相关度高的岗位,考官评分时更多考虑外貌和非语言行为。因此,考官的评分方式是根据岗位性质关注被测者的外貌、语言或非语言行为的某个方面来确定分数。
第五类是考官将被测者特质与自身特质相比较,判断二者间相似程度的过程。这种相似可以是考官与被测者在性别、种族等人口统计学特征方面的相似,也可以是人格、态度、价值观和动机方面的相似。虽然考官与被测者的相似性可能不是工作所需的知识和能力,但考官倾向于给与自己某些个人特征相似程度高的考生更高的评价。
第六类是考官将被测者与其他被测者进行比较的过程。在面试中,考官倾向于给第一个被测者“中等”的分数,将被测试者和前面的被测试者进行比较,分析他们之间的能力差异,给出该被测试者的评分。因此,考官评分方式表现为考官在评分时往往以第一位被测者的表现为参照点,再将后续被测者的表现与它对比后进行评分决策。
(二)研究评述
从目前已有文献来看,研究者对考官评分中可能存在的心理行为进行了较为全面的探讨,对每类评分心理行为形成的具体评分方式进行了分析,并在此基础上构建了考官评分方式的部分测量量表,为进一步研究考官评分决策奠定了良好的基础。
考官评分决策是由多种评分心理行为产生的评分方式相互作用而形成的最终结果。考官是如何将单个评分方式组合起来形成最终决策的呢?现有研究多关注单个维度的评分心理和评分方式,对这些评分方式在面试中具体如何组合以形成最终评分决策的研究尚不足。为了回答这个问题,我们将多种考官评分心理行为和评分方式纳入同一个分析框架,将考官评分策略界定为多种评分心理行为基础上形成的多种评分方式的组合。
国外开发的考官评分方式测量工具适合被测者人数比较少的情况,也没有体现公务员面试考官评分策略的特殊性。因此,直接将若干考官评分方式测量工具组合起来用于测量公务员考官评分策略是不合适的,考官评分策略的测量方法还需要改进。
综上所述,考官的评分策略是一个多维的概念,考官评分策略研究应该将考官多种评分心理行为和评分方式纳入同一个分析框架,以便更加全面体现考官评分策略的内容。同时,公务员面试考官的评分策略不同于其他面试考官评分策略,这就需要开发公务员面试考官评分策略问卷,以便更加准确体现公务员面试考官评分策略的特殊性。
二、公务员面试考官评分策略的测量
(一)问卷题项的采集
1.访谈设计
本次访谈以湖北省公务员面试考官为对象,采用半结构化方式进行,访谈的目的是通过访谈归纳和提炼考官在面试中可能采用的评分方式。
遵循关键行为事件访谈的程序,访谈从开放式问题“谈谈你在面试过程中印象最深的考生”开始,要求被访谈者讲述这个考生的面试过程、被访谈者在面试过程中的心理过程、被访谈者评分情况并给出评分的理由、其他考官评分的情况、可能影响考生面试分数的因素等。对于被访谈者没有明确回答的内容,访谈者进行补充提问,一直到问题全部回答完毕。
湖北省公务员面试考官主要由政府部门处级以上干部和高校高级职称教师构成,因此访谈选取了5名曾经多次担任公务员面试考官的高校教师和5名曾经多次担任公务员面试考官的湖北省公务员局处级以上干部,全部访谈过程录音并转化为文字资料,共获得文字约8万字。
2.访谈数据处理
由两名人力资源管理专业的博士和三名硕士对记录的文字资料进行编码分析,保证每个编码只有一个涵义、语意清晰、归类明确。首先对文字资料内容进行归类,获得8个类别。再将每个类别中的文字资料编码,删除明显不属于考官评分策略的编码,对于不同语言表达同一个意思的语句进行合并后,共获得85个编码。删除语意模糊、归类不明确的编码,共获得78个编码。最后,将所有编码按类别汇总,用陈述语句表达出来,最后共获得17个陈述语句。
(二)问卷编制
编码和归类完毕后,请被访谈者对陈述语句的适合程度进行判断。首先请他们对语句表达的意思是否清晰进行判断,然后由编码者告诉被访谈者每个陈述语句编写的目的是什么,询问被访谈者这些陈述语句是否与现实情况相符。经过多次讨论和修订,最后筛选出17个陈述语句。
将最后筛选出的陈述语句设计成问卷,命名为公务员考官评分策略问卷。问卷共分为两个部分:第一个部分是个人基本信息,包括性别、年龄、工作单位性质担任考官次数等。第二部分是考官评分策略,共17个题项。所有题项采用李克特5点计分法。“1”表示“完全不赞同”“2”表示“不太赞同”,“3”表示“一般”,“4”表示“比较赞同”,“5”表示“完全赞同”。
(三)问卷效度检验
本次调研以湖北省公务员面试考官为样本,利用2014年6月和2015年7月湖北省公务员考试中考官休息时间发放问卷,并现场收回。2014年6月发放问卷494份,回收354份,回收率为71.7%。剔除评分策略部分填写无效的问卷后共计278份,占回收问卷的78.5%。2015年7月共发放间卷210份,回收210份,回收率为100%,剔除评分策略部分填写无效的问卷后共计204份,占回收间卷的97.1%。两次调研共获得482份问卷,样本分布情况见表l。
2.探索性因子分析
主成分因子分析法常用来对问卷的结构效度进行检验。先用全部题项进行主成分因子分析,得到KMO=0.813(p<0.0l),说明题项之间的关系适合进行因子分析。
我们利用最大方差法提取主成分,保留因素负荷大于0.45的题项并且删除多个因子上的因素负荷大于0.45的题项,按照特征值大于1提取公因子,经过反复正交旋转,结果显示6个题项应该被删除,它们是“外貌评分有影响”、“考生的政治激情对评分有影响”、“考生的语言表达对评分有影响”、“在面试中,我结合评分区间和考生表现打分”、“我参考前一个考生给后一个考生打分”和“相对岗位能力,考生的政治素质更重要”。
删除这6个题项后,扯表的KMO=0.784(p<0.01),说明问卷的共同因素有所下降但仍然适合进行因子分析。按照特征值大于l提取公因子,结果显示应该提取3个公因子,3个公因子的累计方差贡献率为55.4%,说明3个共同因素可以解释问卷全部题项554%的变异址,问卷具有良好的构建效度。
根据研究目标和各因子所包括题项的涵义进行抽象和概括,将考官评分策略提炼和细分为“描定策略”、“调整策略”和“匹配策略”三个维度,具体内容见表2。
因子l包含Sl、S2、S3、S4和S5共5个题项,表示考官根据自己的经验和偏好形成评分区间,考官根据考生的政治素质、考生与考官的相似度、考生表现与应聘岗位的差距确定该区间内的实际得分,我们将其命名为“锚定策略”。
因子2包括S6、S7和S8,说明其他考官评分情况考生的面试表现和考生的外貌会改变考官原有的评分区间,我们将其命名为“调整策略”。因子3包括S9、S10、Sl1共3个题项,表示考官对不太熟悉的岗位采用了大众标准并结合参考答案进行评分,考生的分数取决于考生与大众标准和参考答案的相符程度,我们将其命名为“匹配策略”。
3.验证性因子分析
我们利用Amos7.0软件进行一阶验证性因子分析和二阶验证性因子分析,运行结果见表3。一阶验证性因子分析的p(x2/df)>0.5,CF!>0.9,PFI>0.5,RF!>0.9,TL!>0.9,PGFI>0.5,RMSEA=0,ECVI=0.234。
二阶验证性因子分析的拟合指数与一阶验证性因子分析的拟合指数相同,说明三个公因子在二阶上可以聚合为一个高阶因子,拟合度和稳定性较高,我们将其命名为考官评分策略。其中,“锚定策略”的标准化系数为0.791,“调整策略”的标准化系数为0.984,“匹配策略”的标准化系数为0.791,标准化路径系数在0.05水平下显著,说明“锚定策略”、“调整策略”和“匹配策略“能够反映考官评分策略的内容。
三、研究结论
(一)公务员面试中考官使用了多种评分策略
探索性因子分析和验证性因子分析结果表明考官在评分中组合使用了“锚定策略”、“调整策略”和“匹配策略”三种评分策略。全部研究样本显示(见表4),“锚定策略”均值最高,其次是“匹配策略”,最后是“调整策略”,说明考官评分中更倾向于使用“描定策略”。独立样本t检验发现,2014年和2015年考官的“锚定策略”和“调整策略”评分策略没有显著差异,而“匹配策略”有显著差异,说明考官的“锚定策略”和“调整策略”是比较稳定的而“匹配策略”是不稳定的。
(二)考官之间的评分策略组合方式存在差异
虽然公务员面试中考官同时使用了三种评分策略,但是三种策略的具体组合存在差异。以“锚定策略”和“匹配策略”为例,考官对这两种评分策略的使用情况可以分为高“锚定策略”组、低“锚定策略”组、高“匹配策略”组和低“匹配策略”组四种类型。
研究表明(表5),34.9%的考官采取了高“锚定策略”、高“匹配策略”的组合方式,22.6%的考官采取了低“锚定策略”高“匹配策略”的组合方式,12.5%的考官采取了高“描定策略”低“匹配策略”的组合方式,30%的考官采取了低“锚定策略”低“匹配策略”的组合方式,说明考官虽然整体上更倾向于使用“锚定策略”和“匹配策略”但考官之间的评分策略组合方式存在差异。
在每种评分策略内部,考官之间的评分方式组合存在差异,我们用考官对每种评分方式的使用情况来表示(见表6)。例如,“锚定策略”包括5种评分方式,90.4%的考官比较赞同和完全赞同“我心中有一个大致的评分区间”,还有9.6%的考官持不太赞同态度。28.4%的考官比较赞同和完全赞同“当考生的想法或价值取向与自己不相符时,我不自觉降低其分数”,还有72.6%的考官持不太赞同或完全不赞同态度。
整体而言,考官最倾向于使用的评分方式是“我心中有一个大致的评分区间”,最不倾向于使用的评分方式是“当考生的想法或价值取向与自己不相符时,我不自觉降低其分数”。因此,对于“锚定策略”而言,所有考官都使用了5种评分方式,但考官对5种评分方式的使用情况是不同的,考官之间的评分方式组合存在差异。
(三)面试中考官对不同的考生使用不同的评分策略组合
“调整策略”研究显示,面试中考官受到考生外貌、考生在面试中的实际表现以及其他考官的影响会调整自己的评分区间。21.1%的考官比较赞同或完全赞同“其他考官与我之间评分差异太大时,我会改变我心的评分区间”,在公务员面试中考官会把自己的评分与其他考官的评分进行比较,根据评分的整体情况调整自己的评分区间,表现为评分普遍比较低的考官会提高分数,评分普遍比较高的考官会降低分数。
22.8%的考官比较赞同和完全赞同“当考生回答的内容与标准答案差异比较大时,我会给同情分”,说明这部分考官对能力比较差的考生的评分高于实际应得分数,考官根据考生的表现对自己的评分区间进行了调整。
70.5%的考官认为面试过程中外貌影响评分,但随面试过程的推进,外貌的影响减弱,考官根据考生的外貌使用不同的评分区间。因此,由于受到考生外貌、考生在面试中的实际表现以及其他考官的影响,“调整策略”中评分区间产生变化,同一考官对不同考生进行评价时,考官利用不同评分区间的“调整策略”结合“锚定策略”和“匹配策略”组合形成差异化的评分策略。
(四)公务员面试考官评分策略具有政治性
公务员面试考官评分策略问卷的题项内容表明公务员面试考官的评分策略具有政治性。84.6%的考官比较认同或完全认同“政治素质影响评分”,59.2%的考官比较赞同或完全赞同“考生的面试表现与应聘岗位相符程度影响评分”,65.2%的考官比较赞同或完全赞同“使用大众对公务员的一般素质要求对考生进行评分”。
公务员岗位明确提出了对任职人员的政治素质要求,大众对公务员的一般素质要求也有政治素质方面的要求,说明考官评分关注考生的政治性特质。因此,公务员面试考官评分策略具有政治性,这是公务员面试考官区别于其他面试考官的突出特点。
四、总结与研究展望
本研究以湖北省2014年和2015年公务员面试考官为样本,运用探索性因子分析和验证性因子进行实证研究,发现考官在面试中使用了11种评分方式,形成3种评分策略,分别为“锚定策略”、“匹配策略”和“调整策略”。由于受考生实际表现和其他考官评分情况的影响,部分考官会调整内心的评分区间,对同组考生使用不同的评分策略。公务员面试考官评分策略中政治性特色突出,表现为考官在评分过程中普遍关注考生的政治素质。
(2)考官三种评分策略对面试的信度和效度分别有何具体影响。“锚定策略”表明考官有着特定的评分区间,“调整策略”表明考官改变了内心的评分区间,面试中考官会改变自身的评分策略,“锚定策略”和“调整策略”对面试信度和效度的影响可能会不同,到底有何不同还有待于进一步证实。
@面试荟,公务员面试资深考官揭秘面试中的小门道和大智慧,助你“摆渡”面试,“成公”上岸!
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!