1.调查问卷的信度和效度怎么写
测试信度(test reliability)也叫测试的可靠性,指的是测试结果是否稳定可靠。
也就是说,测试的成绩是不是反映了受试者的实际语言水平。例如,如果同一套测试在对同一测试对象(即受试者本身没有变化)进行的数次测试中,受试者的分数忽高忽低的话,则说明该测试缺乏信度。
测试的信度与测试的效度有着密切的关系。一般说来,只有信度较高的测试才能有较高的效度,但效度较高不能保证信度也一定较高。
测试的信度主要涉及到试题本身的可靠性和评分的可靠性这两个方面。试题本身是否可靠主要取决于试题的范围、数量、试题的区分度等因素;评分是否可靠则要看评分标准是否客观和准确。
测试的信度通常用一种相关系数(即两个数之间的比例关系)来表示,相关系数越大,信度则越高。当系数为1.00时,说明测试的可靠性达到最高程度;而系数是0.00时,则测试的可靠性降到最低程度。
在一般情况下,系数不会高到1.00,也不会降到0.00,而是在两者之间。对信度指数的要求因测试类别的不同而不同,人们通常对标准化测试的信度系数要求在0.90以上,例如“托福”的信度大致为0.95,而课堂测试的信度系数则以0.70-0.80之间为可接受性系数。
测试信度的计算方法有很多种,以下仅介绍三种易于操作的方法: 1)重测法(the retesting method)。用同一套试卷在两个不同时间内来测试同一批受试者,这样便获得两组分数,然后计算出两组分数的相关系数。
当然,在两次测试中,学生第二次的测试成绩理应比第一次的要高,因为在第二次测试时学生已经有了进步而且临场经验也更丰富了。但是若该试题是比较可靠的,每个学生在两次测试中的排名次序应该是基本不变的。
2)交替形式法(the alternative method)。对同一批受试者使用试题类型完全相同,难易程度相当,但具体题目不同的两套对等试卷先后进行两次测试,然后计算出两次得分的相关系数。
3)对半法(the split-half method)。测试只进行一次,但将整份试卷的题目按单、双数分成两组来分别计分,算出两组分数的相关系数,然后再用Spearman-Brown的公式计算整份试卷的信度系数。
具体计算步骤是:将两组分数的相关系数乘以2,再除以1加两组分数的相关系数。 /view/698674.htm 测试效度(test validity)亦称测试的有效性,指一套测试对应该测试的内容所测的程度。
也就是说,一套测试是否达到了它预定的目的以及是否测量了它要测量的内容。例如:“Is photography an art orscience?Discuss.”这种题目以摄影的知识为前提和主要内容,用来考语言能力,就不具有效性。
又如用听写来测量学生的听觉能力,其效度也是不理想的,因为书面记录有声语言不仅涉及学生的听觉能力,而且还与他们的书写速度、拼写能力、语法知识、记忆能力和对全文的理解能力等有关。 测试的效度一般可分为以下几类: 1)表面效度(face validity)。
指测试应达到的卷面标准,即一套测试题从表面看来是否是合适的。例如,若一次阅读理解力的测试包括许多受试者没有学过的方言词汇,则可认为这次测试缺乏表面效度。
表面效度是测试出受试者正常水平的一种保证因素。 2)内容效度(content validity)。
指一套测试题是否测试了应该测试的内容或者说所测试的内容是否反映了测试的要求,即测试的代表性和覆盖面的程度。例如,如果某一套发音技能测试题仅仅考查发音所必须具备的某些技能,如只考单一音素的发音,而不考查重读、语调或音素在词语中的发音,那么,该测试的内容效度就很低。
3)编制效度(construct validity)。指一套测试题的诸项目对编制该测试所依据的理论的各个基本方面的反映程度。
例如,以结构主义语言理论为基础,认为系统的语言习惯是通过句型而获得的,那么,强调词汇和语法环境的测试题目就失去了编制效度。 4)经验效度(empirical validity)。
经验效度是一种衡量测试有效性的量度,通过把一次测试与一个或多个标准尺度相对照而得出。经验效度可分为两种:一是共时效度(concurrent validity),即将一次测试的结果同另一次时间相近的有效测试的结果相比较,或同教师的鉴定相比较而得出的系数;二是预测效度(predictive validity),即将一次测试的结果同后来的语言能力相比较,或是同教师后来对学生的鉴定相比较而得出的系数。
一般来说,对某次测试的效度进行检验时,除了要根据教学大纲的要求和观念有效性的理论对试卷的内容进行考查以外,还须采用计算相关系数的定量方法,即计算出本次试卷与另一份已被确定能正确反映受试者水平的试卷之间的相关系数。系数高则有效性大。
课堂测试的效度应在0.4-0.7之间,规模较大的测试其效度应在0.7以上。
2.调查问卷的信度和效度怎么写
测试信度(test reliability)也叫测试的可靠性,指的是测试结果是否稳定可靠。
也就是说,测试的成绩是不是反映了受试者的实际语言水平。例如,如果同一套测试在对同一测试对象(即受试者本身没有变化)进行的数次测试中,受试者的分数忽高忽低的话,则说明该测试缺乏信度。
测试的信度与测试的效度有着密切的关系。一般说来,只有信度较高的测试才能有较高的效度,但效度较高不能保证信度也一定较高。
测试的信度主要涉及到试题本身的可靠性和评分的可靠性这两个方面。试题本身是否可靠主要取决于试题的范围、数量、试题的区分度等因素;评分是否可靠则要看评分标准是否客观和准确。
测试的信度通常用一种相关系数(即两个数之间的比例关系)来表示,相关系数越大,信度则越高。当系数为1.00时,说明测试的可靠性达到最高程度;而系数是0.00时,则测试的可靠性降到最低程度。
在一般情况下,系数不会高到1.00,也不会降到0.00,而是在两者之间。对信度指数的要求因测试类别的不同而不同,人们通常对标准化测试的信度系数要求在0.90以上,例如“托福”的信度大致为0.95,而课堂测试的信度系数则以0.70-0.80之间为可接受性系数。
测试信度的计算方法有很多种,以下仅介绍三种易于操作的方法: 1)重测法(the retesting method)。用同一套试卷在两个不同时间内来测试同一批受试者,这样便获得两组分数,然后计算出两组分数的相关系数。
当然,在两次测试中,学生第二次的测试成绩理应比第一次的要高,因为在第二次测试时学生已经有了进步而且临场经验也更丰富了。但是若该试题是比较可靠的,每个学生在两次测试中的排名次序应该是基本不变的。
2)交替形式法(the alternative method)。对同一批受试者使用试题类型完全相同,难易程度相当,但具体题目不同的两套对等试卷先后进行两次测试,然后计算出两次得分的相关系数。
3)对半法(the split-half method)。测试只进行一次,但将整份试卷的题目按单、双数分成两组来分别计分,算出两组分数的相关系数,然后再用Spearman-Brown的公式计算整份试卷的信度系数。
具体计算步骤是:将两组分数的相关系数乘以2,再除以1加两组分数的相关系数。 /view/698674.htm 测试效度(test validity)亦称测试的有效性,指一套测试对应该测试的内容所测的程度。
也就是说,一套测试是否达到了它预定的目的以及是否测量了它要测量的内容。例如:“Is photography an art orscience?Discuss.”这种题目以摄影的知识为前提和主要内容,用来考语言能力,就不具有效性。
又如用听写来测量学生的听觉能力,其效度也是不理想的,因为书面记录有声语言不仅涉及学生的听觉能力,而且还与他们的书写速度、拼写能力、语法知识、记忆能力和对全文的理解能力等有关。 测试的效度一般可分为以下几类: 1)表面效度(face validity)。
指测试应达到的卷面标准,即一套测试题从表面看来是否是合适的。例如,若一次阅读理解力的测试包括许多受试者没有学过的方言词汇,则可认为这次测试缺乏表面效度。
表面效度是测试出受试者正常水平的一种保证因素。 2)内容效度(content validity)。
指一套测试题是否测试了应该测试的内容或者说所测试的内容是否反映了测试的要求,即测试的代表性和覆盖面的程度。例如,如果某一套发音技能测试题仅仅考查发音所必须具备的某些技能,如只考单一音素的发音,而不考查重读、语调或音素在词语中的发音,那么,该测试的内容效度就很低。
3)编制效度(construct validity)。指一套测试题的诸项目对编制该测试所依据的理论的各个基本方面的反映程度。
例如,以结构主义语言理论为基础,认为系统的语言习惯是通过句型而获得的,那么,强调词汇和语法环境的测试题目就失去了编制效度。 4)经验效度(empirical validity)。
经验效度是一种衡量测试有效性的量度,通过把一次测试与一个或多个标准尺度相对照而得出。经验效度可分为两种:一是共时效度(concurrent validity),即将一次测试的结果同另一次时间相近的有效测试的结果相比较,或同教师的鉴定相比较而得出的系数;二是预测效度(predictive validity),即将一次测试的结果同后来的语言能力相比较,或是同教师后来对学生的鉴定相比较而得出的系数。
一般来说,对某次测试的效度进行检验时,除了要根据教学大纲的要求和观念有效性的理论对试卷的内容进行考查以外,还须采用计算相关系数的定量方法,即计算出本次试卷与另一份已被确定能正确反映受试者水平的试卷之间的相关系数。系数高则有效性大。
课堂测试的效度应在0.4-0.7之间,规模较大的测试其效度应在0.7以上。
3.调查问卷的信度和效度怎么写
度与效度可以简单的概括为“两斤白糖”,两斤是信度,白糖是效度。
如果测出来的是一斤半或者是两厘米,那就说明信度有问题。如果测出来的是盐巴或者大米,不是我们想要的白糖,那就是效度的问题。
信度分类: 1、重测信度:同一个量表在不同时间测量结果的一致性程度。 如果一个今天称是两斤,但是明天称就成了一斤半,那说明信度不高。
2、折半信度。把测量项目用一定的方法分成两半,分别加以测量,得到结果的相关性。
把两斤分为两个一斤,如果分别测出来是1斤和一斤半,说明折半信度有问题。 3、评定者间信度:不同的评定者使用相同工具,所得结果的一致程度。
几个人用相同的称分别称,如果全部都是或者接近两斤,说明评定者信度高。 4、复本信度。
多个测量工具之间的相关性。如果用这个牌子的称是两斤,用另外一个同样牌子的称也是两斤,说明复本信度较高。
效度分类: 1、表面效度。经验观察测量的结果就是要测量的指标。
看上去像白糖,我们主观认为就是白糖,当然也可能是洗衣粉或者盐巴。 2、内容效度。
相关行业专业的检验结果。邀请相关权威专家的评定是不是白糖。
3、结构效度。测量工具的测量属性如何。
从白糖的味道、颜色、化学结构等各个方面做全方位的测量评价和论证。 希望能帮到你哈(请进入应用“微问”里查看自己提出的问题并给出好评,谢谢)。
4.如何对调查问卷进行效度和信度分析
一、问卷的信度。
信度即可靠性,是指采用同一方法对同一对象进行调查时,问卷调查结果的稳定性和一致性,即测量工具(问卷或量表)能否稳定地测量所测的事物或变量。具体评价方法有: 1、重复检验法。
同样的问卷,对同一组访问对象在尽可能相同的情况下,在不同时间进行两次测量。两次测量相距一般在两到四周之内。
用两次测量结果间的相关分析或差异的显著性检验方法,评价量表信度的高低。 2、交错法。
用两个不同形式的等价问卷,对同一组受访者在不同的时间(通常间隔两到四周)进行测量。两次测量结果间的相关性被用来评价问卷的信度。
3、折半法。折半法是将上述两份问卷合成一份问卷(通常要求这两份问卷的问题数目相等),每一份作为一部分,然后考察这两个部分的测量结果之间的相关性。
二、问卷的效度 效度是指问卷正确测量研究者所要测量的变量的程度。检验效度的主要指标和方法有:表面效度、准则效度、架构效度。
1、表面效度(Face Validity)。也称为内容效度或逻辑效度,指的是测量的内容与测量目标之间是否适合,也可以说是指测量所选择的项目是否“看起来”符合测量的目的和要求。
主要依据调查设计人员的主观判断。 2、准则效度(Criterion Validity)。
准则效度是指量表所得到的数据和其他被选择的变量(准则变量)的值相比是否有意义。根据时间跨度的不同,准则效度可分为同时效度和预测效度。
同质效度是指量表测量同一特征的其他测量方法相互关联的程度。异质效度是指量表和测不同特征的测量方法不同但理论上有关特征的测量方法之间相互关联的程度。
建构效度指测量工具所能测量到的理论概念的程度,也就是说若将测量工具所得的结果与相同理论下的其他概念相比较,当二者有某种预期的相关性时,就表示这种测量工具具有某种程度的架构效度。 一般来说,问卷调查容易产生误差的原因,来自研究者的因素包括:测量内容不当、情景以及研究者本身的疏忽。
来自受访者的因素则可能是由于其年龄、性格、教育程度、社会阶层等,而影响其答题的正确性。研究者透过信度与效度的检验,可以了解问卷本身是否优良,以作为改变修正的根据,避免做出错误的判断。
问题意识形成的首要条件是你要对一切的现象充满着好奇感和浓厚的兴趣,具有较强的观察能力。比如当你下到相关的实践场所时,观察到一定的现象和问题,如:课堂上教师为什么会像是在表演一样?为什么教师在上面兴趣盎然,而下面总有某些学生兴趣索然?就要积极展开一定的思考,多问几个为什么,并结合自己所学的相关教育教学理论,追问一下怎么才会更好? 其次是要具有强调的信息意识。
信息资源是得以形成有价值问题的依据,除了实践观察中获得鲜活的感性信息之外,丰富的理论资源也是形成问题的关键。对于确定领域的古今中外所有的研究成果,包括最新的一些提法等都要积累到脑子中,并按照优化的结构将其组织起来,内化于心。
对于已有的问题,要学会换一个角度去多多思考,另外也要善于发掘新的尚未研究或还未足够清楚的问题,并及时将这样一些问题作以记录。 再就是要学会思考,包括思考的方法、角度等等。
只有能思考并善于思考的人才会一语中的地提出有意义的问题,并能够给出有效解决问题的清晰思路。 在做科研的过程中,随时随处遇到问题及时作以深入思考,相信会有大收获的。
基本的抽样方法主要有两大类:一类是在目标总体中,有意识地选择若干有代表性的单位为样本进行调查研究。这种抽样叫做目标抽样或主观抽样。
目标抽样的方法适用于典型调查或研究。它的特点是作为样本的各单位的代表性,都是由与该研究课题有关的专家来判断和决定的。
其结果的可靠性和精确度叶必须依靠这方面的专家来判断和评价。采用目标抽样,可以对总体的有关特性作出推论,也可以对研究所涉及的有关因素加以适当考虑。
也可以使已知的样本单位的某些信息在取样时发挥作用。这些都是目标抽样的优点。
此外,采用目标抽样在数据收集方面比较方便。但采用目标抽样时,目标总体中各成员被抽取为样本的概率不能用客观方法来计算,因此抽样的误差和精度就无法用客观方法加以评价,这是目标抽样的最大缺点。
另一类是按照随即的原则,从构成目标总体的各成员中抽取样本,叫做随即抽样和概率抽样。随机抽样的最大优点是可以借助概率客观地计算调查结果的可靠性和精确度。
而且可以根据实际条件和所要求的精度确定样本的大小。所以在教育科学研究尤其是大规模的评价研究中,应充分了解随机抽样的意义。
简单随机抽样(简称SRS)是随机抽样中最简单而又是最基本的一种。它的特点是采用随机数码表或抽签的办法确定样本,因此各总体成员都保证有相等的抽取概率。
如果抽取的样本数量很大,使用纯粹的简单随机抽样会有很多困难,因此常常可以采用机械随机抽样来代替。 采用简单(或机械)随机抽样的好处是,可以根据概率理论来客观地估计抽样误差的大小。
5.谁知道调查问卷的信度和效度是怎么回事
信度就是测验的可靠性,也就是每次测量结果是否都差不多。
效度就是测验结构的有效性,也就是一套测试是否测量了它要测量的内容。
举例:
一个人买一个电子称,站上去测量,这个时候电子秤的数字就是信度,单位就是效度。
不管这个称准不准,假如我每次上去显示的数字都差不多,都在50左右,说明信度高,因为它测的“数值”稳定。
但是,明知道自己体重不止50KG那么重,(比如60KG)所以肯定这个结果是错的,那么就意味着这个秤效度有问题,比如说这个秤被人去皮了或者其他设置什么的。
希望能帮到你,楼上回答也很不错!
6.什么情况下自编调查问卷需要信效度检验
如果是自己编制的量表, 一定要检验信效度。这是基本要求,否则无法证明数据是可信可靠的。
做抄一个调查问卷,首先要确定问卷内容的信效度,也就是问卷的内部一致性和外部一致性。如果用袭的是前人已经验证过的量表,就可知以不用, 直接把前人已经做好的信效度分析附在调查报告里就可以了。 如果自己做探索性问卷的话,一般都是要做探索性因素分析的, 分析问卷中有几个因子道,每个因子的负荷 ,然后对因子命名;如果是用前人的量表, 同理可以不做。