1.调查问卷怎么写
调查问卷 问卷又称调查表或询问表,是以问题的形式系统地记载调查内容的一种印件。
问卷可以是表格式、卡片式或簿记式。设计问卷,是询问调查的关键。
完美的问卷必须具备两个功能,即能将问题传达给被问的人和使被问者乐于回答。要完成这两个功能,问卷设计时应当遵循一定的原则和程序,运用一定的技巧。
一、问卷设计的原则 1.有明确的主题。根据调查主题,从实际出发拟题,问题目的明确,重点突出,没有可有可无的问题。
2.结构合理、逻辑性强。问题的排列应有一定的逻辑顺序,符合应答者的思维程序。
一般是先易后难、先简后繁、先具体后抽象。 3.通俗易懂。
问卷应使应答者一目了然,并愿意如实回答。问卷中语气要亲切,符合应答者的理解能力和认识能力,避免使用专业术语。
对敏感性问题采取一定的技巧调查,使问卷具有合理性和可答性,避免主观性和暗示性,以免答案失真。 4.控制问卷的长度。
回答问卷的时间控制在20分钟左右,问卷中既不浪费一个问句,也不遗漏一个问句。 5.便于资料的校验、整理和统计。
二、问卷设计的程序 1.确定主题和资料范围。根据调查目的的要求,研究调查内容、所需收集的资料及资料来源、调查范围等,酝酿问卷的整体构思,将所需要的资料一一列出,分析哪些是主要资料,哪些是次要资料,哪些是可要可不要的资料,淘汰那些不需要的资料,再分析哪些资料需要通过问卷取得、需要向谁调查等,并确定调查地点、时间及对象。
2.分析样本特征。分析了解各类调查对象的社会阶层、社会环境、行为规范、观念习俗等社会特征;需求动机、潜在欲望等心理特征;理解能力、文化程序、知识水平等学识特征,以便针对其特征来拟题。
3.拟定并编排问题。首先构想每项资料需要用什么样的句型来提问,尽量详尽地列出问题,然后对问题进行检查、筛选,看它有无多余的问题,有无遗漏的问题,有无不适当的问句,以便进行删、补、换。
4.进行试问试答。站在调查者的立场上试行提问,看看问题是否清楚明白,是否便于资料的记录、整理;站在应答者的立场上试行回答,看看是否能答和愿答所有的问题,问题的顺序是否符合思维逻辑。
估计回答时间是否合乎要求。有必要在小范围进行实地试答,以检查问卷的质量。
5.修改、复印。根据试答情况,进行修改,再试答,再修改,直到完全合格以后才定稿付印,制成正式问卷。
三、问题的形式 1. 开放式问题 又称无结构的问答题。在采用开放式问题时,应答者可以用自己的语言自由地发表意见,在问卷上没有已拟定的答案。
例如:您抽香烟多久了?您喜欢看哪一类的电视节目?您认为加入WTO对我国政府管理体制有何影响? 显然,应答者可以自由回答以上的问题,并不需要按照问卷上已拟定的答案加以选择,因此应答者可以充分地表达自己的看法和理由,并且比较深入有时还可获得研究者始料未及的答案。通常而言,问卷上的第一个问题采用自由式问题,让应答者有机会尽量发表意见,这样可制造有利的调查气氛,缩短调查者与应答者之间的距离。
然而,开放式问题亦有其缺点。例如调查者的偏见,因记录应答者答案是由调查者执笔,极可能失真,或并非应答者原来的意思。
如果调查者按照他自己的理解来记录,就有出现偏见的可能。但这些不足可运用录音机来弥补。
开放式问题的第二个主要缺点是资料整理与分析的困难。由于各种应答者的答案可能不同,所用字眼各异,因此在答案分类时难免出现困难,整个过程相当耗费时间,而且免不了夹杂整理者个人的偏见。
因此,开放性问题在探索性调研中是很有帮助的,但在大规模的抽样调查中,它就弊大于利了。 2. 封闭式问题 又称有结构的问答题。
封闭式问题与开放式问题相反,它规定了一组可供选择的答案和固定的回答格式。 例如:你购买雕牌洗衣粉的主要原因是(选择最主要两种): (1).洗衣较洁白 (2).售价较廉 (3).任何商店都有出售 (4).不伤手 (5).价格与已有的牌子相同,但份量较多 (6).朋友介绍 封闭式问题的优点包括以下几个方面: (1).答案是标准化的,对答案进行编码和分析都比较容易; (2).回答者易于作答,有利于提高问卷的回收率; (3).问题的含义比较清楚。
因为所提供的答案有助于理解题意,这样就可以避免回答者由于不理解题意而拒绝回答。 封闭式问题也存在一些缺点: (1).回答者对题目不正确理解的,难以觉察出来; (2).可能产生“顺序偏差”或“位置偏差”,即被调查者选择答案可能与该答案的排列位置有关。
研究表明,对陈述性答案被调查者趋向于选第一个或最后一个答案,特别是第一个答案。而对一组数字(数量或价格)则趋向于取中间位置的。
为了减少顺序偏差,可以准备几种形式的问卷,每种形式的问卷答案排列的顺序都不同。 四、问卷调查设计技巧 1. 事实性问题 事实性问题主要是要求应答者回答一些有关事实的问题。
例如:你通常什么时候看电视? 事实性问题的主要目的在于求取事实资料,因此问题中的字眼定义必须清楚,让应答者了解后能正确回答。 市场调查中,许多问题均属“事实性问题”,例如应答者个人的资料:职业、收入、家。
2.调查问卷的信度和效度怎么写
测试信度(test reliability)也叫测试的可靠性,指的是测试结果是否稳定可靠。
也就是说,测试的成绩是不是反映了受试者的实际语言水平。例如,如果同一套测试在对同一测试对象(即受试者本身没有变化)进行的数次测试中,受试者的分数忽高忽低的话,则说明该测试缺乏信度。
测试的信度与测试的效度有着密切的关系。一般说来,只有信度较高的测试才能有较高的效度,但效度较高不能保证信度也一定较高。
测试的信度主要涉及到试题本身的可靠性和评分的可靠性这两个方面。试题本身是否可靠主要取决于试题的范围、数量、试题的区分度等因素;评分是否可靠则要看评分标准是否客观和准确。
测试的信度通常用一种相关系数(即两个数之间的比例关系)来表示,相关系数越大,信度则越高。当系数为1.00时,说明测试的可靠性达到最高程度;而系数是0.00时,则测试的可靠性降到最低程度。
在一般情况下,系数不会高到1.00,也不会降到0.00,而是在两者之间。对信度指数的要求因测试类别的不同而不同,人们通常对标准化测试的信度系数要求在0.90以上,例如“托福”的信度大致为0.95,而课堂测试的信度系数则以0.70-0.80之间为可接受性系数。
测试信度的计算方法有很多种,以下仅介绍三种易于操作的方法: 1)重测法(the retesting method)。用同一套试卷在两个不同时间内来测试同一批受试者,这样便获得两组分数,然后计算出两组分数的相关系数。
当然,在两次测试中,学生第二次的测试成绩理应比第一次的要高,因为在第二次测试时学生已经有了进步而且临场经验也更丰富了。但是若该试题是比较可靠的,每个学生在两次测试中的排名次序应该是基本不变的。
2)交替形式法(the alternative method)。对同一批受试者使用试题类型完全相同,难易程度相当,但具体题目不同的两套对等试卷先后进行两次测试,然后计算出两次得分的相关系数。
3)对半法(the split-half method)。测试只进行一次,但将整份试卷的题目按单、双数分成两组来分别计分,算出两组分数的相关系数,然后再用Spearman-Brown的公式计算整份试卷的信度系数。
具体计算步骤是:将两组分数的相关系数乘以2,再除以1加两组分数的相关系数。 /view/698674.htm 测试效度(test validity)亦称测试的有效性,指一套测试对应该测试的内容所测的程度。
也就是说,一套测试是否达到了它预定的目的以及是否测量了它要测量的内容。例如:“Is photography an art orscience?Discuss.”这种题目以摄影的知识为前提和主要内容,用来考语言能力,就不具有效性。
又如用听写来测量学生的听觉能力,其效度也是不理想的,因为书面记录有声语言不仅涉及学生的听觉能力,而且还与他们的书写速度、拼写能力、语法知识、记忆能力和对全文的理解能力等有关。 测试的效度一般可分为以下几类: 1)表面效度(face validity)。
指测试应达到的卷面标准,即一套测试题从表面看来是否是合适的。例如,若一次阅读理解力的测试包括许多受试者没有学过的方言词汇,则可认为这次测试缺乏表面效度。
表面效度是测试出受试者正常水平的一种保证因素。 2)内容效度(content validity)。
指一套测试题是否测试了应该测试的内容或者说所测试的内容是否反映了测试的要求,即测试的代表性和覆盖面的程度。例如,如果某一套发音技能测试题仅仅考查发音所必须具备的某些技能,如只考单一音素的发音,而不考查重读、语调或音素在词语中的发音,那么,该测试的内容效度就很低。
3)编制效度(construct validity)。指一套测试题的诸项目对编制该测试所依据的理论的各个基本方面的反映程度。
例如,以结构主义语言理论为基础,认为系统的语言习惯是通过句型而获得的,那么,强调词汇和语法环境的测试题目就失去了编制效度。 4)经验效度(empirical validity)。
经验效度是一种衡量测试有效性的量度,通过把一次测试与一个或多个标准尺度相对照而得出。经验效度可分为两种:一是共时效度(concurrent validity),即将一次测试的结果同另一次时间相近的有效测试的结果相比较,或同教师的鉴定相比较而得出的系数;二是预测效度(predictive validity),即将一次测试的结果同后来的语言能力相比较,或是同教师后来对学生的鉴定相比较而得出的系数。
一般来说,对某次测试的效度进行检验时,除了要根据教学大纲的要求和观念有效性的理论对试卷的内容进行考查以外,还须采用计算相关系数的定量方法,即计算出本次试卷与另一份已被确定能正确反映受试者水平的试卷之间的相关系数。系数高则有效性大。
课堂测试的效度应在0.4-0.7之间,规模较大的测试其效度应在0.7以上。