李沛良《社会研究的统计应用》笔记和典型题(含考研真题)详解(txt+pdf+epub+mobi电子书下载)


发布时间:2020-08-08 19:08:26

点击下载

作者:圣才电子书

出版社:圣才电子书

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

李沛良《社会研究的统计应用》笔记和典型题(含考研真题)详解

李沛良《社会研究的统计应用》笔记和典型题(含考研真题)详解试读:

第一部分 复习笔记

第一篇 导 论

第一章 科学方法与社会研究历程

【知识框架】 【重点难点归纳】

一、社会学研究历程的来龙去脉

1.社会学研究的概念

社会学研究,是指运用科学的方法来搜集和分析社会事实,以理解社会现象之间的关系,尤其是因果关系。社会学研究采用科学方法来叙述和解释社会现象间的关系。

2.社会学研究的步骤

采用科学方法的社会学研究的整个历程,大致上可分为三个阶段:(1)筹划:研究题目初步探索、成立假设、理论解释与澄清概念及研究策略。(2)执行:试点研究、抽取样本、收集资料及整理资料。(3)总结:统计分析、解释研究结果及理论与实际贡献。

二、筹划

在规划一项研究时,大致上可以分为下面的五个步骤:

1.选定研究题目

开始一项研究时,选定研究题目是非常重要的。

2.初步探索(1)收集有关的文献;(2)咨询对研究的题目有经验、有知识的人,进行了解;(3)观察个案,即挑选一些较为典型的个案,亲自观察所要研究的现象。

3.成立假设(1)变项是指社会学研究的社会现象。假设是指根据研究者对问题的了解,假定现象与现象之间的关系。假设的形式包括函数式和差异式。(2)在成立假设时,必须尽可能说清楚变项与变项之间的关系。研究假设,一般是说明两个变项的关系,但也可以只假定一个变项的情况或假定多个变项的相关情况。(3)不是所有的社会学研究都成立假设。但当前的社会学研究,大部分是争取先成立假设,再搜集事实来加以验证,并且重复测验。

4.理论解释与澄清概念

在成立假设以后,便要予以解释。另外,对假设中的变项所包含的概念,要清楚界定它们的意义,以免发生误解。

5.研究策略

要证明假设,必须首先设计研究方式,然后确定每个变项的测量方法及其测量层次,最后计划抽取样本和选择统计方法。(1)研究设计

较为常用的研究方式有实验法和社会调查法,二者皆可验证假设。

①实验法

实验法的基本逻辑,是有意地改变A变项,然后看看B变项是否随着变化;如果B变项显然是随着A变项的变化而变化,即说明A变项对B变项有影响。

实验法的逻辑很严密,其操作程序为:

a.将研究对象分为实验组和控制组。两组的成员在实验前的情况要基本相同,尤其是那些会影响实验效果的情况。使两组情况相同有两种方法:随机法和配对法。

b.为证明假设:A→B,要改变实验组的A变项,但不改变控制组的A变项,然后比较两组的B变项在实验前、后的变化。如果变化的程度不同,表示A对B有影响;如果相同,则表示无影响。

②社会调查法

社会调查法的特点,是在研究过程中不改变社会现状,只求就地取材,然后以统计方法推算变项与变项之间的关系。社会调查法可以分为叙述性调查和解释性调查两大类。

a.一般的社区调查或民意调查属于叙述性调查。当代的社会学研究,偏重因果关系,较常进行解释性调查。

b.解释性的社会调查研究,目的是要证明不同的变项之间是否有因果关系。

③实验法与社会调查法的比较

a.如果证明因果关系,社会调查法在逻辑上不及实验法严谨。严格来说,调查法只能确定变项之间是否相关。

b.进行社会调查时,可作全体调查,也可作抽样调查。在某一个时期进行的社会调查是横剖调查;在不同的时期重复的社会调查是纵贯调查。纵贯调查又分趋势研究和同组研究。

③个案研究

个案研究是指选择一个或几个个案,作深入的接触和观察,目的是对所研究的问题作深入的了解。个案研究不适宜用作证明假设。(2)测量变项

①选择指标

确定如何测量变项,是指采用哪些事实作为变项的指标。每个社会现象都有许多不同的数值或属性,这些不同的值便构成了一个变项。任何一个变项都可能有许多不同的指标,因此选择指标的标准必须符合变项的含义,同时又易于搜集所需的事实。

②指标的合并

对于简单的变项,用一个指标便足够。对于较复杂的变项,可能要用上多个指标,为便于分析,有时需要将各项指标合并起来。合并的方法,主要有类型法、指数构成法和尺度法三类。类型法类型法是将各指标交互分类。指数构成指数构成法是用简明而合理的公式,来综合各指法标。尺度法是根据各指标之间的关系来计算总值,使研究对象高低有序。总和尺度法最为简单易行,也最尺度法常用,计算总值的方法是将各指标的数值相加起来。

③研究单位

在测量变项时,要注意研究单位的性质。以个人为研究单位的变项,称为个人变项;以地区或群体为研究单位的,称为群体变项。在测量变项时,要清楚说明研究单位是个人还是群体。

推论的两种错误:区群谬误将以群体研究单位研究得出的结论推论到以个人为研究单位时的情况。微体谬误将以个人为研究单位的研究结论推论及于群体或整个地区。(3)测量层次

变项在测量以后,会有不同的数值或属性。根据这些值的数学特质,可以将它们由低至高分为四个层次:定类、定序、定距和定比。

①定类层次,是指变项的值只能把研究对象分类,即只能决定研究对象是同类抑或不同类,具有=与≠的数学特质。分类时,要注意互斥性和无遗性两个原则。

②定序层次,是能确定值的次序,即变项的值能把研究对象排列高低或大小,具有>与<的数学特质。定序层次包括了定类层次的特质。

③定距层次,是指能确定值与值之间的距离,即变项之值与值间的距离是可以知道的,因而具有加与减的数学特质。定距层次包括了定序和定类层次的特质。

④定比层次,是最高的测量层次,其数值中的零值是绝对的、固定的,除了定类、定序和定距层次的特质以外,也具有乘与除(×、÷)的数学特质。(4)界定母体和决定抽样的步骤

界定母体,是指清楚说明研究对象的范围,即所研究的人物、时间和地点。母体的定义愈清楚愈好。如果所界定的母体范围过大,不容易全部研究,就需要采取抽样的方法。(5)统计分析

统计方法分两大类:叙述统计法和推论统计法。

①叙述统计法就是帮助简化资料的方法。

②推论统计法是根据抽样取出的资料推论出母体的情况。

三、执行

为保证研究质量,应该首先做小规模的试点研究,即抽取若干研究对象来试验整套计划是否可行。根据试点研究的结果和经验修改原来的计划以后,就可以进行大规模的研究工作。

1.抽取样本,收集资料

依据抽样的计划,从全部研究对象中抽取样本。抽取样本以后,向每一个样本单位收集所需的资料。

搜集资料的方法,可以归为三大类:访问、观察和档案资料。(1)访问法

①访问法在社会学研究中最常用,它可以在较短时间内获取大量资料。访问之前,一般是预先设计好一组问题,称为问卷。答案的方式主要有固定答题和自由答题两种:

a.固定答题,由研究员预先设计了若干可能的答案,由答者选择。固定答题便于统计分析,但所提供的答案不一定适当。

b.自由答题,让答者随着自己的意思回答,研究员不提供可能的答案。自由答题能够让答者充分表达他的意思,较为准确,但答者可能哆嗦和花样众多,访问费时且分析起来也不容易。

②用问卷收集资料的方式可以分为两类:自填和对答。自填是指把问卷交给答者,由他自己填写答案。这种方式又分为邮寄和当面填写两类:a.邮寄方式的好处是节省人力,但问题是寄回来的问卷可能很少。b.当面填写是指把研究对象集合起来,在研究员面

自填前自己填写问卷。自填的方式要求答者懂得文字和了解问题的意思,难以在教育落后的地区应用。对答是指由研究员询问,答者作口头答复,然后研究员作记录。这种方式又分为电话访问与面对面访问两类:a.电话访问是指研究员用电话询问研究对象,可以节省交通费用和时问,但只能提出少量问题,而且在电话普遍地区才可进行,否则样本的代表性有疑

对答问。b.面对面访问是指登门拜访,直接访问研究对象,此方法耗费人力和时间多,但可以避免自填方式以及电话访问的短处,而且有较长的访问时间,搜集大量资料。

③设计问卷时,切忌太长,要尽可能精简,要经过反复考虑,力求去芜存菁。同时,每个问题所用的词语,要具体和明确,不能模棱两可或有双重含义。所用的词语,也不可影响答者的意见。(2)观察法

观察法即是以耳闻目睹的方式,实地了解研究对象的行为。观察法分为参与观察法和非参与观察法两种。参与观察法是指研究员要参加所研究的活动,从而获取资料。非参与观察法是指研究员的身份是旁观者。(3)档案资料

档案资料,包括报纸、杂志、机关文件与书信等。这是现有的资料,所以一般来说,花的时间最少,代价最小。

2.整理资料

整理资料一般分为校对和编码两步。(1)校对是指查看所收集的资料有没有错,有没有错漏和是否清楚。有错漏或不清楚的,就要马上补上或更正。(2)编码是指把资料作简明的记录和分类。记录资料时,可用简单的数码表示。

四、总结

1.统计分析,将众多的资料作综合运算(1)运用适当的叙述统计方法,把所得到的资料简化,使之易于理解。如果所研究的是一个样本,要运用适当的推论统计方法,用样本的研究结果来推论总体的情况。(2)一个严谨的研究,在未分析变项与变项之间的关系之前,应该先检验每个变项的测量信度和测量效度,再开始运用统计方法分析资料以求验证假设。测量信度是指用相同的方法重复测量变项时所得的资料与原有资料的吻合程度。测量效度是指所得资料与测量的目标的吻合程度。

2.解释研究结果

研究者提出更精确和更周详的解释。如果研究结果是否定原来的假设,须解释其原因。

3.说明研究结果的贡献

研究结果的贡献包括理论的贡献和实际的贡献。

4.提供若干新的研究题目

提供若干新的研究题目,即使自己未能解答,也要提议别人去寻求答案。

第二篇 统计叙述:单变项与双变项

第二章 简化一个变项之分布

【知识框架】  【重点难点归纳】

一、基本技术

1.定类层次

适用于简化一个定类变项资料的方法,有次数分布、比例、比率、对比值和图示法等。①次数分布法是指统计变项内每一个值的原资料出现多少次。②次数分布可以把原资料作初步的简化,但不能用次数分布来比较不同的样本。如要比较,可以计算比例或比率。比例是指将每类的次数()除以总数()。比例是使两个样本的总数变成同一个基数,即都是以1为基数,就可以进行比较。

比例公式:①比率是把计算比例时所用的基数变大,使之容易领会。比率的公式是:a.百分率:b.千分率:c.万分率:②社会学研究最常用的是百分率(%)。一般来说,要求精确程度愈高或样本愈大,可以保留的小数愈多。社会学研究通常是保留小数点以后的一位或两

比率位数字。③对数值中的小数作取舍,通俗的做法是“四舍五入”。近代统计学有一项新原则,就是“前单五入”,即“五”前面是单数就进位,若是双数就舍掉(0也算双数)。④如果百分率的数值也太小,可以用千分率、万分率等。如犯罪研究的统计,通常是用十万为基数;人口学的研究则较常用千分率。分析定类层次资料时,也可以计算两数值的对比值。A数值与B数值的对比值,即A除以B。对比值图示法是以图形来简化资料。在社会学研究中比较多用的有长条图和圆瓣图。①长条图是以长方形的长度(宽度相同)来表示次图示法数或百分率的多少;②圆瓣图是把一个圆形平面按数值的比例分割。

2.定序层次

累加次数和累加百分率适用于定序层次而不可用于定类层次。(1)累加次数(简写cf)

累加次数是把次数逐级相加起来。分为向上累加和向下累加两种。它们的作用是使研究者容易知道某值以下或以上之次数总和。(2)累加百分率(简写c%)

累加百分率是将各级的百分率数值逐级相加。

3.定距层次

累加次数或累加百分率的方法,即可以分析定序资料,也可以用于分析定距资料。(1)次数的计算

一般是先将各值分成若干组,然后计算每组的次数。分组时,要留意每组的界限、宽度和断点。

①组限,即每组的范围,包括上限和下限。

②每个组的宽度,简称组距,即组的真实上限与真实下限之差。组中点即真实上限与真实下限的平均数。(2)图示法

较常用于社会学研究的有矩形图和多角线图。

①矩形图

以一个矩形的面积(长×宽)表示每组数值之次数或百分率的多少。绘制矩形图时,通常是以一个坐标的横轴的宽度表示组距,以纵轴的长度表示次数或百分率,二者的乘积就是该组之次数或百分率。

矩形图与长条图的区别包括:

a.长条图只讲长度,宽度则固定;矩形图则是计算面积,长度与宽度均有意义。

b.长条图可以分开;而矩形图由于数值有连续性,各个矩形要相连排列,不可以分开。

②多角线图

多角线图是把各个矩形顶端的中点用直线连结起来。其作用是使各组的次数(或百分率)的分布情况更显而易见。(3)一些曲线的概念

整理定距资料时,可将资料分组,然后用多角线显示分布情况。但各组距的大小,会影响线条的平滑程度。一般是组距愈小,线条就愈平滑。社会学研究常用平滑曲线来表示定距变项的资料分布,如下列一些曲线:

①J形曲线

下降时先急后缓或上升时先缓后急,如图2-1所示。图2-1  J型曲线

②U形曲线

先降后升或先升后降,如图2-2所示。图2-2  U型曲线

③峰状曲线

据曲线的峰顶数目,可以分为单峰、双峰和多峰曲线,如图2-3所示。图2-3  峰状曲线

④对称与不对称曲线

如果把曲线从中央分割,两边的资料分布完全相同,且图形对称就是对称曲线,否则就称为不对称曲线。不对称曲线显示资料作偏态分布,分为正向(即向右)偏态和负向(即向左)偏态两种,如图2-4所示。图2-4  对称与不对称曲线

二、集中趋势测量法

集中趋势测量法是指找出一个数值来代表变项的资料分布,以反映资料的集结情况。

1.定类变项:众值

众值(简写)即次数最多之值。因为众值最有代表性,因此具有估计或预测的意义,长远来说,以众值作预测所犯的错误总数是最小的。众值适合于分析定类变项,当然也可用来分析定序或定距变项的资料。

2.定序变项:中位值

中位值(简写)为一个序列的中央位置之值,即高于此值的有50%的研究个案,低于此值的也有50%。计算中位值有用原资料和用分组资料计算两种情况。(1)根据原资料求出中位值

计算方法是将各个个案由低至高排列起来,居序列中央位置的个案的值就是中位值。其公式为:位置=,其中是个案数目。

如果是偶数时,通常的做法,是将位于最中央的两个数值的平均值作为中位值。(2)用分组资料来求出中位值首先将分组资料中各组的次数()向上累加起来(↑),再求出中位值的位置。公式如下:

其中,=中位值组之真实下限;=中位值组之次数;=中位值组之组距;=低于中位值组真实下限之累加次数;=全部个案数目。

中位值具有估计或预测的意义。长远来说,以中位值去估计定序变项的数值,所犯的错误总数是最小的。

3.定距变项:均值

定距资料可以作加减运算,故可以将变项的各个数值相加起来,求取一个平均的数值,即均值(简写)。计算的方法,也分为两种情况,即用原资料和用分组资料。(1)根据原资料求出均值

公式:

其中,表示各个个案数值之和,表示全部个案数目。

均值表明了资料的集中趋势,可作估计或预测之用。长远来说,以均值估计定距变项的资料,错误最小。

如果某个变项值重复出现许多次,可以先统计每个值()之次数(),再求取次数与相应变项值之间的乘积(),然后利用各个乘积之总和求出均值。(2)根据分组资料求出均值

公式:

其中,表示每组的次数,表示组中点,表示个案数目。

总的来说,如要测量集中趋势,即找出一个最有代表性之值,定类变项的资料可用众值();定序变项可用众值(),但以中位值()较适宜。定距变项可用众值(),也可用中位值(),但以均值()最适宜。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载