- FinCloud
-
引入定性变量是因为使线性回归模型作为一种及其灵活的工具。
从这一章开始引入定性变量作为自变量,从而使线性回归模型作为一种及其灵活的工具,可以处理经验研究中许多实际的问题。
统计学概念,定性变量qualitativevariable,观测的个体只能归属于几种互不相容类别中的一种时,一般是用非数字来表达其类别,这样的观测数据称为定性变量。类别型变量,也被称为定性变量categoricalvariable。比如性别、省份、学历、产品等级等。这类变量的取值通常是用文字而非数字来表示。
定性变量与定量变量区别
定性:颜色、形状这种。定量:有数字的就是定量。例如:重2吨。2023-06-12 13:40:224
想问变量中属于定性变量有什么
变量中属于定性变量有:长度、重量、产量、人口、速度和温度,它们是由测量或计数、统计所得到的量,这些变量具有数值特征,称为定量变量。变量来源于数学,是计算机语言中能储存计算结果或能表示值抽象概念。变量可以通过变量名访问。在指令式语言中,变量通常是可变的;但在纯函数式语言(如Haskell)中,变量可能是不可变(immutable)的。在一些语言中,变量可能被明确为是能表示可变状态、具有存储空间的抽象(如在Java和VisualBasic中);但另外一些语言可能使用其它概念(如C的对象)来指称这种抽象,而不严格地定义“变量”的准确外延。更多关于变量中属于定性变量有什么,进入:https://m.abcgonglue.com/ask/45a7111615830805.html?zd查看更多内容2023-06-12 13:40:341
定性变量可以确定平均数吗
定性变量不能确定平均数。定性变量(qualitative variable)又名分类变量( categorical variable ):观测的个体只能归属于几种互不相容类别中的一种时,一般是用非数字来表达其类别。释义定量属性是指以数量形式存在着的属性,并因此可以对其进行测量。测量的结果用一个具体的量(称为单位)和一个数的乘积来表示。以物理量为例,距离、质量、时间等都是定量属性。很多在社会科学中考查到的属性,比如能力、人格特征等,也都被视作定量的属性来进行研究。定性是指通过非量化的手段来探究事物的本质。其概念与定量相对应。定性的手段可以包括观测、实验和分析等,以此来考察研究对象是否具有这种或那种属性或特征以及它们之间是否有关系。2023-06-12 13:40:421
定性变量和定性数据的区别
两种数据所依赖的哲学体系不同。 定性数据:其对象是客观的、独立于研究者之外的某种客观存在物。 定量数据,其研究对象与研究者之间的关系十分密切,研究对象被研究者赋予主观色彩,成为研究过程的有机组成部分。2.两种数据在对人本身的认识上有所差异。 定性数据:认为人的个性和人与人之间的差异,进而认为很难将人类简单地划归为几个类别。 定量数据:认为人基本上都是相似的。3.两种数据的目的不同。 定性数据:对特定情况或事物作特别的解释。 定量数据:对各2023-06-12 13:41:032
定性变量计算比例与总数吗
定性变量(qualitative variable)又名分类变量 ( categorical variable ): 观测的个体只能归属于几种互不相容类别中的一种时,一般是用非数字来表达其类别。2023-06-12 13:41:222
下列各项中,属于定性变量的是()
下列各项中,属于定性变量的是() A.空气质量指数B.每季流行色C.天气温度D.月收入正确答案:每季流行色2023-06-12 13:41:291
如何利用spss多元线性回归分析来进行定性变量的分析操作
多元线性回归1.打开数据,依次点击:analyse--regression,打开多元线性回归对话框。2.将因变量和自变量放入格子的列表里,上面的是因变量,下面的是自变量。3.设置回归方法,这里选择最简单的方法:enter,它指的是将所有的变量一次纳入到方程。其他方法都是逐步进入的方法。4.等级资料,连续资料不需要设置虚拟变量。多分类变量需要设置虚拟变量。5.选项里面至少选择95%CI。点击ok。统计专业研究生工作室原创,请勿复杂粘贴2023-06-12 13:41:361
统计学中,定性变量怎么转化成定量变量
定性数据(Qualitative data):包括分类数据和顺序数据,是一组表示事物性质、规定事物类别的文字表述型数据,不能将其量化,只能将其定性。定性数据说明的是事物的品质特征,是不能用数值表示的,通常表现为类别.定量数据说明的是现象的数量特征,是必须用数值来表现的.分为离散数据(Discrete data)和连续数据 (Continuous numerical data) .定性分析与定量分析应该是统一的,相互补充的;定性分析是定量分析的基本前提,没有定性的定量是一种盲目的、毫无价值的定量;定量分析使定性分析更加科学、准确,它可以促使定性分析得出广泛而深入的结论。2023-06-12 13:41:563
定性变量是连续变量对吗
定性变量是连续变量不对。因为定量变量也就是通常所说的连续量,如长度、重量、产量、人口、速度和温度等。所以定性变量是连续变量不对。定性变量的特点是它只能反映现象的属性特点,而不能说明具体量的大小和差异。2023-06-12 13:42:161
年收入是定性变量还是定量变量
定量变量。定量变量也就是通常所说的连续量,如长度、重量、产量、人口、速度和温度等,年收入是由测量或计数、统计所得到的量,这些变量具有数值特征,称为定量变量。2023-06-12 13:42:231
存款属于定性变量吗
可以说属于,但是存款也分比较多的种类,最平常的就是活期和定期,它们的利息收入是不一样的,但是量都会发生一些改变。2023-06-12 13:42:317
分析定性变量对定量变量的影响,可以使用哪些方法
1、定性变量能做相关性分析,相关分析是研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法。2、常用的定量预测方法包括时间序列预测法与回归分析预测法。时间序列预测法是以内生数据为分析对象的预测方法,而回归分析预测法则以外生数据为分析对象。3、定量方法中,时间序列不能利用解释性变量来塑造需求,无法识别诸如价格、广告、促销、市场或经济波动等外部因素或因果因素带来的需求变化。2023-06-12 13:42:521
什么是定量变量
定量变量也就是通常所说的连续量,如长度、重量、产量、人口、速度和温度等,它们是由测量或计数、统计所得到的量,这些变量具有数值特征,称为定量变量。定性变量这些量并非真有数量上的变化,而只有性质上的差异。这些量还可以分为两种,一种是有序变量,它没有数量关系,只有次序关系,如某种产品分为一等品、二等品、三等品等,矿石的质量分为贫矿和富矿;另一种是名义变量,这种变量既无等级关系,也无数量关系,如天气(阴、晴)、性别(男、女)、职业(工人、农民、教师、干部)和产品的型号等。2023-06-12 13:43:012
人均消费支出属于定性变量吗
不属于。因为定性变量又名分类变量 ,观测的个体只能归属于几种互不相容类别中的一种时,一般是用非数字来表达其类别。而人均消费支出,是整体平均人数消费支出的数量,是不属于定性变量的。2023-06-12 13:43:312
spss中定性变量能进行方差分析吗?具体应该怎么做
这种只能采用卡方检验,也就是crosstab进行交叉列联表 ,统计每一类对应另一类的百分比,然后进行卡方检验 会得出类别之间是否相关2023-06-12 13:43:412
体重属于定性变量吗?
体重是不属于定性变量的。测量身高和体重指标所得的变量是瞳孔括约肌由视盘水肿的发生机制中,错误的是肝硬化合并自发性腹膜炎,其主要致病菌是定量变量。2023-06-12 13:43:481
spss多分逻辑回归,定性自变量中的“1”值 系数估计全部为0,而“0”值系数全不为0.为什么呀?
什么B玩意?啊,,我的眼睛2023-06-12 13:43:563
生存天数属于定性变量吗
生存天数不属于定性变量。注意定性变量的特点是定性。而生存天数却是实实在在的变数,所以说生存天数不属于定性变量。2023-06-12 13:44:111
请问一下,在spss中何为定性变量?何为定量变量?
性别这种为定性变量,年龄这种为定量变量2023-06-12 13:44:312
什么是定性变量
定性变量就是定类变量,如逃课原因:昨晚通宵,闹钟坏了,今天天气不好等2023-06-12 13:44:511
请问一下变量中属于定性变量有什么
变量中属于定性变量有:长度、重量、产量、人口、速度和温度,它们是由测量或计数、统计所得到的量,这些变量具有数值特征,称为定量变量。变量来源于数学,是计算机语言中能储存计算结果或能表示值抽象概念。变量可以通过变量名访问。在指令式语言中,变量通常是可变的;但在纯函数式语言(如Haskell)中,变量可能是不可变(immutable)的。在一些语言中,变量可能被明确为是能表示可变状态、具有存储空间的抽象(如在Java和VisualBasic中);但另外一些语言可能使用其它概念(如C的对象)来指称这种抽象,而不严格地定义“变量”的准确外延。更多关于变量中属于定性变量有什么,进入:https://m.abcgonglue.com/ask/45a7111615830805.html?zd查看更多内容2023-06-12 13:44:581
变量中属于定性变量有什么?
变量中属于定性变量有:长度、重量、产量、人口、速度和温度,它们是由测量或计数、统计所得到的量,这些变量具有数值特征,称为定量变量。 变量来源于数学,是计算机语言中能储存计算结果或能表示值抽象概念。变量可以通过变量名访问。在指令式语言中,变量通常是可变的;但在纯函数式语言(如Haskell)中,变量可能是不可变(immutable)的。在一些语言中,变量可能被明确为是能表示可变状态、具有存储空间的抽象(如在Java和VisualBasic中);但另外一些语言可能使用其它概念(如C的对象)来指称这种抽象,而不严格地定义“变量”的准确外延。 更多关于变量中属于定性变量有什么,进入:https://m.abcgonglue.com/ask/45a7111615830805.html?zd查看更多内容2023-06-12 13:45:181
变量中属于定性变量有什么
变量中属于定性变量有:长度、重量、产量、人口、速度和温度,它们是由测量或计数、统计所得到的量,这些变量具有数值特征,称为定量变量。变量来源于数学,是计算机语言中能储存计算结果或能表示值抽象概念。变量可以通过变量名访问。在指令式语言中,变量通常是可变的;但在纯函数式语言(如Haskell)中,变量可能是不可变(immutable)的。在一些语言中,变量可能被明确为是能表示可变状态、具有存储空间的抽象(如在Java和VisualBasic中);但另外一些语言可能使用其它概念(如C的对象)来指称这种抽象,而不严格地定义“变量”的准确外延。更多关于变量中属于定性变量有什么,进入:https://m.abcgonglue.com/ask/45a7111615830805.html?zd查看更多内容2023-06-12 13:45:311
请问变量中属于定性变量有什么
变量中属于定性变量有:长度、重量、产量、人口、速度和温度,它们是由测量或计数、统计所得到的量,这些变量具有数值特征,称为定量变量。 变量来源于数学,是计算机语言中能储存计算结果或能表示值抽象概念。变量可以通过变量名访问。在指令式语言中,变量通常是可变的;但在纯函数式语言(如Haskell)中,变量可能是不可变(immutable)的。在一些语言中,变量可能被明确为是能表示可变状态、具有存储空间的抽象(如在Java和VisualBasic中);但另外一些语言可能使用其它概念(如C的对象)来指称这种抽象,而不严格地定义“变量”的准确外延。 更多关于变量中属于定性变量有什么,进入:https://m.abcgonglue.com/ask/45a7111615830805.html?zd查看更多内容2023-06-12 13:45:391
定性变量与定量变量区别
定性变量是统计学的概念,又名分类变量 ,观测的个体只能归属于几种互不相容类别中的一种时,一般是用非数字来表达其类别,这样的观测数据称为定性变量。定量变量 也就是通常所说的连续量,如长度、重量、产量、人口、速度和温度等,它们是由测量或计数、统计所得到的量,这些变量具有数值特征,称为定量变量。区别:定性变量并非真有数量的变化,而只有性质上的差异。定量变量具有数值特征。扩展资料:变量来源于数学,是计算机语言中能储存计算结果或能表示值抽象概念。变量可以通过变量名访问。在指令式语言中,变量通常是可变的;但在纯函数式语言(如Haskell)中,变量可能是不可变(immutable)的。在一些语言中,变量可能被明确为是能表示可变状态、具有存储空间的抽象(如在Java和Visual Basic中);但另外一些语言可能使用其它概念(如C的对象)来指称这种抽象,而不严格地定义“变量”的准确外延。2023-06-12 13:46:161
spss中定量能转为定性吗
不能定性变量又名分类变量 ,观测的个体只能归属于几种互不相容类别中的一种时,一般是用非数字来表达其类别,这样的观测数据称为定性变量。 定量变量通常所说的连续量,如长度、重量、产量、人口、速度和温度等,它们是由测量或计数、统计所得到的量,这些变量具有数值特征,称为定量变量。 区别:定性变量并非真有数量的变化,而只有性质上的差异。定量变量具有数值特征。 spss中 比如 数字就是定量变量,字符串就可以是定性变量或者分类变量等2023-06-12 13:46:281
定性变量和定量变量的统计图描述方法分别有哪些?
定性变量可以使用统计描述,定量变量可使用相关系数统计量和分布的偏态描述方法。定性变量是统计学的概念,又名分类变量,观测的个体只能归属于几种互不相容类别中的一种时,一般是用非数字来表达其类别,这样的观测数据称为定性变量。定量变量也就是通常所说的连续量,如长度、重量、产量、人口、速度和温度等,它们是由测量或计数、统计所得到的量,这些变量具有数值特征,称为定量变量。2023-06-12 13:46:501
定性变量容许误差怎么算
日允许误差计算公式是标称误差=(最大的绝对误差)/量程*100%。绝对误差=|示值-最小称量误差为0,3. 1/3最大称量的允许误差为1e,2020年10月29日允许误差是:压力表的允许误差=量程×(±精度等级),压力表(英文名称:pressuregauge)是指以...2023-06-12 13:46:591
通常对定性变量计算比例与总数
通常对定性变量计算比例与总数;对定量变量计算平均数与总量。这句话是对的。定性变量(qualitative variable)又名分类变量 ( categorical variable ): 观测的个体只能归属于几种互不相容类别中的一种时,一般是用非数字来表达其类别。定量变量 也就是通常所说的连续量,如长度、重量、产量、人口、速度和温度等,它们是由测量或计数、统计所得到的量,这些变量具有数值特征,称为定量变量。两者的区别为:定性变量并非真有数量的变化,而只有性质上的差异。定量变量具有数值特征。扩展知识:变量的概念变量来源于数学,是计算机语言中能储存计算结果或能表示值抽象概念。变量可以通过变量名访问。在指令式语言中,变量通常是可变的;但在纯函数式语言中,变量可能是不可变的。在一些语言中,变量可能被明确为是能表示可变状态、具有存储空间的抽象;但另外一些语言可能使用其它概念来指称这种抽象,而不严格地定义“变量”的准确外延。2023-06-12 13:47:371
什么是定量变量
定量变量也就是通常所说的连续量,如长度、重量、产量、人口、速度和温度等,它们是由测量或计数、统计所得到的量,这些变量具有数值特征,称为定量变量。定性变量这些量并非真有数量上的变化,而只有性质上的差异。这些量还可以分为两种,一种是有序变量,它没有数量关系,只有次序关系,如某种产品分为一等品、二等品、三等品等,矿石的质量分为贫矿和富矿;另一种是名义变量,这种变量既无等级关系,也无数量关系,如天气(阴、晴)、性别(男、女)、职业(工人、农民、教师、干部)和产品的型号等。2023-06-12 13:48:051
我想问一下变量中属于定性变量有什么
变量中属于定性变量有:长度、重量、产量、人口、速度和温度,它们是由测量或计数、统计所得到的量,这些变量具有数值特征,称为定量变量。变量来源于数学,是计算机语言中能储存计算结果或能表示值抽象概念。变量可以通过变量名访问。在指令式语言中,变量通常是可变的;但在纯函数式语言(如Haskell)中,变量可能是不可变(immutable)的。在一些语言中,变量可能被明确为是能表示可变状态、具有存储空间的抽象(如在Java和VisualBasic中);但另外一些语言可能使用其它概念(如C的对象)来指称这种抽象,而不严格地定义“变量”的准确外延。更多关于变量中属于定性变量有什么,进入:https://m.abcgonglue.com/ask/45a7111615830805.html?zd查看更多内容2023-06-12 13:48:121
定性变量能做相关性分析吗?
定性变量能做相关性分析,相关分析是研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法。例如,人的身高和体重之间,空气中的相对湿度与降雨量之间的相关关系都是相关分析研究的问题。相关分析与回归分析之间的区别:回归分析侧重于研究随机变量间的依赖关系,以便用一个变量去预测另一个变量;相关分析侧重于发现随机变量间的种种相关特性,相关分析在工农业、水文、气象、社会经济和生物学等方面都有应用。扩展资料:相关分析就是对总体中确实具有联系的标志进行分析,其主体是对总体中具有因果关系标志的分析。它是描述客观事物相互间关系的密切程度并用适当的统计指标表示出来的过程。在一段时期内出生率随经济水平上升而上升,这说明两指标间是正相关关系;而在另一时期,随着经济水平进一步发展,出现出生率下降的现象,两指标间就是负相关关系。为了确定相关变量之间的关系,首先应该收集一些数据,这些数据应该是成对的。例如,每人的身高和体重。然后在直角坐标系上描述这些点,这一组点集为“散点图”。2023-06-12 13:48:191
下列属于定性变量的是( )。
【答案】:A本题考查变量的分类。定性变量包括分类变量和顺序变量,分类变量的取值为类别;顺序变量的取值为类别且具有一定顺序。选项BCD的取值都是数值,是定量变量。选项A取值是类别,属于定性变量中的分类变量。2023-06-12 13:48:361
定量变量是什么意思
定量变量就是通常所说的连续量。如长度、重量、产量、人口、速度和温度等,它们是由测量或计数、统计所得到的量,这些变量具有数值特征,称为定量变量。定性变量这些量并非真有数量上的变化,而只有性质上的差异。这些量还可以分为两种,一种是有序变量,它没有数量关系,只有次序关系,如某种产品分为一等品、二等品、三等品等,矿石的质量分为贫矿和富矿;另一种是名义变量,这种变量既无等级关系,也无数量关系,如天气(阴、晴)、性别(男、女)、职业(工人、农民、教师、干部)和产品的型号等。定性变量分类:参数(parameters):此类数据具有区间尺度的所有特性,此外有一个自然零点,数据值之间的比例是有意义的。 (例如:人的体重,飞行里程等)统计数(statistics):是由样本计算所得的数值,它是描述样本特征的数量,如样本平局数 ,样本标准差等。误差:也叫做实验误差(experimental error),是指实验中不可控因素所引起的观测值偏离真值的差异随机误差:也称为抽样误差(sampling error)或偶然误差(accidental error), 它是由于实验中许多无法控制的偶然因素所造成的实验结果与真实结果之间产生的差异,是不可避免的。系统误差:是由于实验处理以外的其他条件不一致所产生的带有倾向性的或定向性的偏差。 系统误差主要是由一些相对固定的因素引起,如仪器调校的差异,不同药品批次的差异,不同操作者操作习惯的差异等。系统误差在某种程度上是可以控制和避免的。2023-06-12 13:48:521
媒介使用频率是什么变量类型
,人数,次数等等是在统计学中的频率--这个是离散的变量。如果采样频率无限大(比方说在单位的样本里面抽取..2023-06-12 13:49:182
是定性变量能做logistic回归吗
可以做logit回归1.打开数据,依次点击:analyse--regression--binarylogistic,打开二分回归对话框。2.将因变量和自变量放入格子的列表里,上面的是因变量,下面的是自变量(单变量拉入一个,多因素拉入多个)。3.设置回归方法,这里选择最简单的方法:enter,它指的是将所有的变量一次纳入到方程。其他方法都是逐步进入的方法。4.等级资料,连续资料不需要设置虚拟变量。多分类变量需要设置虚拟变量。5.选项里面至少选择95%CI。点击ok。2023-06-12 13:49:591
定量和变量是什么?
我也不知道啊2023-06-12 13:50:182
定性变量和定量变量的统计图描述方法分别有哪些
分别有:定性变量能做相关性分析,相关分析是研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法。常用的定量预测方法包括时间序列预测法与回归分析预测法。时间序列预测法是以内生数据(也就是历史需求数据)为分析对象的预测方法,而回归分析预测法则以外生数据(或称解释性数据,比如促销)为分析对象。定量方法中,时间序列不能利用解释性变量来塑造需求,无法识别诸如价格、广告、促销、市场或经济波动等外部因素(外生数据)或因果因素(解释性因素)带来的需求变化。2023-06-12 13:50:251
对应分析是将什么和什么结合
对应分析是将(R)型因子分析和(Q)型因子分析和结合起来进行的统计分析方法。对应分析,也称关联分析、R-Q型因子分析,是近年新发展起来的一种多元相依变量统计分析技术,通过分析由定性变量构成的交互汇总表来揭示变量间的联系。对应分析法可以揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。主要应用在市场细分、产品定位、地质研究以及计算机工程等领域中。原因在于,它是一种视觉化的数据分析方法,它能够将几组看不出任何联系的数据,通过视觉上可以接受的定位图展现出来。对应分析的基本思想是将一个联列表的行和列中各元素的比例结构以点的形式在较低维的空间中表示出来。它最大特点是能把众多的样品和众多的变量同时作到同一张图解上,将样品的大类及其属性在图上直观而又明了地表示出来,具有直观性。另外,它还省去了因子选择和因子轴旋转等复杂的数学运算及中间过程,可以从因子载荷图上对样品进行直观的分类,而且能够指示分类的主要参数(主因子)以及分类的依据,是一种直观、简单、方便的多元统计方法。对应分析法整个处理过程由两部分组成:表格和关联图。对应分析法中的表格是一个二维的表格,由行和列组成。每一行代表事物的一个属性,依次排开。列则代表不同的事物本身,它由样本集合构成,排列顺序并没有特别的要求。在关联图上,各个样本都浓缩为一个点集合,而样本的属性变量在图上同样也是以点集合的形式显示出来。2023-06-12 13:50:551
在对社会现象进行测量时常用的四种变量概念中,属于定性变量的是?
个人感觉:定性是一种程度的东西,修饰语一般是进步性的词;定量在范围修改上小于定性。例如,如果定性的答案是童年、青春期、成年、中年、老年等等,如果定量的答案是具体年龄或更小的年龄范围,那么问一个人有多大2023-06-12 13:51:231
横轴是定性变量吗
不是。横轴是自变量,在平面直角坐标系中表示垂直的数轴,箭头向上(即y轴,y轴上的实数表示纵坐标),在函数中表示因变量。与之对立的,x轴表示自变量。横轴上的点,纵坐标为0.横轴和纵轴互相垂直,都是直线。2023-06-12 13:51:471
定性变量回归时必须设置虚拟变量吗
recode(到新变量),设置新变量名,old and new…,旧的值是原来的值,新的值是你要重新定义的值,其他设置为0。另一个虚拟变量再来一次。希望我的回答对你有所帮助,如果满意请设置为最佳答案,谢谢2023-06-12 13:51:551
一个定性变量有3种分类,需要设置几个虚拟变量?应该如何设置?比如并购分为横向、纵向和混合并购,
你求助我也不会啊,数学我很烂的。不好意思哦。2023-06-12 13:52:174
spss分析中,多个定性变量为自变量时如何分析?
如果太多这样的自变量,不建议做多元回归分析。而是独立样本T检验或方差分析更适合。如果定性变量较少,可以多元回归,办法是虚拟变量法,包括变截距和变斜率。若有帮助,请及时采纳,谢谢统计人刘得意2023-06-12 13:52:261
横轴是定性变量吗
横轴不是定性变量,是自变量。自变量因变量与数学一样。有时候画图的时候和数学不一样,比如微观中涉及价格,宏观中涉及利率时,一般都是自变量,但是在画坐标图时画在纵轴上,c=α+βy自变量是y,横轴表示自变量,和数学一样。2023-06-12 13:52:331
十个学生中的近视人数。是定量变量还是定性变量?
定量变量,因为十个学生已经表明定量了。2023-06-12 13:52:581
数量化理论方法
数量化理论(Theory of quantification)始于20世纪50年代。起初,它的作用仅限于“计量社会学”方面。随着计算机的广泛应用,60年代以后,它在自然科学领域中的应用日益增多。一、数量化理论及其在地下水管理中的应用“数量化”是指把定性的东西用数量来表达。定性数据只是一种状态的描述。它并不具有算术运算性质。数量化理论方法,实际上就是定性数据的分析方法,它是多元分析的一个分支。在我们所研究的问题中,常可根据变量的性质对其分类:一些变量可以被视为变化的原因,称之为说明变量(explanatory variable)或自变量;另一种变量被视为变化的结果,称之为基准变量(criterion variable)或因变量。另一方面,根据其变化情况,又可以分两种情形:一种就是我们通常所说的变量,例如长度、重量、体积等,称之为定量变量;另一种变量并非真有数量上的变化,而只有性质上的差异,例如天气(阴、晴)、岩性(粘土、砂)及水文地质条件(好、差)等,称之为定性变量。在水文地质实际工作中,定性变量的作用是不可忽视的。我们知道,水文地质学是一门实践性很强的科学,在很多情况下,实践经验是非常重要的。例如,在水文地质概化、参数选取时,在具备各种资料的基础上,还要求有丰富的经验。这也就是为什么在建立水文地质预报、管理模型时,单凭数理基础好是不够的。实际上,这种“经验”就是一种定性的东西,很难用数字来表达。利用数量化理论可使专家的经验通过一些定性变量的描述变为可以“计算”的,并用到预报、管理决策中去。这对水文地质专家系统的建立是很有意义的。实际上,定量变量与定性变量之间是可以相互转化的。如果我们将数轴划分为互不相交的若干个区间,当一些定量变量取值于同一区间时,认为是同一等级,这样便将这些定量变量转化为定性变量,相应的数据也转化为定性数据。反之,对于定性变量及其数据,设法按照某一合理的原则,实现向定量方面的转化,并以得到的定量数据为基础进行分类、预测等研究也是可行的,这也正是数量化理论的内容和目的。数量化理论使我们不仅可以利用定量变量,而且可以利用定性变量来研究问题,从而使我们可以更充分地利用信息,更全面地研究并发现事物间的联系和规律性,因而其应用是十分广泛的。但是,数量化理论属于正在发展着的理论,还有不少问题值得研究。例如,项目如何选取、类目如何划分、定量数据转化为定性数据时对结果有何影响等,尤其是将这一理论应用到地下水预测、管理中来,则更是刚刚起步。数量化理论,按其所研究问题的目的不同,可以分为4种类型,分别称为数量化理论Ⅰ、Ⅱ、Ⅲ和Ⅳ。其中,理论Ⅱ、Ⅲ和Ⅳ研究的主要目的是对定量和定性问题进行变量或样品的分类,在此不做叙述。我们主要介绍用来进行预测和发现关系的模型Ⅰ。二、数量化理论Ⅰ在数量化理论中,常把定性变量叫做项目(item),把定性变量的各种不同的取“值”叫做类目(category)。对于某个预测问题(称为基准变量y),其影响因素变量(定性的)可以称为项目:如x1,x2,…,xn;每个定性变量都有几种可能性,那么定性变量所有可能性的范围就是该变量对应的类目。例如,对于预测地下水污染程度(基准变量)而言,污染源形状,包气带岩性、分布等均可视为项目。而每个项目又包括若干个类目,如地下水污染源形状这个项目,它可以有点状污染源、线状污染源和面状污染源三个类目;包气带岩性项目,可以有粘土、粉砂、粗砂、砾石等类目(Zhao Yongsheng,1992)。假定我们观测了n个样品。设第j个项目有rj个类目,则可列出项目、类目反应表(表15-3)。表中:y是基准变量,δi(j,k)(i=1,2,…,n;j=1,2,…,m;k=1,2,…,rj)称为j项目第k类目在i样品中的反应:现代水文地质学如果设x1为污染源形状,则有三个类目,C11,C12,C13;分别为点状、线状和面状污染源。如果在给定的一次实例(一个样品)中,则x1只能是C11,C12和C13这三种情形中的一个,取对应的类目为1,其他两个均为零。如果是线状污染源,则项目x1属于类目C12,令C12=1,C11和C13均为零,这就是式(15-15)所表达的内容。表15-3 项目类目表根据δi(j,k)的性质有:现代水文地质学由所有的δi(j,k)构成了反应矩阵X,X为n×p阶矩阵。现代水文地质学(一)数量化理论Ⅰ的数学模型及其求解现代水文地质学或现代水文地质学这里,bjk是仅依赖于j项目第k类目的常系数,εi是第i次抽样中的随机误差,为基准变量向量,X为反应矩阵,为系数向量,为误差向量,其他符号意义同前。根据已知样品与基准变量,我们可以求得模型中的未知系数bjk。利用最小二乘法,即为寻求bjk,使得:现代水文地质学达到最小。为此,求q关于buv的偏导数,并令其等于零,得:现代水文地质学因为这是极小值点的必要条件,故bjk达到最小值时满足:现代水文地质学式(15-20)的矩阵形式为:现代水文地质学式中:y=(y1,y2,…,yn)T;我们称式(15-20)或式(15-21)为正规方程组。可以证明:①正规方程组的系数矩阵是对称的;②由于反应矩阵X是定性变量的赋值矩阵,所以正规方程(15-21)的系数矩阵X′X是不满秩的,其秩R(X′X)最多是rj-m+1。因此,方程的解是无穷多的。假定X′X的秩是rj-m+1(在实际问题中,当n足够大时可以保证),这时我们可以删去第j项目(j=2,…,m)第一类目的方程,并取=0。这样删除后的矩阵为满秩矩阵,故可惟一地解出其余的。在数学上可以证明,这样得到的解并不失一般性,它能使式(15-19)中的q达到最小。的表达式为:现代水文地质学(二)预测精度分析(1)复相关系数r:现代水文地质学式中:分别为预测值和实测值;为实测平均值。r值越接近1,说明预测精度越高。(2)剩余均方:现代水文地质学式中:n为样品数;m为影响变量数。剩余均方值越小,说明精度越高。(三)既有定性变量又有定量变量时的模型当所考虑的问题既有定性变量又有定量变量时,固然我们可以使用将定量变量分为若干等级的办法转化为定性变量,再用数量化理论I的方法来处理。但是,这样转化有时是不适当的,因为定量变量向定性变量的转化实际上是损失了数据中的信息。设某一问题有m个项目,有h个定量变量,它们在第i个样品中的数据为xi(u)(u=1,2,…,h;i=1,2,…,n)。利用上述推导数量化理论模型I的方法,完全可以得到既有定量变量又有定性变量的类似结果。现代水文地质学2023-06-12 13:53:071
什么是定量变量
定量变量也就是通常所说的连续量,如长度、重量、产量、人口、速度和温度等,它们是由测量或计数、统计所得到的量,这些变量具有数值特征,称为定量变量。定性变量这些量并非真有数量上的变化,而只有性质上的差异。这些量还可以分为两种,一种是有序变量,它没有数量关系,只有次序关系,如某种产品分为一等品、二等品、三等品等,矿石的质量分为贫矿和富矿;另一种是名义变量,这种变量既无等级关系,也无数量关系,如天气(阴、晴)、性别(男、女)、职业(工人、农民、教师、干部)和产品的型号等。2023-06-12 13:54:452
用R做logistic回归,定性自变量太多导致报错怎么办
用R做logistic回归,定性自变量太多导致报错怎么办先减少定性自变量个数,试一试。如果仍报错,则可能是其它原因。 或者,同时辅助SPSS软件试一试。2023-06-12 13:54:561