产业技术创新对就业质量影响的实证研究——基于广东省2001-2010年的面板数据
肖鑫钰,李强
华南师范大学经济与管理学院 广东 广州 510006
摘要:本文根据广东省2001-2010年的面板数据,利用主成分分析法分析了产业技术创新对就业质量的影响。本文发现,技术创新人员投入比例、新产品销售收入比例与就业质量呈显著的正相关;技术创新经费投入比例与就业质量呈负相关,但结果并不显著;新产品出口比例则与就业质量呈负相关。
关键词:技术创新 就业质量 主成分分析
中图分类号:F24 文献标识码:A
一、引言
有关理论研究和实证分析表明,增强技术创新能力,加大技术创新投入,提高产业技术创新水平是扩大就业的重要途径。但是技术创新对就业质量的影响如何,专家学者们研究的并不多,本文尝试从实证分析的角度,研究技术创新对就业质量的影响,以引发政府部门以及企业对技术创新政策、路径的思考。
二、研究设计
(一)数据来源及处理
本文选取2001-2010年广东省21个地市的面板数据作为研究的样本数据,所有数据均由历年(2001-2011)《广东统计年鉴》直接或者经过计算得出。
(二)模型设定
本文以广东省的数据研究技术创新对就业质量的影响,就业质量作为被解释变量,以技术创新的相关指标作为解释变量。由于反映就业质量的指标过多,故需要先用主成分分析法将众多指标整合成一个综合指标。
1、主成分分析
主成分分析的一般模型:
假设有n个样品,每个样品观测p个指标,这p个指标分别用X1,X2,···,Xp表示。用向量表示为X=(X1,X2,∧,Xp),对X进行线性变换,可以形成新的综合变量Y,即:
Y1=a11X1+a12X2+···+a1pXp
Y2=a21X1+a22X2+···+a2pXp
·
Yp=ap1X1+ap2X2+···+appXp
2、面板分析
面板模型的一般形式:
其中的Yit是被解释变量,ait代表的是那些影响被解释变量的全部不可观测到的因素,βit表示的是解释变量的系数,Xit代表的是解释变量,εit表示随机扰动项。其下标i表示的是不同的个体,t表示的是研究时间。结合面板数据模型的一般形式,对模型形式设定如下:
f0it=ait+bitx1+b2itx2+b3itx3+b4itx4+uit
其中f0代表各个地级市的就业质量,x1表示为科技活动人员投入比例,x2表示为科技经费投入比例,x3表示为新产品销售收入占总销售收入的比例,x4表示新产品出口占出口额的比例, i=1,2,3…21,分别代表广东省的21个地级市,t代表的是从2001年到2010年的时间序列。
三、主成分分析
为了考察技术创新对就业质量的影响,本文需要通过主成分分析得出就业质量的综合指标。利用主成分综合原始变量的信息,得出变量的综合指标。
表1 主成分分析 |
||||
Principal components/correlation |
Number of obs = 210 |
|||
Rotation: (unrotated = principal) |
Number of comp = 13 |
|||
Trace = 13 |
||||
Rho = 1.0000 |
||||
Component |
Eigenvalue |
Difference |
Proportion |
Cumulative |
Comp1 |
3.09746 |
.993202 |
0.2383 |
0.2383 |
Comp2 |
2.10426 |
.366347 |
0.1619 |
0.4001 |
Comp3 |
1.73791 |
.245411 |
0.1337 |
0.5338 |
Comp4 |
1.4925 |
.421222 |
0.1148 |
0.6486 |
Comp5 |
1.07128 |
.168902 |
0.0824 |
0.7310 |
Comp6 |
.902378 |
.164202 |
0.0694 |
0.8004 |
Comp7 |
.738176 |
.160064 |
0.0568 |
0.8572 |
Comp8 |
.578111 |
.0867007 |
0.0445 |
0.9017 |
Comp9 |
.491411 |
.174153 |
0.0378 |
0.9395 |
Comp10 |
.317257 |
.0864735 |
0.0244 |
0.9639 |
Comp11 |
.230784 |
.0802427 |
0.0178 |
0.9817 |
Comp12 |
.150541 |
.062618 |
0.0116 |
0.9932 |
Comp13 |
.0879232 |
|
0.0068 |
1.0000 |
从表1以可看出,本次主成分分析共提取了8个主成分,它们可以解释原来所有方差的90%,符合一般的统计要求。然后再对数据进行因子分析,提取出8个主成分的计算公式,再运用公式(f1+f2+f3+f4+f5+f6+f7+f8)/8得出总指标f0。
变量描述性统计见表2。
表2 变量描述性统计
变量名称 |
计算方法 |
变量符号 |
观测数 |
平均值 |
标准差 |
最小值 |
最大值 |
就业质量 |
主成分综合分析 |
F0 |
210 |
23.21487 |
4.712427 |
16.957 |
52.564 |
创新活动人员投入比例 |
创新活动人员/从业人员 |
X1 |
210 |
34.32424 |
21.62043 |
2.14 |
97.03 |
创新经费投入比例 |
创新经费投入/总经费投入 |
X2 |
210 |
17.6095 |
22.04803 |
0.15 |
87.63 |
新产品销售收入比例 |
新产品销售收入/总销售收入 |
X3 |
210 |
14.53562 |
18.429 |
0.05 |
91.51 |
新产品出口比例 |
新产品出口额/总出口额 |
X4 |
210 |
7.237381 |
10.6355 |
0.01 |
67.55 |
五、实证分析
(一)面板单位根检验
为了避免模型出现伪回归,确保估计结果的准确和有效性,在对模型进行详细分析之前,需要对各面板数据的平稳性进行检验。本文使用LLC检验进行面板单位根检验,结果显示并非所有变量拒绝存在单位根的原假设,对变量加入趋势项,得出结果如表3,可看出P值都很显著,说明该变量一阶单整。
表3 面板单位根检验结果
|
F0 |
X1 |
X2 |
X3 |
X4 |
检验结 果 |
-18.7851 (0.0000) |
1.0879 (0.8617) |
-3.4884 (0.0002) |
0.0509 (0.5203) |
-5.6938 (0.0000) |
加入趋势项后 |
-17.3792 (0.0000) |
-11.5886 (0.0000) |
-3.4884 (0.0002) |
-5.3351 (0.0000) |
-4.1620 (0.0000) |
注:上表中括号内的为P值。
(二)模型形式判定
面板数据模型包含混合效应模型、固定效应模型和随机效应模型三种形式,模型的选取对论文的研究也是非常重要的,本文通过使用stata11.0软件的相关检验,确定选用固定效应模型。从经济意义上来说,固定效应更倾向于研究样本空间的经济关系,而随机效应更倾向于从个体特征来解释总体特征。本文的研究侧重于解释变量对被解释变量的影响,所以从经济意义上来看,固定效应模型更为合适。
(三)多重共线性检验
为了避免多重共线性问题的影响,本文进行方差膨胀因子分析,回归结果见明各变量的膨胀因子远远小于10,容忍度也在0.1之上,因此可以判断各变量之间多重共线性问题不严重。
(四)进行组间自相关检验
由于经济变量的自身特点、数据特点、变量选择及模型函数形式会导致各期之间的随机扰动项不相互独立。而当回归模型的随机误差项与其滞后项存在相关关系时,导致变量的显著性失去意义。因此有必要对模型进行自相关检验。结果显示,F值为19.98,Prob>F=0.0000,拒绝模型不存在一阶序列相关的原假设,该模型存在一阶序列相关。
(五)进行组间异方差检验
异方差也会使变量的显著性变得毫无意义。因此需要对该模型进行异方差的检验。异方差的基本假设为:
H0:var(ui)=常数
H1:var(ui)≠常数
检验结果显示,统计量的P值均为0,模型存在异方差。
(六)模型回归分析结果
由于模型数据既存在自相关,也存在异方差,因此我们用FGLS进行估计。各变量的估计结果见表4。
表4 各变量回归结果 |
|
Table 7 The regression results of each variable |
|
|
(1) |
|
f0 |
x1 |
0.0293* |
|
(1.89) |
x2 |
-0.0239 |
|
(-1.55) |
x3 |
0.143*** |
|
(8.48) |
x4 |
-0.0699** |
|
(-2.33) |
_cons |
21.05*** |
|
(37.37) |
N |
|