论坛回顾计量模型设定与数据说明

白癜风诊疗目标 http://baidianfeng.39.net/a_yqyy/140828/4458139.html

经济学研究的基本流程

一、现象与问题

现象与问题:对能被观察到的情况所提出的问题。

是什么:历史、现状和事件;自然和社会环境;模式和结构。

为什么:原因、机制。

怎么样:未来趋势、现象存在的影响。

二、因果、解释、假说及其逻辑

例子: 工资一定会降低企业出口吗(孙楚仁,B)

假说: 工资对企业出口行为(可能性与出口额)的影响呈“倒U型”。

逻辑: 工资上涨导致企业更可能创新和生产成本上涨,两者存在一个平衡点。当 工资较低时, 工资上涨导致企业创新带来的效率提高大于生产成本上涨,当 工资较高时, 工资上涨导致企业创新带来的效率提高小于生产成本上涨。

实证后归纳机制: 工资上升倒逼企业投入更多创新和提高效率,效率提高超过了成本上涨,结果企业更可能出口和出口得更多; 工资进一步上升带来的成本上涨效应超过了创新和效率提升效应,结果企业出口可能性和出口额都下降。

三、概念的形成、分解

概念的内涵和外延:能用哪些数据去代表概念。

概念的分解:

例子:企业出口升级——企业+出口升级

使用各种搜索,查找单词概念的含义,由此生成自己的概念。

出口升级:逐步由劳动密集、高能耗、资源类、低技术、低技能、低质量、低附加值等商品出口为主,转为资本密集、低能耗、工业品、高技术、高技能、高质量、高附加值等商品出口为主。

出口升级的外延:企业出口的产品的资本密集度、能耗、工业化水平、技术含量、技能含量、质量、附加值等方面的提升,带来多个角度的问题研究: 工资与企业出口附加值提升、 工资与企业出口质量升级、 工资与企业出口产品能耗。

四、文献搜索与核心文献确定

CNKI,Bing,GoogleScholar,EBSC

文献的核心性与其包含的核心概念的数目有关

五、计量模型设定、变量选择和指标测度

概念的变量化和测度:通过参考核心文献来确定概念的变量化和测度方式,核心是你能找到什么样的方式去代替这个概念,能够让一个概念变成一个可以用数据代表的东西。

变量构造:

常规:根据经济含义或定义计算。

文献:根据核心文献中的计算方法计算。

创新:根据定义、概念分解等界定变量、设计指标和计算(更高要求)。

计量模型设定:尽量能找到和自己研究核心概念一致的核心参考文献,这样就可以参考核心文献来设定计量模型。或者根据自己论文中概念的一般测度方式来设计计量模型。如果被解释与解释变量之间存在非线性关系,可能要用到非线性模型、分位数回归模型或者门槛回归模型。

调查数据的结构:

时间序列数据:同一变量一段时间内不同时点的观测值。

截面数据:同一时点不同变量的观测值。

纵向数据:一段时间不同时点多个变量的数据。

常用数据:

1.宏观数据:

国家数据:WDI,IMF,WD等发布的各国统计数据,中国统计年鉴数据;

省份/区域数据:中国统计年鉴数据,中国区域统计年鉴;

城市数据:中国区域统计年鉴、中国城市统计年鉴;

县域数据:中国县域统计年鉴。

2.中观数据:

中国工业统计数据库、产品产量数据库。

3.微观数据:

企业数据:中国工业企业数据、中国海关进出口统计数据、世行各国营商环境调查数据。

个人数据:中国社会综合调查(CGSS)、中国健康和营养调查(CHNS)、中国纵向健康长寿调查(CLHLS)、中国家庭收入调查(CHIP)、城市住户调查(UHS)、国有企业改革和效率调查、中国大学毕业生就业与能力调查(MyCOS)、中国城市女性及其家庭消费行为调查、中国家庭面板追踪数据(CFPS)、中国健康和退休纵向调查、中国人口普查抽样数据、中国农业家庭调查、农村贫困与发展调查。

查找数据的时候要注意:数据样本的容量、随机性、可得性、代表性、如何处理缺失值。

论文分享

一、中国交通基础设施的资源再配置效应——《经济研究》

基准模型:

变量说明:

i,j,t分别代表城市、行业、年份,被解释变量表示资源错配率。本文同时构建和使用企业份额与生产率的协方差(OPcov)、行业内生产率分布的标准差、95%分位企业的TFP与5%分位企业的TFP之比、90%分位企业的TFP与10%分位企业的TFP之比四个指标衡量城市行业间资源错配程度。OP协方差值越高表示资源错配程度越低,其经济学含义为OPcov度量企业的产出或职工人数份额是否与生产率成比例增长,若资源得到优化配置,意味着贡献更多生产率的 企业得到更多资源,OP协方差便越高,表示资源错配便得到改善,其他指标含义则相反。

核心解释变量是四种交通工具。其中,HSR表示是否通高速铁路,Airport表示是否有民用机场,Highway表示高速公路密度,Railway表示是否有普通铁路。Z为城市层面的控制变量,主要有城市人口规模和城市人均产出等。本文还用城市固定效应(δi)控制不随时间变化的城市特征因素,用时间固定效应(γt)控制时间维度的宏观经济冲击,用行业固定效应(ηj)控制行业层面不随时间变化的特征因素。此外,为避免遗漏变量可能导致时间趋势不一致的影响,还对区域-时间固定效应和行业-时间固定效应分别进行控制。下标c代表省份,σct为区域-时间交互的联合固定效应,考虑随区域和时间同时变化的因素;σjt为行业-时间交互的联合固定效应,用以控制随行业和时间同时变化的因素。

数据说明:

一是交通数据。高铁线路的开通时间、修建时间和高铁站点等信息主要来自历年《中国铁道年鉴》以及中国铁路总公司网站报道或公告。机场、高速公路和普通铁路等道路交通信息来自中国民航局、交通运输部和网站等。

二是矢量数据。原始数据来源于中国地理空间数据云DEM数字高程数据SRTM(ShuttleRadarTopographyMission,精度90M)、中国行*区划矢量图、—年的中国交通地图册。

三是企业数据。原始数据来自中国国家统计局—年的工业企业数据库,其中年由于数据质量问题,从样本中剔除。

二、中国环境保护税与绿色创新:杠杆效应还是挤出效应——《经济研究》

基准模型:

变量说明:

在模型中,i,j,r,t分别表示工业企业、行业、地区以及时间。被解释变量是上市公司绿色专利申请量占企业当期所有专利申请数量的比重。解释变量包括:(1)环境保护税实施时间虚拟变量:年之前,为0;年之后,为1。(2)应税污染物课税标准调整的地区虚拟变量:提高应税污染物课税标准的地区为实验组地区,为1;应税污染物课税标准不变的地区,为0。(3)行业污染特征变量:如果该行业为重污染行业,取值为1;否则,取值为0。

核心解释变量的系数是三重差分估计量,考察的是环境保护税实施前后对应税污染物课税标准提高的地区与应税污染物课税标准不变地区,污染行业与清洁行业之间上市公司绿色专利申请占比的影响。同时,根据既有研究模型控制了有可能影响企业专利申请的变量,包括企业年龄、规模、盈利能力等。 ,模型引入三组双维固定效应,用于控制地区-时间固定效应、行业-时间固定效应和地区-行业的固定效应进一步巩固*策评估因果识别的可靠性。为企业固定效应,控制企业层面不随时间变化的因素对绿色创新的影响,是随机扰动项。

数据说明:

绿色创新是减少污染物排放和能源使用的技术、产品、过程的总称。本文聚焦企业绿色技术创新。世界知识产权局根据《联合国气候变化框架公约》的规定,将绿色技术分为可替代能源、交通运输类、废弃物管理类、能源节约类等七大领域,共涉及约个与环境友好技术直接相关的主题。本文按照该绿色创新标准,识别并核算了中国A股上市公司—年的绿色技术创新数据,并在此基础上区分了实质创新和策略创新、末端治理和源头管控绿色创新,作为企业绿色创新活动的衡量指标。同时,本文使用了—年间中国沪深股市A股制造业上市公司的半年度财务数据。企业专利与财务数据分别来自中华人民共和国国家知识产权局与国泰安数据库,行业划分参照国家统计局年公布的国民经济行业分类标准(GB/T-)。

文案丨翁宇昇

排版丨赵彭琰

初审丨伍希文

复审丨郑荣森

终审丨孙楚仁

预览时标签不可点收录于话题#个上一篇下一篇

转载请注明:http://www.abuoumao.com/hyfw/626.html

网站简介| 发布优势| 服务条款| 隐私保护| 广告合作| 网站地图| 版权申明

当前时间:
粤ICP备19025322号-2