The Impact of Public Data Openness on Innovation in Private Enterprises
-
摘要: 民营企业作为科技创新的主体,是推动创新驱动发展战略实施的重要力量。基于2007—2022年沪深A股民营上市公司数据,借助省级政府建立公共数据开放平台的准自然实验,构建多时点双重差分模型实证考察公共数据开放对民营企业创新的影响与作用机制。研究发现,公共数据开放促进了民营企业创新,使民营企业专利申请数量平均增加7.8%,该影响通过改善市场竞争环境和降低企业经营风险这两个机制予以实现。对于年轻企业、数字化水平较高、行业竞争程度较低以及知识产权保护水平较高地区的企业,公共数据开放对民营企业创新的促进作用更为显著。此外,公共数据开放促使民营企业采取实质性创新和合作创新策略,并提升了企业的经营绩效和市场价值。本研究为深入理解公共数据开放的创新驱动机制提供了经验证据,对优化公共数据供给体系,促进民营企业高质量发展具有重要的政策启示。Abstract: As the main body of science and technology innovation, private enterprises are an important force in promoting the implementation of the innovation-driven development strategy. Based on the data from private listed companies on A-share markets of Shanghai and Shenzhen from 2007 to 2022, and utilizing the quasi-natural experiment of public data openness platforms established by provincial governments, this study constructs a multi-period difference-in-difference model to empirically investigate the impact and mechanisms of public data openness on private enterprises innovation. The research shows that public data openness promotes innovation in private enterprises and increases the number of their patent applications by an average of 7.8%. This impact is realized through two mechanisms: improving the market competition environment and reducing business risks. The promoting effect of public data openness on private enterprise innovation is more significant for the younger enterprises, and the enterprises with higher digitization levels, lower levels of competition in the industry, and in regions with higher levels of intellectual property protection. In addition, public data openness prompts private enterprises to adopt substantive and collaborative innovation strategies, and enhances their business performance and market value. This study provides empirical evidence for a deeper understanding of the innovation-driving mechanisms of public data openness and offers important policy implications for optimizing the public data supply system and promoting the high-quality development of private enterprises.
-
表 1 省市自治区公共数据开放平台上线情况
上线年份 上线省份 新增数量 累计数量 2012 北京、上海 2 2 2015 浙江 1 3 2016 广东、贵州 2 5 2018 河南、江西、山东、陕西、宁夏 5 10 2019 天津、福建、江苏、四川、海南、新疆 6 16 2020 湖北、湖南、广西、青海 4 20 2021 安徽、河北、甘肃、重庆 4 24 注:根据《中国地方公共数据开放利用报告——省域(2023)》相关信息整理所得。 表 2 主要变量定义
变量 变量名称 变量符号 变量定义 被解释变量 企业创新 Lnpatent 企业专利申请数量加1取自然对数 解释变量 公共数据开放 Open 企业所在地区(省/自治区/直辖市)建立公共数据开放平台当年及以后,Open取值为1,否则取0 控制变量 企业规模 Lnsize 企业年末总资产的自然对数 企业年龄 Lnage 企业注册成立年限的自然对数 资产负债率 Lev 总负债/总资产 资产收益率 Roa 净利润/总资产 固定资产比例 Fix 固定资产净额/总资产 企业发展能力 Growth 营业收入增长率 股权集中度 Shrcr 第一大股东持股比例 流动比率 Cration 流动资产/流动负债 经济发展水平 Lnpgdp 人均地区生产总值(元/人)的自然对数 产业结构 Industry 第二产业增加值占GDP的比重 表 3 描述性统计
Panel A:全样本描述性统计 变量 样本量 均值 标准差 最小值 中位数 最大值 Lnpatent 22 374 1.972 1.594 0.000 2.079 9.017 Open 22 374 0.550 0.498 0.000 1.000 1.000 Lnsize 22 374 21.740 1.019 19.735 21.627 24.850 Lnage 22 374 2.812 0.385 0.693 2.890 4.174 Lev 22 374 0.368 0.192 0.045 0.352 0.859 Roa 22 374 0.043 0.067 -0.285 0.046 0.210 Fix 22 374 0.184 0.129 0.003 0.162 0.557 Growth 22 374 0.185 0.378 -0.570 0.131 2.158 Shrcr 22 374 0.319 0.134 0.087 0.301 0.685 Cration 22 374 3.132 3.274 0.447 1.997 20.692 Lnpgdp 22 374 11.207 0.498 9.763 11.241 12.156 Industry 22 374 0.410 0.088 0.159 0.427 0.543 Panel B:单变量检验 变量 Open=1 Open=0 均值差异 均值 标准差 均值 标准差 Lnpatent 2.188 1.621 1.708 1.518 0.480*** 注:***表示1%的显著性水平。 表 4 基准回归结果
变量 (1) (2) (3) Open 0.066** 0.068** 0.078*** (0.031) (0.027) (0.027) Lnsize 0.205*** 0.203*** (0.041) (0.042) Lnage 0.054 0.056 (0.106) (0.109) Lev -0.265*** -0.257*** (0.092) (0.093) Roa 0.689*** 0.687*** (0.159) (0.161) Fix 0.408** 0.400** (0.153) (0.155) Growth -0.069*** -0.068*** (0.020) (0.020) Shrcr 0.378** 0.370** (0.181) (0.180) Cration -0.007* -0.007* (0.003) (0.003) Lnpgdp 0.186 (0.255) Industry 1.406 (1.018) Constant 1.936*** -2.767*** -5.402* (0.017) (0.930) (2.721) 企业固定效应 是 是 是 行业×年份固定效应 是 是 是 Observations 22 374 22 374 22 374 R2 0.776 0.779 0.779 注:***、**、*分别表示1%、5%、10%的显著性水平;括号内数字是聚类到省份层面的稳健标准误。下表同。 表 5 异质性稳健估计结果
平均处理效应 (1) (2) (3) Callaway-Sant' Anna估计量 Sun-Abraham估计量 Borusyak等估计量 估计系数 0.142*** 0.247*** 0.183*** (0.043) (0.091) (0.047) 表 6 替换被解释变量与改变估计方法
变量 (1) (2) (3) (4) (5) Lnpatent_grant Lnpatent_weight Patent_IHS Patent_rdexp Patent_raw Open 0.087*** 0.065** 0.089*** 0.216** 0.075* (0.026) (0.024) (0.032) (0.090) (0.041) Constant -3.916 -4.603* -6.288* -12.643 -19.786** (2.605) (2.316) (3.166) (26.612) (9.802) 控制变量 是 是 是 是 是 企业固定效应 是 是 是 是 是 行业×年份固定效应 是 是 是 是 是 Observations 18 944 22 374 22 374 20 153 19 747 R2 0.792 0.788 0.773 0.835 0.881 注:列(5)中的R2为Pseudo R2值。 表 7 内生性处理
变量 (1) (2) (3) (4) 第一阶段 第二阶段 倾向得分匹配 熵平衡匹配 Open 0.726** 0.070** 0.208*** (0.331) (0.034) (0.057) IV 0.097*** (0.021) Constant 1.020 -6.248* -10.050*** (5.467) (3.406) (3.081) 控制变量 是 是 是 是 企业固定效应 是 是 是 是 行业×年份固定效应 是 是 是 是 Observations 22 374 22 374 15 044 22 374 R2 0.766 0.803 0.767 F test of excluded instruments 20.57 [0.000] Kleibergen-Paap rk LM 6.89 [0.009] Cragg-Donald Wald F 564.181 {16.38} 注:[]内为Kleibergen-Paap rk LM统计量的P值,{ }内为Stock-Yogo在10%显著性水平上的临界值。 表 8 排除同期相关政策干扰
变量 (1) (2) (3) (4) (5) Open 0.073** 0.091*** 0.082*** 0.079*** 0.085*** (0.027) (0.029) (0.027) (0.028) (0.028) Datatrade 0.138** 0.095* (0.052) (0.051) Bigdata 0.096 0.053 (0.062) (0.076) Broadband 0.122** 0.088* (0.050) (0.048) Internet 0.094* 0.014 (0.049) (0.047) Constant -6.282** -5.767** -5.482* -5.692** -6.313** (2.631) (2.671) (2.820) (2.782) (2.736) 控制变量 是 是 是 是 是 企业固定效应 是 是 是 是 是 行业×年份固定效应 是 是 是 是 是 Observations 22 374 22 374 22 374 22 374 22 374 R2 0.779 0.779 0.779 0.779 0.779 表 9 其他稳健性检验
变量 (1) (2) (3) (4) (5) 排除预期效应 未来一期 双重聚类 排除疫情影响 剔除直辖市 Open 0.083** 0.091*** 0.078** 0.067** 0.069** (0.036) (0.030) (0.028) (0.026) (0.032) Pre1 0.011 (0.039) Constant -5.415* -2.028 -5.402* -3.910 -5.842** (2.742) (3.050) (2.620) (2.423) (2.807) 控制变量 是 是 是 是 是 企业固定效应 是 是 是 是 是 行业×年份固定效应 是 是 是 是 是 Observations 22 374 18 944 22 374 14 894 18 871 R2 0.779 0.790 0.779 0.774 0.780 表 10 机制检验结果
变量 (1) (2) 变量 (3) (4) Com_number Com_market Risk_zscore Risk_income Open 0.092** 0.246*** Open 0.394*** -0.013** (0.039) (0.079) (0.140) (0.006) Constant 7.063*** -9.725*** Constant 64.050*** 0.839** (1.636) (3.547) (17.204) (0.402) 控制变量 是 是 控制变量 是 是 省份固定效应 是 是 企业固定效应 是 是 年份固定效应 是 是 行业×年份固定效应 是 是 Observations 496 496 Observations 22 004 18 944 R2 0.974 0.953 R2 0.837 0.351 表 11 异质性检验:企业年龄和数字化水平
变量 (1) (2) (3) (4) 年轻企业 成熟企业 高数字化水平 低数字化水平 Open 0.120*** 0.041 0.117*** -0.012 (0.027) (0.037) (0.028) (0.038) Constant -2.896 -8.688* -3.300 -11.326 (4.901) (4.708) (2.682) (6.889) 控制变量 是 是 是 是 企业固定效应 是 是 是 是 行业×年份固定效应 是 是 是 是 Observations 10 152 12 222 14 227 8 147 R2 0.784 0.800 0.799 0.826 组间系数差异P值 P=0.065* P=0.008*** 注:组间系数差异检验的P值采用费舍尔组合检验通过1000次随机抽样计算得到。表 12同。 表 12 异质性检验:行业竞争程度和地区知识产权保护水平
变量 (1) (2) (3) (4) 低竞争行业 高竞争行业 强知识产权保护 弱知识产权保护 Open 0.109*** 0.027 0.095** 0.020 (0.031) (0.042) (0.041) (0.036) Constant -6.214* -6.110 -10.154** -1.031 (3.278) (4.634) (4.780) (3.552) 控制变量 是 是 是 是 企业固定效应 是 是 是 是 行业×年份固定效应 是 是 是 是 Observations 11 573 10 801 12 537 9 837 R2 0.808 0.778 0.818 0.813 组间系数差异P值 P=0.049** P=0.082* 表 13 创新策略分析
变量 (1) (2) 实质性创新 合作创新 Open 0.063** 0.070*** (0.030) (0.021) Constant -5.571* -3.663 (2.981) (2.789) 控制变量 是 是 企业固定效应 是 是 行业×年份固定效应 是 是 Observations 22 374 22 374 R2 0.762 0.662 表 14 经济效果分析
变量 (1) (2) (3) (4) Roa Roa TobinQ TobinQ Open 0.004* 0.001 0.098** 0.017 (0.002) (0.003) (0.036) (0.062) Open×Lnpatent 0.001* 0.041** (0.001) (0.018) Lnpatent 0.002** -0.043* (0.001) (0.022) Constant -0.528*** -0.512*** 23.679*** 23.617*** (0.142) (0.139) (4.622) (4.617) 控制变量 是 是 是 是 企业固定效应 是 是 是 是 行业×年份固定效应 是 是 是 是 Observations 22 374 22 374 21 740 21 740 R2 0.588 0.588 0.712 0.712 -
[1] 林志帆, 龙小宁. 社会资本能否支撑中国民营企业高质量发展[J]. 管理世界, 2021(10): 56-73. doi: 10.3969/j.issn.1002-5502.2021.10.005 [2] 吴延兵. 中国哪种所有制类型企业最具创新性[J]. 世界经济, 2012(6): 3-29. [3] 余明桂, 范蕊, 钟慧洁. 中国产业政策与企业技术创新[J]. 中国工业经济, 2016(12): 5-22. [4] 彭远怀. 政府数据开放的价值创造作用: 企业全要素生产率视角[J]. 数量经济技术经济研究, 2023(9): 50-70. [5] NAGARAJ A. The private impact of public data: landsat satellite maps increased gold discoveries and encouraged entry[J]. Management Science, 2022, 68(1): 564-582. [6] 方锦程, 刘颖, 高昊宇, 等. 公共数据开放能否促进区域协调发展——来自政府数据平台上线的准自然实验[J]. 管理世界, 2023(9): 124-142. [7] 黄先海, 虞柳明. 政府数据开放能提升城市创新水平吗——来自中国地级市的证据[J]. 浙江学刊, 2023(4): 88-98. [8] 蔡运坤, 周京奎, 袁旺平. 数据要素共享与城市创业活力——来自公共数据开放的经验证据[J]. 数量经济技术经济研究, 2024(8): 5-25. [9] 欧阳伊玲, 王愉靖, 李平, 等. 数据要素与城投债定价: 基于公共数据开放的准自然实验[J]. 世界经济, 2024(2): 174-203. [10] FURMAN J L, NAGLER M, WATZINGER M. Disclosure and subsequent innovation: evidence from the patent depository library program[J]. American Economic Journal: Economic Policy, 2021, 13(4): 239-270. doi: 10.1257/pol.20180636 [11] 王海, 叶帅, 尹俊雅. 公共数据开放如何提振企业有效投资——基于产能利用视角[J]. 中国工业经济, 2024(8): 137-153. doi: 10.3969/j.issn.1006-480X.2024.08.008 [12] 陈艳利, 蒋琪. 数据生产要素视角下开放公共数据与企业创新——基于建立公共数据开放平台的准自然实验[J]. 经济管理, 2024(1): 25-46. doi: 10.3969/j.issn.2095-7238.2024.01.005 [13] 张吉昌, 龙静. 政府数据开放何以赋能企业创新?[J]. 现代经济探讨, 2024(4): 29-43. doi: 10.3969/j.issn.1009-2382.2024.04.005 [14] JONES C, TONETTI C. Nonrivalry and the economics of data[J]. American Economic Review, 2020, 110(9): 2819-2858. doi: 10.1257/aer.20191330 [15] 谢康, 夏正豪, 肖静华. 大数据成为现实生产要素的企业实现机制: 产品创新视角[J]. 中国工业经济, 2020(5): 42-60. [16] GHASEMAGHAEI M, CALIC G. Assessing the impact of big data on firm innovation performance: big data is not always better data[J]. Journal of Business Research, 2020, 108(1): 147-162. [17] 蔡继明, 刘媛, 高宏, 等. 数据要素参与价值创造的途径——基于广义价值论的一般均衡分析[J]. 管理世界, 2022(7): 108-121. [18] 徐翔, 赵墨非, 李涛, 等. 数据要素与企业创新: 基于研发竞争的视角[J]. 经济研究, 2023(2): 39-56. [19] MELITZ M J, OTTAVIANO G I P. Market size, trade, and productivity[J]. The Review of Economic Studies, 2008, 75(1): 295-316. [20] ANTONIADES A. Heterogeneous firms, quality, and trade[J]. Journal of International Economics, 2015, 95(2): 263-273. [21] 张杰, 郑文平, 翟福昕. 竞争如何影响创新: 中国情景的新检验[J]. 中国工业经济, 2014(11): 56-68. [22] DINOPOULOS E, SYROPOULOS C. Rent protection as a barrier to innovation and growth[J]. Economic Theory, 2007, 32(2): 309-332. [23] JOHN K, LITOV L, YEUNG B. Corporate governance and risk-taking[J]. The Journal of Finance, 2008, 63(4): 1679-1728. [24] HIRSHLEIFER D, LOW A, TEOH S H. Are overconfident CEOs better innovators[J]. The Journal of Finance, 2012, 67(4): 1457-1498. [25] 王玉泽, 罗能生, 刘文彬. 什么样的杠杆率有利于企业创新[J]. 中国工业经济, 2019(3): 138-155. [26] 黎文靖, 郑曼妮. 实质性创新还是策略性创新——宏观产业政策对微观企业创新的影响[J]. 经济研究, 2016(4): 60-73. [27] BECK T, LEVINE R, LEVKOV A. Big bad banks? the winners and losers from bank deregulation in the united states[J]. The Journal of Finance, 2010, 65(5): 1637-1667. [28] GOODMAN-BACON A. Difference-in-differences with variation in treatment timing[J]. Journal of Econometrics, 2021, 225(2): 254-277. [29] CALLAWAY B, SANT'ANNA P H C. Difference-in-differences with multiple time periods[J]. Journal of Econometrics, 2021, 225(2): 200-230. [30] SUN L, ABRAHAM S. Estimating dynamic treatment effects in event studies with heterogeneous treatment effects[J]. Journal of Econometrics, 2021, 225(2): 175-199. [31] BORUSYAK K, JARAVEL X, SPIESS J. Revisiting event-study designs: robust and efficient estimation[J]. Review of Economic Studies, 2024, 91(6): 3253-3285. [32] 余泳泽, 刘大勇. 我国区域创新效率的空间外溢效应与价值链外溢效应——创新价值链视角下的多维空间面板模型研究[J]. 管理世界, 2013(7): 6-20. [33] 杨梦俊, 喻理. 行业协会与企业创新[J]. 世界经济, 2024(7): 66-96. [34] 王分棉, 贺佳, 陈丽莉. 连锁董事绿色经历会促进企业绿色创新"增量提质"吗[J]. 中国工业经济, 2023(10): 155-173. [35] 张文文, 景维民. 数字经济监管与企业数字化转型——基于收益和成本的权衡分析[J]. 数量经济技术经济研究, 2024(1): 5-24. [36] 王小鲁, 胡李鹏, 樊纲. 中国分省份市场化指数报告[M]. 北京: 社会科学文献出版社, 2021. [37] 李建军, 韩珣. 非金融企业影子银行化与经营风险[J]. 经济研究, 2019(8): 21-35. [38] 孟庆玺, 白俊, 施文. 客户集中度与企业技术创新: 助力抑或阻碍——基于客户个体特征的研究[J]. 南开管理评论, 2018(4): 62-73. [39] MILLER D, FRIESEN P H. A longitudinal study of the corporate life cycle[J]. Management Science, 1984, 30(10): 1161-1183. [40] 吴非, 胡慧芷, 林慧妍, 等. 企业数字化转型与资本市场表现——来自股票流动性的经验证据[J]. 管理世界, 2021(7): 130-144. [41] 吴超鹏, 唐菂. 知识产权保护执法力度、技术创新与企业绩效——来自中国上市公司的证据[J]. 经济研究, 2016(11): 125-139. [42] 余长林, 孟祥旭. "一带一路"倡议如何促进中国企业创新[J]. 国际贸易问题, 2022(12): 130-147. -