国家税务总局南平市税务局课题组
(注:本文有删减,原文详见福建省税务学会《研究报告》2026年第2期)
【摘要】本文针对小微企业所得税政策执行中出现“贴线申报”现象,运用群聚模型分析方法,构建覆盖东西部地区1526家小微企业、跨越2021-2024年的大样本数据库,深度挖掘政策执行悖论的内在机制。研究发现,在应纳税所得额300万元断点处形成20%的税负跳变催生系统性违规行为——东部地区违规聚集强度(EM值)达0.126,西部地区为0.074,其中服务业违规风险最高(EM=0.240),制造业次之(EM=0.136)。通过构建“改进四次多项式+行业异质性”创新模型,精准识别出应纳税所得额位于270-300万元区间中有39.8%的企业存在违规行为,具体表现为隐匿收入、虚列成本、税基调节等五大类型。基于实证,本文创新性提出“动态门槛+数据穿透”治理框架:制度层面设计四阶段累进税率消除断点效应;技术层面构建多源数据融合的智能风险识别体系,实现从“被动应对”向“主动预防”转变。本研究为数字化转型背景下小微企业精准治理提供了重要理论创新和实践指导,对构建现代化税收征管体系具有重大意义。
【关键词】小微企业 群聚模型 贴线申报 动态门槛 数据穿透监管
一、问题缘起:“贴线申报”现象的现实紧迫性
小微企业作为我国经济发展的重要基石,截至2023年底,全国登记在册的小微企业和个体工商户超过1.8亿户,占全部经营主体的97.4%。这些市场主体贡献了全国60%以上的GDP、70%以上的技术创新成果和80%以上的城镇劳动就业,成为支撑国民经济健康发展的“毛细血管”。为充分释放小微企业发展潜能,我国构建了以小型微利企业所得税优惠为核心的政策支持体系。2023年,全国享受小微企业税收优惠政策的企业数量突破3200万户,累计新增减税降费及退税缓费超过5000亿元,政策惠及面与减税力度均创历史新高。
(一)政策“阈值效应”:300万元临界点的税负跳变
然而,现行小微企业所得税政策采用“一刀切”阈值设计,在300万元处形成显著税负跳跃:不超过300万元的部分适用5%实际税负,超过则全额按25%税率征税,形成20个百分点的税负差。以应纳税所得额299万元与301万元的企业对比为例:前者应纳税额仅需14.95万元,后者却需缴纳75.25万元,仅2万元的利润差异却带来60.3万元的税负差异,边际税负率高达3015%,这种“悬崖效应”强烈诱发了企业人为调控应纳税所得额以享受税收优惠。
(二)传统监管模式的失灵:服务导向与风险防控的两难
面对日益严峻的“贴线申报”挑战,传统税收征管模式陷入困境。当前小微企业所得税优惠大多实行“申报即享受”机制。这种便民化管理大幅提升政策适用便利度,但也为违规行为提供了温床。一是信息不对称的结构性困境。税务机关面临信息不对称、核查手段有限等挑战,企业可通过隐匿收入、虚增成本、操控规模等方式逃避监管。二是技术与协同监管双重滞后。尽管有“金税四期”系统支持,但在智能分析、数据共享等方面仍存在不足,多部门数据壁垒导致税务部门难以全面掌握企业真实经营情况。这种“高便利度、低管控力”的矛盾,虽然合规企业与违规者同等受益,但也导致税收流失,更扭曲了市场公平竞争。
(三)本文的研究创新
面对数字化转型背景下征管强基工程要求与精准治理挑战,本研究通过“群聚模型+大数据分析+制度创新”的综合运用,精准识别“贴线申报”等违规特征,并提出“动态门槛+数据穿透”治理框架,为推进税收征管现代化、优化营商环境与促进小微企业健康发展提供了理论与实务支撑。研究成果对福建省具有重要现实意义——福建作为数字经济发达和小微企业活跃地区,涉税违规现象较为突出。该治理框架可为福建省率先构建数字化智能税收监管体系提供科学依据,形成可在全国复制推广的“福建经验”。
二、理论基础与分析框架
(一)税收遵从理论的新发展
1.从A-S模型到数字化遵从机制
第一,预期效用最大化模型在小微企业的适用性修正。传统的Allingham-Sandmo模型揭示了纳税人在“违规收益”与“稽查风险”之间的理性权衡机制。然而,小微企业的特殊性使这一决策逻辑被显著放大和扭曲。当300万元应纳税所得额的政策阈值带来实际税负率从25%骤降至5%的跳变时,违规的收益成本比呈现出非连续性的急剧提升。这种“悬崖式”的税负结构使得传统A-S模型中的线性效用函数假设失效,企业面临的不再是平滑的边际收益递减,而是断崖式的收益跳跃。
第二,收益-风险权衡中的认知偏差与行为异化。小微企业在违规决策中表现出明显的认知偏差,主要体现在三个方面:一是风险概率低估偏差——由于小微企业数量庞大(全国超3000万户)而税务风控、稽查资源有限,企业普遍认为被查处的概率极低;二是损失厌恶放大效应——面对巨额税负差异,企业对“损失”(缴纳高额税款)的厌恶程度远超对等额“收益”的偏好;三是锚定效应干扰——300万元这一政策断点成为企业决策的“心理锚点”,引导其将利润目标锚定在该阈值以下。
DRD商贸公司案例完美印证了这一认知偏差机制:该企业连续3年将应纳税所得额精准控制在295-298万元区间,通过隐瞒未开票收入77.92万元维持小微企业资格,违规节税约18万元/年。然而,一旦被税务稽查发现,该企业不仅需补缴税款54万元,还面临滞纳金和罚款总计59万元,违规成本高达113万元,是违规收益的6.3倍。这种“小概率高损失”与“高概率小收益”的错配,正是行为经济学中“概率加权函数”扭曲导致的非理性决策。
第三,数字经济条件下信息不对称的新表现。数字经济的发展为小微企业税收违规提供了新的技术手段和隐蔽空间。电子支付的普及使现金交易追踪更加困难,企业可通过私人账户、第三方支付平台等渠道隐匿收入;无形资产交易的定价灵活性为利润转移提供了操作空间;数字化财务管理系统的普及使企业能够更精准地控制利润水平,实现“精准贴线”申报。与此同时,税务机关虽依托“金税四期”增强数据采集能力,但在跨平台整合、实时风险识别与智能分析等方面仍存在滞后,导致征企之间的“数字鸿沟”持续扩大。
2.Kirchler遵从坡面模型的扩展应用
第一,强制性遵从vs合作性遵从的动态平衡。Kirchler的遵从坡面模型(SlipperySlopeModel)提出了税收遵从的二维框架:强制力(Power)维度反映税务机关的执法能力和威慑效果,公信力(Trust)维度反映纳税人对税务机关和税收制度的信任程度。在小微企业所得税优惠政策执行中,这一模型呈现出独特的表现形式。强制力维度的结构性弱化表现在:一方面,税务机关通过大数据筛查、专项行动等手段强化稽查威慑,如铜川市税务局2023年专项行动中通过群聚模型定向选案,查处违规案件命中率达72%;另一方面,“申报即享受”的便民化改革却在客观上削弱了事前审核的强制力,使企业违规门槛大幅降低。这种“强执法与弱准入”并存的矛盾格局,导致强制性遵从效果大打折扣。公信力维度的政策透明度不足表现在:小微企业所得税优惠政策虽然减税力度大,但政策条文复杂、认定标准多重、适用条件交叉,普通企业难以准确理解。加之政策调整频繁(2008-2023年间共调整12次),企业对政策稳定性缺乏信心,更倾向于“能省则省”的短期套利行为而非长期合规经营。
第二,小微企业财务能力限制下的遵从成本分析。小微企业普遍面临财务管理能力不足的现实约束:67%的小微企业没有专职财务人员,52%的企业财务人员缺乏专业会计资格,38%的企业完全依赖代理记账公司处理税务事项。这种财务能力限制使得小微企业在理解复杂税收政策、准确计算应纳税额、规范进行申报等方面存在结构性困难,客观上推高了合规成本。当合规成本超过违规收益时,企业更容易受侥幸心理驱使选择违规,形成“高遵从成本-低自愿遵从-高违规风险”的恶性循环。调查显示,年营收在500万元以下的小微企业,平均税务合规成本占营收比例为1.8%,而大中型企业仅为0.3%,小微企业的相对合规负担是大企业的6倍。
(二)群聚模型的分析框架
1.核心假设的经济学逻辑
第一,反事实分布的“平滑世界”假设:自然秩序vs政策扭曲。群聚模型的核心假设基于:无政策干预时企业应纳税所得额应当呈现自然连续分布,如同正态分布的钟形曲线,不会在特定数值点出现异常的“峰值聚集”或“断崖空缺”。然而,当300万元这一政策断点介入后,原本平滑的分布曲线被人为“撕裂”,断点左侧出现异常的企业聚集。全国数据显示,2022至2024年度,应纳税所得额在200-300万元区间企业合计58.7万户;而同期300-400万元区间企业仅为3.8万户,户数显著下降。临界点两侧的显著差异直观体现了政策扭曲效应。
第二,企业利润最大化的“理性人”与“有限理性”并存。经典经济学假设企业是完全理性的利润最大化主体,会基于精确的成本收益计算调整行为,企业能精确识别300万元断点带来的60万元税负跳变并理性应对。但现实中小微企业财务人员能力普遍不足,致其存在政策理解与操作偏差,形成理性动机与有限能力共存的复杂行为特征。
2.方法论突破与局限反思
第一,从“寻找对照组”到“构建反事实世界”。传统政策评估方法在普惠性政策中面临对照组缺失的根本难题。群聚模型通过数学建模构建反事实分布,与现实对比识别政策效应,解决了普惠政策缺乏对照组的难题,实现方法创新。
第二,“显微镜效应”的双面性。群聚模型能精确量化270-300万元区间内企业的违规比例(39.8%)、违规程度(EM=0.126)等。但无法评估政策对经济增长、就业等宏观影响。
第三,参数敏感性的技术挑战。反事实分布构建受多项式阶数和带宽选择影响显著(EM差异最高达22%),需借助AIC等准则审慎处理参数。
第四,数据质量十分关键。群聚模型依赖大样本、长时序、高精度数据。本文通过异常值处理和多源验证等措施,使数据一致率达91.7%,为可靠分析奠定基础。
三、小微企业所得税政策现行框架与执行悖论
(一)小微企业发展格局与政策受益现状
1.小微企业的经济地位与发展态势
截至2023年末,全国小微企业和个体工商户共1.82亿户,从行业分布看,呈现明显的“三二一”产业格局。第三产业占78.2%,以批发零售(34.1%)和住宿餐饮(16.8%)为主;第二产业占20.1%,主要为制造业(14.7%)和建筑业(4.6%)。服务业成本核算灵活性高,利润调控空间更大,对政策设计提出更高挑战。
区域分布上,呈现显著的“马太效应”。东部聚集61.3%的小微企业,长三角、珠三角和京津冀三大城市群占全国46.8%,区域集中加剧了政策执行中的“地区套利”风险。
2.小微企业所得税优惠的政策受益规模
根据国家税务总局税收数据显示,小微企业所得税税费优惠减免额从2019年的0.58万亿元增至2023年的1.3万亿元,年均增长22.1%,五年累计减免超5万亿元。
从政策演进轨迹看,小微企业所得税优惠经历了“门槛提升-税率降低-覆盖扩大”的三重优化:应纳税所得额上限从2008年的30万元提升至2023年的300万元,提高了10倍;实际税负从初期的20%降至目前的5%,下降了15个百分点。
从政策受益的结构性特征看:占比约四成的批发零售业税负为1.09%,较2019年下降26.6%。建筑业、制造业等劳动密集型行业,税负分别为1.67%和2.56%,较2019年下降19.8%和16.3%。
(二)小微企业所得税政策的现行框架
1.“四维并行”的认定标准体系
现行小微企业认定必须同时满足:应纳税所得额≤300万元、从业人数≤300人、资产总额≤5000万元、从事国家非限制禁止行业四个条件。这种设计的初衷是防范大企业“化整为零”套取优惠,但在执行中也为企业多维度调控提供了空间。
从数量级对比看,四个标准的中应纳税所得额上限对应年营业收入约1500-3000万元,从业人数上限对应年人工成本约1800-3600万元,资产总额上限对应年营业收入约2500-10000万元。显然,应纳税所得额对应阈值最低,易成为企业调控的重点目标。
2.现行政策的优惠税率设计
现行政策规定应纳税所得额300万元以下部分实际税负为5%,与25%的法定税率相比,整体减负达80%,存在“悬崖效应”,诱发企业人为调控应纳税所得额。
(三)政策执行悖论
1.管理模式的历史变迁:便民化改革的双刃剑效应
小微企业所得税优惠管理历经事前备案(2008-2014)、以表代备(2015-2017)到申报即享受(2018至今)三个阶段,体现“放管服”改革成效,但违规风险同步上升:事前备案阶段违规发现率仅3.2%,当前阶段升至23.7%,增长7.4倍。
当前管理模式呈现典型的“服务导向”特征:系统自动抓取数据、自动比对认定标准、瞬时完成减免计算,实现了“零跑腿、秒办结”。但这种高效便民的背后隐藏着风险隐患:系统只能对财务报表进行逻辑性审核,无法识别申报数据的真实性;人工核实受制于征管资源限制,覆盖面极其有限;跨部门信息比对滞后,难以及时发现异常。
2.征管能力与企业规模的“天然错配”
以福建为例,截止目前,全省税务干部约1.6万人,需要服务770万户市场主体,其中企业数量210万,个体户数量554万,人均管户比例高达480:1。更为严峻的是,2019-2023年福建省新增市场主体340万户,年均增长12.7%;而同期税务人员数量基本持平,征管资源与监管需求之间的“剪刀差”不断扩大。
3.信息化建设与数据治理的“技术瓶颈”
目前“金税四期”工程实现了与工商、银行、海关等多个部门的数据对接,构建了覆盖纳税人全生命周期的信息管控体系。但在小微企业违规行为识别方面,仍依赖规则引擎,缺乏行为深度挖掘与跨维度关联分析,预警滞后。数据更新频率、格式不统一及权限限制导致跨部门比对效率低,如从系统中获取银行流水需长达15–30天,易错过干预时机。
四、群聚模型构建与实证设计
(一)数据基础与样本特征
1.数据来源与覆盖范围
本研究涵盖E省(东部发达地区)945家和L省(西部欠发达地区)581家小微企业,形成2021-2024年四年完整面板数据,总样本量1526家,累计观测值6104个。这一样本设计具有三重创新意义:
第一,地域代表性的战略选择。E省作为长三角核心区域,2023年人均GDP达15.06万元,代表我国经济发达地区的小微企业特征;L省地处西部内陆,人均GDP为8.55万元,典型反映中西部地区实际情况。两省经济发展速度的显著差异(GDP增速分别为5.8%和3.7%),为检验“经济发达程度与违规动机”假说提供了理想的准自然实验环境。
第二,行业结构的精准覆盖。样本行业分布严格遵循全国小微企业结构比例,制造业521家(34.1%)、服务业643家(42.1%)、建筑业362家(23.7%)。特别是服务业占比超过40%,以此体现数字经济时代小微企业“轻资产、高灵活性”的新特征。
第三,时间跨度的政策意义。2021-2024年恰好覆盖小微企业所得税政策的关键调整期,为识别政策变化对企业行为的影响提供了珍贵的政策冲击数据。
2.关键变量的构造与测量
本研究创新性地构建了“多维变量体系”,每一维度都蕴含深刻的经济学逻辑:
表1 数据匹配与变量映射表
|
模型变量类别
|
核心变量
|
数据说明
|
2024年样本统计特征
|
|
被解释变量
|
应纳税所得额(调整后)
|
提取纳税申报表中“应纳税所得额”字段,含研发加计扣除、业务招待费调整等
|
均值282.3万元(无超300万元样本),标准差38.6万元,变异系数0.137
|
|
政策断点变量
|
断点虚拟变量D
|
原定义“应纳税所得额≥300万元=1(非优惠组)”,因样本无超300万元企业,实际观测中D=1样本数为0,D=0共1526家(100%)
|
仅保留变量定义用于理论分析,实际实证中侧重“290-300万元临界区间”聚集特征
|
|
行业分层变量
|
行业虚拟变量(Ind₁/Ind₂/Ind₃)
|
Ind₁=1(制造业)、Ind₂=1(服务业)、Ind₃=1(建筑业),以制造业为基准组
|
服务业占比最高(42.1%),建筑业最低(23.7%),与原统计一致
|
|
地区变量
|
地区经济水平虚拟变量(Reg)
|
Reg=1(E省,东部)、Reg=0(L省,西部)
|
E省样本平均营业收入4862万元,L省2975万元,与原统计一致
|
|
违规关联变量
|
成本费用率
|
成本费用/营业收入,反映虚增成本行为
|
全样本均值90.8%,超行业均值5%以上视为异常(占比36.7%)
|
|
违规关联变量
|
未开票收入占比
|
(营业收入-开票收入)/营业收入,反映隐瞒收入行为
|
服务业均值29.8%(原31.2%,因剔除异常样本修正),制造业15.9%
|
|
违规关联变量
|
资产减值损失率
|
资产减值损失/资产总额,反映减值操纵行为
|
建筑业均值31.2%(原33.5%,剔除异常修正),显著高于其他行业
|
|
企业特征变量
|
企业规模(Size)
|
资产总额取对数(ln(资产)),区分小型(12≤ln(资产)≤15)、微型(ln(资产)<12)
|
均值13.1,标准差1.7,与原统计基本一致
|
|
企业特征变量
|
成立年限(Age)
|
2024-成立年份,分3年以下(新企业)、3-5年(成长期)、5年以上(成熟期)
|
成长期企业占比44.9%(原45.8%,因剔除异常样本修正)
|
|
企业特征变量
|
股权结构(Own)
|
Own=1(自然人独资)、Own=0(合伙/股份制)
|
自然人独资企业占比51.8%(原52.3%,剔除异常修正)
|
|
控制变量
|
征管强度(Tax)
|
Tax=1(查账征收)、Tax=0(核定征收)
|
查账征收企业占比71.9%(原72.3%,剔除异常修正),2023年后全覆盖
|
核心被解释变量群包括应纳税所得额(调整后)和政策断点虚拟变量D。应纳税所得额采用税务申报系统直接提取,已自动包含研发费用加计扣除、业务招待费调整等税务调整项目。2024年样本均值286.7万元,标准差42.3万元,变异系数0.148,显示企业在政策断点附近的集聚特征。政策断点虚拟变量显示优惠组1526家(100%),这一比例分布暗示了“贴线操作”的普遍性。
行为识别变量群包括成本费用率、未开票收入占比和资产减值损失率。成本费用率通过成本费用总额/营业收入计算,全样本均值91.5%,其中38.2%的企业该指标超出行业均值5个百分点以上。未开票收入占比利用增值税申报数据与企业所得税申报数据的差异推算,服务业均值高达31.2%,显著高于制造业的16.5%。资产减值损失率在建筑业均值33.5%,远超其他行业。
企业异质性变量群包括企业规模、成立年限和股权结构。企业规模采用资产总额自然对数,均值13.2,标准差1.8。成立年限按3年以下、3-5年(成长期,占比45.8%)、5年以上三分法。股权结构显示自然人独资企业占52.3%,为检验“内部治理与违规倾向”假说提供关键变量。
3.数据质量控制与异常值处理
建立“逻辑校验-交叉验证-专家审核”三级质控体系。通过设置合理性区间剔除明显异常值65家,采用行业内四分位数法识别离群值,对超出Q3+1.5IQR的极端值进行人工复核,最终保留有效样本1461户,数据完整率95.7%。
对于缺失值处理,创新采用“省份-行业-年度-企业规模”四维交叉匹配插补法,确保插补值既符合行业特征又体现时间趋势,如L省建筑业2022年缺失的“未开票收入占比”,参考同规模、同成立年限企业均值(18.2%)插补,确保符合行业特征。其中,表2样本总数3308户次,超过有效样本数量1847户次,原因为386户企业连续3年、1075户企业连续2年“贴线申报”。
表2 企业纳税相关信息表
|
应纳税所得额区间
(万元)
|
省份
|
2022年企业数量(户次)
|
2022年占比(%)(户次/总样本)
|
2023年企业数量(户次)
|
2023年占比(%)(户次/总样本)
|
2024年企业数量(户次)
|
2024年占比(%)(户次/总样本)
|
2022-2024年企业数量年均增速(%)
|
|
270-280
|
E省
|
178
|
18.8
|
195
|
20.6
|
212
|
22.4
|
9.2
|
|
L省
|
126
|
21.7
|
138
|
23.8
|
145
|
24.9
|
7.3
|
|
280-290
|
E省
|
295
|
31.2
|
328
|
34.7
|
356
|
37.7
|
9.8
|
|
L省
|
168
|
28.9
|
185
|
31.8
|
198
|
34.1
|
8.7
|
|
290-300
|
E省
|
152
|
16.1
|
168
|
17.8
|
182
|
19.3
|
9.5
|
|
L省
|
85
|
14.6
|
92
|
15.8
|
105
|
18.1
|
11.6
|
(二)群聚模型的技术创新
1.反事实分布的精准拟合
传统群聚模型多采用低阶多项式拟合反事实分布,但小微企业利润分布往往呈现复杂的非线性特征。本研究提出“改进四次多项式+行业异质性”的创新建模方法:


从微观行为层次上看,EM值反映企业“收益-成本”权衡后的策略选择;从政策含义层次看,EM值的地区差异和行业差异为精准施策提供量化依据。带宽选择的稳健性分析系统测试了6-15万元9个不同带宽下的EM估计结果,核心结论不受带宽选择影响。
(三)模型校验与结果解释
1.群聚效应的显著性检验
E省群聚效应分析显示,270-300万元区间实际企业密度0.0187家/万元,反事实密度0.0102家/万元,超额密度EM=0.126,对应t统计量t=4.18,p<0.001)。54家企业,比理想状态多10.5家(占E省样本的1.4%),贴线申报嫌疑显著,存在明显的“贴线操作”嫌疑。
L省对比:EM=0.074(t=3.85,p<0.001),群聚强度比E省低41.3%,与两省经济水平差异一致,与两省经济发展水平差异高度一致。
表3 两省份企业违规差值表
|
地区分组
|
样本量(户)
|
EM值
|
平均违规金额(万元)
|
稽查发现率(%)
|
270-300万元区间占比(%)
|
|
E省(东部)
|
945
|
0.126
|
41.8
|
28.9
|
38.5
|
|
L省(西部)
|
581
|
0.074
|
29.7
|
18.2
|
25.8
|
|
差异t值
|
—
|
4.18
|
3.85
|
3.62
|
4.97
|
时间序列稳定性分析显示,2021-2024年E省EM值分别为0.182、0.152、0.124、0.126,总体呈下降趋势但保持显著,反映“金税四期”等征管技术进步对违规行为的抑制效应。从全国数据来看,应纳税所得额在290-300万元区间企业户数近三年从2.58万户逐步下降至2.11万户、1.57万户,也反应了税务机关已关注“贴线申报”风险并取得一定成效。
2.行业分层的异质性分析
服务业为违规“重灾区”,EM值高达0.24(E省)和0.172(L省),为三大行业最高。深层机制在于成本核算弹性大、收入确认灵活、资产轻量化等特点。典型案例如:ZC茶业有限公司连续3年应纳税所得额精准控制在295万元左右区间,主要通过私人账户收取销售款项隐匿营业收入26.71万元,最终补缴税费96.62万元。
表4 分行业断点超额密度表
|
行业-地区分组
|
样本量(户)
|
290-300万元企业数(户次)(2022-2024年累计)
|
实际密度(户/万元)(累计/30万元)
|
反事实密度(户/万元)(取自原表)
|
EM值(取自原表)
|
t值(取自原表)
|
P值(取自原表)
|
风险等级(取自原表)
|
|
制造业-E省
|
386
|
169
|
0.0188
|
0.0121
|
0.136
|
4.02
|
0
|
高风险
|
|
制造业-L省
|
135
|
125
|
0.0167
|
0.0119
|
0.114
|
3.28
|
0.001
|
高风险
|
|
服务业-E省
|
432
|
522
|
0.0193
|
0.0105
|
0.24
|
4.67
|
0
|
极高风险
|
|
服务业-L省
|
211
|
346
|
0.0182
|
0.0112
|
0.172
|
3.85
|
0
|
高风险
|
|
建筑业-E省
|
127
|
76
|
0.0109
|
0.0098
|
0.022
|
2.03
|
0.043
|
中风险
|
|
建筑业-L省
|
235
|
115
|
0.0092
|
0.0087
|
0.01
|
1.89
|
0.059
|
低风险
|
制造业EM值0.136(E省)和0.114(L省),虽低于服务业,但仍高于建筑业,且显著高于两省全行业EM值的50%以上,违规特征呈现“重成本轻收入”——成本费用率异常占比39.2%,显著高于未开票收入占比16.5%,企业更倾向于在采购环节做文章。
建筑业EM值最低,仅为0.022(E省)和0.01(L省),但其独特之处在于资产减值损失异常率高达33.5%,企业倾向于通过计提工程设备减值、调整折旧政策等方式调节当期利润。
(四)模型扩展:动态门槛效应分析
1.政策断点“磁力效应”的量化
本研究同时分析了100万元和300万元两个政策断点的影响。结果显示,两地企业在100万元处均出现显著聚集(E省EM=0.065,L省EM=0.040),虽显著性低于300万元断点,但仍具统计意义。这表明企业仍保留对历史政策门槛(2019–2022年间100万元曾为税率分界点)的反应惯性,体现出对政策变化的持续敏感。
此外,全国数据显示应纳税所得额在200–300万元区间内企业分布异常均匀(变异系数0.023),远低于其他区间,说明企业享受优惠后普遍主动控制利润规模,避免接近300万元上限,以规避潜在政策或审查风险。
2.累进税制的政策模拟
基于当前样本,模拟实施累进税制(100万元以下5%、100-300万元10%、300-500万元15%、500万元以上25%)对群聚行为的影响。理论预期累进制将显著削弱300万元断点的“磁力”,使EM值从0.126降至0.035左右。
通过模型预测,当政策断点从300万元“一刀切”调整为“梯度化”多断点后:违规企业比例将从12.8%降至3.7%;财政减收效应可控(约减少8.2%的税收收入);政策公平性显著提升(基尼系数从0.34降至0.28),为“动态门槛”政策设计提供了重要的量化依据。
五、违规行为的深度画像与机制解析
基于群聚模型识别出的异常企业样本和1526家企业的深度调研数据,本研究构建了系统的小微企业违规行为分类体系。通过“违规行为-风险特征-发现路径”三维分析框架,将违规行为归纳为五大类别,每一类别都体现了企业在“收益最大化-风险最小化”约束下的理性选择。
(一)违规模式的系统分类
1.收入隐匿操纵。部分企业以隐匿收入等行为来降低应纳税所得额。企业通过隐匿收入或延迟确认收入,降低年度应纳税所得额至300万元临界点,违规享受小型微利企业所得税优惠。可通过比对企业所得税与增值税收入申报或发票开具情况、分析资产负债表应收应付款科目余额及变化情况等发现此类风险。
2.虚列成本费用。部分企业存在虚假列支成本费用,以降低年度应纳税所得额至300万元临界点,违规享受小型微利企业所得税优惠。企业通过接受虚开发票甚至白条入账方式虚列成本费用,可通过扫描取得发票金额占成本费用比例,取得小规模纳税人开具发票、运输发票和咨询费发票等风险较高的发票金额占成本费用比例、对比行业利润率等发现此类风险。
3.税基优惠调节。部分企业利用享受税基式优惠违规享受小型微利企业所得税优惠。企业享受固定资产一次性扣除(加速折旧)、研发费用加计扣除、残疾人工资加计扣除、技术转让所得减免等税基类优惠政策减少应纳税所得额。可通过扫描建立因违规享受固定资产一次性扣除(加速折旧)、研发费用加计扣除、残疾人工资加计扣除、技术转让所得减免等税基类优惠政策合计金额大于300万元的指标,发现此类风险。
4.虚报从业人数。部分企业少申报职工人数,调低从业人员数量,违规享受小型微利企业所得税优惠。用工企业少申报职工人数或者不申报劳务派遣人员,将从业人数虚报为300人以下。可通过扫描个人所得税工资薪金申报人数、工伤保险缴费基数的从业人数、残保金申报人数、企业劳务费支出发票等指标,发现此类风险。
5.调低资产总额。部分企业申报表资产总额填报金额接近5000万,而同期财务报表填报金额大于5000万,违规享受小型微利企业所得税优惠。企业未按照规定方式计算资产总额季度平均值,或者恶意减少资产或提高负债,将资产总额控制在临界点附近。可通过分析企业资产负债表资产总额变化情况,比对房产税、城镇土地使用税、印花税等计税依据,发现此类风险。
(二)违规操作的技术路径与典型案例
上述违规模式在实操中体现为多种隐蔽技术手段,选取部分群聚模型识别出的高风险企业(连续年度应纳税所得额贴线申报),其违规手段与行为模式高度吻合,主要体现如下:
1.ZC茶业公司连续3年应纳税所得额为295万元,ZH会计师事务所为保证自身的业务收入和长期合作,明知ZC茶业有限公司存在隐匿营业收入等违规行为,却在报告中帮助掩盖问题,未如实出具审计(税审)报告,最终ZC茶业公司补缴税款及滞纳金96.6万元。
2.FM混凝土公司续2年应纳税所得额超290万元,但成本有票率仅34.3%、44.5%,核查发现大量列支“金条”“男士内衣”等明显与经营无关的费用,并在年末突击购置固定资产170余万元违规一次性扣除,造成成本严重失真,最终补缴税款及滞纳金217.7万元。
3.GQ建筑公司连续连续2年应纳税所得额均为为299.7万元,呈现明显的贴线申报,核查发现存在虚构研发项目、违规归集研发费用问题,通过滥用研发费用加计扣除政策人为调控应纳税所得额,最终补缴税款及滞纳金69.8万元。
4.XJ发展公司连续3年应纳税所得额临近300万元,从业人数仅27人,通过“工资薪金”与“劳务报酬”核查分析,发现该企业连续未申报劳务派遣人员从业人数,实际从业人数超千人,通过隐匿从业人数的方式违规享受小微企业税收优惠,最终补缴税款及滞纳金182.07万元。
5.QR商贸公司连续2年应纳税所得额位于270-300万元期间,资产总额低于5000万元,核查发现该公司将借出款项、银行保证金等资产项目违规列入“其他应付款”借方并以负数填列,人为压低资产总额,使其形式上满足小微企业认定标准,最终补缴税款及滞纳金206.8万元。
六、“动态门槛+数据穿透”治理框架设计
群聚模型分析揭示了“贴线申报”现象的深层机制,但根本解决需要从制度设计和技术手段两个维度进行系统性重构。本研究提出“动态门槛+数据穿透”治理框架,通过制度创新消除违规动机,通过技术升级实现精准监管。
(一)“动态门槛”机制的制度创新
1.累进税率体系:破解“一刀切”困局
现行小微企业所得税政策的根本缺陷在于“断崖式”制度设计。300万元断点造成税负急剧跳变——从5%优惠税率跃升至25%标准税率,为企业提供了强烈违规激励。从行为经济学角度,这种设计违背了“激励相容”原则,企业最优策略不再是诚实申报和规模扩张,而是通过各种手段将应纳税所得额控制在断点以下。
累进税率体系遵循“边际税负递增、总体负担合理”原则,构建四阶段递进结构:0-100万元5%、100-300万元10%、300-500万元15%、500万元以上25%,实现税负平滑过渡。这一设计基于最优税收理论中的“拉姆齐法则”,不同收入水平主体承担不同边际税率,实现社会福利最大化。累进制下,边际税负与收入增长保持正向匹配,从根本上解决企业“不敢长大”的困境。
2.行业差异化设计:基于风险导向的精准治理
群聚模型分析表明,不同行业违规风险存在显著差异:服务业EM值0.240,制造业0.136,建筑业0.022。行业差异化门槛设计基于实证发现,体现“分类施策、精准治理”监管理念。
如服务业违规风险最高源于其业务特点:成本构成复杂、收入确认灵活、资产结构简单,为财务操纵提供便利。对服务业适用更严格门槛标准,能够有效压缩违规空间。建筑业由于项目周期长、资金流向清晰、监管相对容易,可享受相对宽松政策空间。通过设置行业差异化门槛,高风险行业适用更严格标准,低风险行业享受更宽松政策,实现监管资源优化配置。
(二)“数据穿透”监管体系的技术架构
1.多源数据融合:构建全景式企业画像
“数据穿透”理念核心在于打破传统监管中的信息壁垒,通过多源数据深度融合构建企业行为全景画像。以解决税务机关与企业间存在天然“信息不对称”问题。
技术实现上,多源数据融合面临数据标准不统一、系统接口不兼容、更新频率不一致等挑战。关键在于建立统一数据标准和智能化数据处理机制。以企业统一社会信用代码为主索引,将税务、工商、银行、社保等不同部门数据关联整合,形成“一企一档”数据集成体系。
具体包括三个层次:内部数据层面,整合申报表、财务报表、纳税评估等税务系统内部数据;外部数据层面,获取工商注册、银行流水、社保缴费等政府部门数据;第三方数据层面,接入发票信息、合同数据、物流信息等市场化数据源,构建企业经营活动的完整数据链条。
2.智能风险识别:从被动应对到主动预防
传统税务监管多采用“事后核查”模式,在企业申报完成后通过人工审核或简单数据比对发现问题,存在明显滞后性。智能风险识别模型核心价值在于实现从“被动应对”到“主动预防”的转变,通过对企业行为数据实时分析、及时预警。
机器学习算法发挥关键作用。随机森林算法通过构建多个决策树进行集成学习,处理高维度、非线性企业行为数据;神经网络深度学习自动提取数据深层特征,识别人工难以发现的复杂违规模式;支持向量机算法在处理小样本、高维度数据方面具有独特优势,有效识别罕见但高风险的违规行为。
风险识别模型构建包括特征工程、模型训练、效果评估三个核心环节。特征工程阶段,从企业多维数据中提取关键风险指标,包括财务比率异常、申报行为异常、关联交易异常等;模型训练阶段,利用历史风控、稽查数据进行有监督学习,建立风险行为识别规则;效果评估阶段,通过交叉验证和实际应用检验模型准确性和泛化能力。
3.实时监控与预警:构建智能化防线
数据穿透监管体系的重要特征是实时性。通过建立数据动态更新和实时分析体系,在违规行为发生第一时间发出预警,大大缩短发现和处置时间窗口。
技术架构上,实时监控需建立基于事件驱动的数据处理机制。当企业发生重大经营活动时,相关系统自动触发风险评估程序,根据评估结果决定是否发出预警信息。预警系统设计遵循“分级分类”原则:绿色级别针对低风险企业,主要提供政策咨询和合规提醒;黄色级别针对中等风险企业,进行重点关注和辅导纠正;红色级别针对高风险企业,实施严密监控和及时查处。通过差异化预警管理,既保证了监管效果,又能优化监管资源。
七、政策建议与实施路径
基于群聚模型识别的“贴线申报”违规特征和“动态门槛+数据穿透”治理框架,本研究提出分层次、分阶段的政策建议,旨在构建遏制违规与促进发展并重的现代税收治理体系。
(一)短期改进措施:技术升级与制度完善
1.申报环节的智能化改造
2.风控筛查、稽查选案的精准化提升
(二)中期制度创新:法制化与规范化
1.税制结构的系统性改革
2.征管体制的协同化重构
(三)长期发展方向:数字化与智能化
1.“智慧税务”的深度融合
2.税收治理体系的现代化
课题组成员:王晔 郭志伟 郑冰冰 陈林忠
【参考文献】(略)