
亚太教育创新
Innovations in Asia-Pacific Education
- 主办单位:未來中國國際出版集團有限公司
- ISSN:3079-3661(P)
- ISSN:3079-9503(O)
- 期刊分类:教育科学
- 出版周期:月刊
- 投稿量:2
- 浏览量:514
相关文章
暂无数据
细胞免疫治疗概念股的收益率分析与网络分析
Yield Analysis and Network Analysis of Cellular Immunotherapy Concept Stocks
引言
细胞免疫疗法是新兴肿瘤治疗方法,近年来,免疫检查点抑制剂的研发应用推动了其发展,CAR-T细胞疗法在血液肿瘤治疗中疗效显著。如今,细胞免疫疗法发展迅猛,全球已有13款CAR-T产品上市,中国在该领域也成果丰硕,截至2024年底,临床试验项目数占全球47%,位居世界第二。细胞免疫治疗是一种将免疫效应细胞作为治疗媒介的革命性干预策略。其核心逻辑并非依赖外源性小分子或大分子药物,而是通过对患者自身或异体来源的免疫细胞进行体外工程化改造与功能性重塑,使其成为能够精准识别并清除病变细胞的“活体药物”,再回输至患者体内以执行治疗功能。“细胞免疫治疗经过长足的发展,已经在多种肿瘤的治疗上发挥了很好的疗效,给人们带来了曙光。”细胞免疫治疗的重要性超越了单纯的临床应用,它在科学及产业层面均展现出深远的战略价值。鉴于其广阔发展前景,近年来,沪深股市中衍生出数十只与这一概念相关的股票。本研究拟使用向量自回归(vector autoregressive,VAR)模型对沪深股市中于2005年1月之前上市的13只股票月度收益率进行建模分析以探究其演变规律,并使用Lasso方法实现对VAR模型的稀疏估计,从而实现对各股票之间网络关系的刻画。
1 实证分析
1.1 研究方法与数据处理
为对细胞免疫治疗概念股的月度收益率进行分析,本文使用VAR(1)模型,即
其中代表13只股票在t时期的观测值,是一个13×13维的转移矩阵,则指代此系统在t+1时期所面对的随机扰动。VAR模型在多变量时间序列分析中占据核心地位,其主要优势在于能够以一种理论上相对宽松的方式,系统性地捕捉股票收益率间的动态互馈关系。
邻接矩阵是基于其转移矩阵进行二值化处理后得到的定性网络结构,它将转移矩阵中量化的、有权重的股票收益率间影响关系,抽象为仅表示“存在”或“不存在”的连接关系,由此得到各股票收益率之间的网络关系。鉴于此,本文希望实现对转移矩阵的稀疏估计以得到有意义邻接矩阵。所以,本文使用Lasso方法对VAR模型进行估计,即通过在估计过程中施加正则项,将相对不显著的参数估计值压缩至0。具体而言,本文对如下目标函数进行优化:
其中代表总样本量,是Lasso的调节参数,用于调节模型复杂度和拟合优度之间的平衡。本文使用主流的5折交叉验证方法实现数据驱动的调节参数选择。具体而言,本文考虑两种交叉验证准则,“mse”准则选择使交叉验证误差达到绝对最小值的模型,而“1se”准则则是在此基础上选择一个性能稍有牺牲、但在统计上与最佳模型表现无显著差异的最简约模型。最后,我们还使用主成分分析对这些股票收益率对应的VAR系统进行简要分析,以探究其中是否存在低维因子结构。
本文数据来源于同花顺数据中心。为更好地刻画时间趋势,本文剔除了在创业板、科创板上市的股票,只选取在沪深主板上市的,2005年1月—2024年12月之间的13只细胞免疫治疗概念股(000516国际医学、000566海南海药、000597东北制药、000963华东医药、000989九芝堂、002004华邦健康、600196复星医药、600276恒瑞医药、600521华海药业、600645中源协和、600682南京新百、600721百花医药、600851海欣股份)的月度收益率进行分析。在此期间,部分公司存在短时间停牌导致缺失值,本文使用插值法对缺失值进行修补以完成后续分析。本文全部统计分析通过R实现。
1.2 实证分析结果
为了使VAR模型的分析结果更加可靠,首先需要验证13只股票月度收益率组成时间序列系统的平稳性,最常用的做法即画出各时间序列的观测值,观察其是否在特定均值附近震荡。部分股票(其他股票月度收益率演变趋势类似)示例如下图所示:
总体而言,各股票月度收益率围绕0点附近震荡,即可以认为该系统满足平稳性条件,从而可以用VAR实现高效建模。接下来,本文使用R语言中的glmnet包实现转移矩阵的Lasso估计,以同步实现变量选择(即得到转移矩阵的稀疏估计值)。转移矩阵中待估参数数量共169个,通过两种准则的交叉验证进行调节参数选择之后,“mse”准则对应估计结果表明70个参数并未被压缩至0,而“1se”准则对应估计结果则表明12个参数显著。为验证Lasso估计的拟合效果,我们将“mse”准则对应估计的残差图(“1se”准则对应残差图类似)展示如下图。
结果表明,Lasso估计对应残差绝大部分分布在[-0.5,0.5]区间之中,即可以认为该VAR系统中演变特征大部分由该转移矩阵估计量捕捉,因此拟合效果佳。基于已有估计量,可以进一步进行二值化处理,从而得到各股票之间的定性网络。各概念股之间的网络关系图如图3所示。
右图中的网络结构相对简洁,从中不难看出,600851海欣股份在此系统中连边显著多于其他公司,表明其在系统中扮演了重要的角色。海欣股份是一家业务多元化的A股老牌上市公司,其业务版图横跨工业、医药、金融等板块,医药板块中最重要的就是涉及细胞免疫治疗的布局。海欣股份在细胞免疫治疗领域的技术路线专注于一种名为“抗原递呈细胞(Antigen-Presenting Cell, APDC)”的树突状细胞疫苗技术,目前正在进行APDC项目Ⅲ期临床试验。这一技术路线不同于主流CAR-T疗法,因此可以较大程度地影响整个板块的风险评估、估值模型与投资者信心,其行业风向标意义甚至超过其自身的商业竞争价值。此外,通过左图可以看出,作为板块老牌龙头股,600196复星医药的月度收益率也与众多其他公司之间存在显著联系。
最后,本文还探究了各概念股的收益率演变规律之间是否存在高度趋同现象。为回答该问题,本文使用主成分分析对各股票的月度收益率序列进行特征提取,各主成分对应的累积方差贡献见下表。
| 主成分数量 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 累计方差贡献 | 0.08 | 0.15 | 0.23 | 0.31 | 0.39 | 0.46 | 0.54 | 0.62 | 0.69 | 0.77 | 0.85 | 0.92 | 1.00 |
结果表明,各主成分的方差贡献度类似,即收益率序列系统中不存在低维因子结构。可能的原因是细胞免疫治疗领域尚处于发展的初期阶段,各公司之间发展策略、技术路线等异质性较强,无法被少数几个共同的、不可观测的因子有效解释。
2 结论
综上,本文聚焦于“细胞免疫治疗”这一前沿医疗领域,基于2005年至2024年的月度数据,对沪深主板市场中13支代表性概念股的收益率动态关系进行了系统性探究。通过构建向量自回归(VAR)模型,并创新性地运用Lasso正则化方法进行稀疏估计,本文不仅有效克服了高维参数估计的难题,更成功地构建了能够反映核心影响路径的股票收益率传导网络,并深入剖析了该板块的内在结构特征。
实证研究的核心发现表明,细胞免疫治疗概念股板块的网络结构呈现出非均匀性特征。在相对简约的“1se”准则网络中,海欣股份(600851)凭借其独特的APDC技术路线(与主流CAR-T疗法差异显著),扮演了显著的核心节点角色,其收益率波动对板块内其他成员具有广泛的传导效应,成为市场观察整个板块风险偏好与估值逻辑的重要风向标。其业务动态(如Ⅲ期临床试验进展)不仅影响资本市场对该技术路线的信心,更间接反映了非CAR-T技术在行业中的探索价值,为行业理解技术多样性提供了实证依据;而在包含更多连接的“mse”准则网络中,复星医药(600196)作为老牌龙头,其布局的CAR-T等主流技术进展,则体现了行业主流方向的发展节奏,有助于明确行业资源投入的重点领域,揭示行业技术发展的核心驱动力。
此外,主成分分析的结果为我们理解该板块的整体特性提供了另一重要视角。分析显示,各主成分对总方差的贡献度分布较为平均,不存在能够解释大部分波动的少数几个主导因子。这一发现有力地证实了细胞免疫治疗产业尚处于发展的初期阶段,各上市公司在技术路线、研发周期、商业模式等方面存在显著的异质性,尚未形成统一的、由宏观或行业层面共性因素驱动的收益模式。
综上所述,本研究通过网络分析与因子分析相结合的方法,揭示了中国“细胞免疫治疗”概念股板块内部复杂的、以关键企业为核心的传导网络,及其因产业发展初期所导致的显著异质性。这些发现为投资者理解该新兴科技板块的演化规律、识别核心标的、制定差异化投资策略以及进行风险管理提供了有价值的实证依据与分析框架。
参考文献:
- [1] 郭振红,曹雪涛.肿瘤免疫细胞治疗的现状及展望[J].中国肿瘤生物治疗杂志,2016,23(02):149-160.
- [2] Hastie T, Tibshirani R, Friedman J H, et al. The elements of statistical learning: data mining, inference, and prediction[M].New York:Springer,2009.
- [3] Friedman J H, Hastie T, Tibshirani R. Regularization paths for generalized linear models via coordinate descent[J].Journal of statistical software,2010,33(01):21-22.
- [4] 袁志发,宋世德.多元统计分析[M].北京:科学出版社,2009.
