基于众数的稳健估计孟徳尔随机化方法及其在因果关联研究中的应用论文

2020年9月1日17:07:39基于众数的稳健估计孟徳尔随机化方法及其在因果关联研究中的应用论文已关闭评论

基于众数的稳健估计孟徳尔随机化方法及其在因果关联研究中的应用论文
中文摘要

目的:

本文通过模拟研究比较基于众数的稳健估计孟德尔随机化方法、SME、WME、 PWME法、传统的IVW法、MR-Egger回归法在不同程度工具变量假设违背情形下 因果推断的表现,并将其应用到儿童肥胖与1型糖尿病关联的实例数据中,探索儿 童肥胖与1型糖尿病是否存在因果关联。

方法:

介绍SMBE、WMBE法及SME、WME、PWME法的基本原理。本研究模拟四 种不同情形:模拟1和模拟2中设置无效工具变量比例从0逐渐增加至100% (间 隔比例为10%),旨在评估两样本情形下,不存在因果效应时MBE法的表现;模 拟3和模拟4中设置无效工具变量比例p = 0,真实因果效应值分别为0.1和0,旨 在评估两样本和单样本情形下MBE方法的弱工具变量偏倚问题。不同模拟情形下, 均用平均因果效应估计值、标准误、覆盖率、效能来评价SMBE、WMBE法与SME、 WME、PWME、IVW、MR-Egger法在因果效应估计方面的优缺点。本文利用筛选 出的23个单核昔酸多态性位点进行儿童肥胖与1型糖尿病因果关联的评估。

结果:

不存在因果效应时0 = 0,多数模拟情形下MBE法获得的效应估计值的偏倚及 I型错误率都低于其他几种方法。MBE法检测因果效应的能力仅略低于IVW法、 基于中位数的方法,但高于MR-Egger回归方法,且MBE法对汇总数据样本量的 要求低于其他几种方法。实例数据结果表明儿童肥胖对儿童T1DM存在正向因果效 应,SMBE和WMBE法获得的效应估计值与经MR-Egger法校正后的结果近似(OR 及 95%CI: SMBE: 2.212; 1.084-4.512; WMBE: 2.233; 1.095-4.554; MR-Egger: 2.776; 1.241-6.208)o

结论:

基于众数的稳健估计孟德尔随机化方法相比其他MR方法可更大程度地放宽工 具变量假设,在进行两独立样本MR分析时,不能仅报告一种MR分析结果,需根 据不同情形,将MR方法结合起来共同进行因果推断。本研究发现儿童肥胖与1型 糖尿病间可能存在正向因果关联。

关键词:两样本孟德尔随机化;基于众数的稳健估计法;基因多效性;工具变量; 1型糖尿病

Mendelian randomization analysis via the mode-based robust
estimate and its applications in the causal inference

Abstract

Objectives:

The study compared the causal inference performance of mendelian randomization method based on the mode-based estimate, simple median estimator, weighted median estimator, penalized weighted median estimator, the inverse-variance weighted method, MR-Egger regression by simulation with varying violations of instrumental variable assumptions, and apply them to test for causal associations of childhood adiposity on type 1 diabetes mellitus.

Methods:

We expounded the basic principles of mendelian randomization based on simple MBE, weighted MBE, simple median estimator, weighted median estimator and penalized weighted median estimator. In our four different simulation scenarios, simulation 1 and 2 were aimed at evaluating the performance of the MBE under the causal null (0 = 0) in the two-sample setting, with the proportion of invalid instrumental variables vary from 0 to 100% (per 10%). In simulation 3 and 4, the number of invalid instrumental variables (p) was set to 0,0 = 0. Iand0 = 0, respectively, they were aimed at evaluating weak instrumental variable bias in the two-sample and single-sample settings. In each simulation, average causal effect estimates, standard errors, coverage and power were obtained to assess the merits and demerits of different MR methods based on SMBE> WMBE、SME、WME、PWME、IVW and MR-Egger. We used a genetic instrument of 23 single nucleotide polymorphisms (SNPs) to test causal associations between childhood adiposity and type 1 diabetes mellitus risk.

Results:

Under the causal null (0 = 0) in many situations, the MBE presented less bias and lower type-I error rates than other methods. Its power to detect a causal effect was smaller compared with the IVW and WME methods, but was larger than that of MR-Egger regression, with sample size requirements smaller than the others. Our study found positive support for an effect of childhood adiposity on type 1 diabetes mellitus risk using SMBE, and WMBE analysis, and found the results were consistent with MR-Egger regression analysis (odds ratio, 95%CI: SMBE: 2.212; 1.084-4.512; WMBE: 2.233; 1.095-4.554; MR-Egger: 2.776; 1.241-6.208 per standard deviation in body mass index).

Conclusions:

The mode-based estimate relaxes a greater degree of the instrumental variable assumptions in mendelian randomization study compared to other methods, and should be used in combination with the other approaches in causal inference, not only presents the result of one of the methods. Our study provides the positive causal association support for a link between childhood adiposity and type 1 diabetes mellitus risk.

Keywords: Two-sample mendelian randomization; mode-based estimate; genetic pleiotropy; instrumental variable; type 1 diabetes mellitus

常用缩写词中英文对照表

英文缩写 英文名称 中文名称
RCT Randomized Controlled Trial 随机对照试验
MR Mendelian Randomization 孟德尔随机化
IV Instrumental Variable 工具变量
GWAS Genomic Wide Association Study 全基因组关联研究
IVW Inverse-Variance Weighted 逆方差加权
LBM Likelihood-Based Method 基于似然的方法
WME Weighted Median Estimator 加权的中位数估计法
MBE Mode-Based Estimate 基于众数的估计法
OLS Ordinary Least Square 最小二乘法
SNPs Single Nucleotide Polymorphisms 单核昔酸多态性
NOME NO Measurement Error 无测量误差
InSIDE Instrument Strength Independent of Direct Effect
SME Simple Median Estimator 简单中位数估计法
PWME Penalized Weighted Median Estimator 惩罚的加权中位数估计法
ZEMPA Zero Modal Pleiotropy Assumption 零模型多效性假设
SE Standard Error 标准误
T1DM Type 1 Diabetes Mellitus 1型糖尿病
BMI Body Mass Index 体重指数

医学工作者研究的主要任务旨在预防、控制、治疗疾病及促进健康⑴。要实现 这样的目标就需要医学工作者很好地明确疾病的病因和因果关联的推断方法。明确 疾病的病因不仅是疾病预防的重点,更是疾病正确诊断、治疗和促进健康的首要基 础⑵。迄今为止,学术界普遍认为疾病病因是能使人群发病率升高的那些因素,当 其中某个或者某些个因素不存在时,人群发病率就会显著下降⑶。在未明确病因或 疾病病因复杂时,一些致病因素也可称为“危险因素” [4]o例如,在研究代谢综合 征的影响因素时,常认为肥胖、体力活动缺乏、打鼾等为“危险因素”⑸。这些“危 险因素”可以帮助我们从众多的内外因中,找出与疾病的发生、治疗、生存有着密 切关联的因素。目前病因学研究方法按时间顺序可分为前瞻性、现况、回顾性研究 3种方法,流行病学中传统因果推断方法在找出可能的危险因素后,则需要根据Hill 准则进行综合判断并排除虚假关联和间接关联,确定所观察的关联是否为因果关联 ⑹。事实上,按照Hill准则进行因果推断比较繁琐,标准难以满足,同时还要考虑 不同病因学研究设计的科学性和合理性,方可作为因果关联的可靠性依据。

临床随机对照试验(Randomized Controlled Trial, RCT)是进行因果关联研究的 金标准,既是前瞻性研究,又利用了随机化和盲法的方法提高了组间可比性、较好地 控制了研究中的偏倚和混杂⑺。然而,由于其试验设计和实施条件要求高、需要严格 控制、难度大、随访时间长又难以保证依从性和伦理道德等问题,RCT在实际工作中 往往难以实现⑴。与之相比的传统的观察性流行病学研究在医学实践中应用比较广泛, 然而通过该方法获得的效应估计值常常由于未知的或不可测量的混杂(Unknown or Unmeasured Confounding )、测量误差 (Measurement Error )、逆 向因果(Reverse Causation)—"危险因素”与结局变量的时间顺序被混淆等因素的干扰,导致可能的 因果效应估计值不可信⑻。孟德尔随机化(MendelianRandomization, MR)研究的出 现,为上述难题提供了有效的解决方案。

孟德尔随机化研究中使用遗传变异(Genetic Variants)作为工具变量(Instrumental Variable, IV)来确定“危险因素”和结局变量之间观察到的关联是否与因果关联一 致⑼。此方法依赖于减数分裂过程中等位基因随机分配到子代配子中(孟德尔独立分 配定律),从而导致的遗传变异在种群中的随机分布[1°]。个体在出生时就自然地决定 了其是否携带了影响某种“危险因素”的遗传变异[⑼。由于出生后的环境、社会经济 地位、行为因素等混杂对基因遗传变异不会产生影响,且“因”前于“果”,携带遗 传变异者与不携带遗传变异者在结局变量上的差异可归因于某种“危险因素”的差异, 所以通过随访携带变异体的个体和不携带变异体的个体可以获得感兴趣的暴露和结 局的更真实的效应估计值,而且由于因果时序的合理性可以认为这种观察到的关联是 因果关联[11]。

随着统计学方法、大样本全基因组关联研究(Genomic Wide Association Study, GWAS)、表观遗传学以及各种“组学”技术的不断发展,基于汇总数据的MR方法 在探讨复杂暴露因素与疾病结局因果关联中的应用也日益广泛〔⑵。然而由于MR分析 中遗传变异通常只能解释暴露中的小部分信息,在评估某些因果关系时,想要获得足 够的效能往往需要数万个样本才能实现,此外可通过使用多个遗传变异位点作为工具 变量来提高工具变量对暴露的解释能力[⑶。即如果每个遗传变异都解释了暴露的残余 变化,那么使用所有遗传变异所得到的综合效应的因果估计值将比任何单个遗传变异 获得的估计值更精确。因此本研究也使用多个遗传变异来进行模拟和实例分析。使用 MR方法进行因果推断依赖于3个工具变量假设[14]: 1)遗传变异与感兴趣的暴露间存 在相关性;2)遗传变异与未知的或已知的混杂相互独立;3)遗传变异只能通过唯一 的变量(感兴趣的暴露)对结局产生效应。第一个假设可通过检测遗传变异与感兴趣 的暴露的关联强度来直接评估,第二个假设难以全面的检验,但通常被认为是满足的, 第三个假设是MR方法应用需面临的最大的问题,因为遗传变异往往不仅只通过感兴 趣的暴露影响结局,还可通过其他的生物学通路影响结局,这种因除“工具变量■暴 露■结局”之外的通路而导致第三个假设违背的现象称为多效性效应,具有多效性效 应的遗传变异被称为无效的工具变量[①。然而,在MR分析中使用数量越多的遗传变 异,一方面:解释暴露变异的信息越多,效应估计值的精确性越高,因果效应假设的 检验效能越强;另一方面:涵盖的无效遗传变异的数量也会增多,致使遗传变异无效 的潜在威胁是“横向多效性”(遗传变异不仅仅通过唯一的感兴趣的暴露X对结局产 生效应,还通过别的无法预测的生物学路径影响应变量Y),若引入的遗传变异其中 有任何一个无法避免“横向多效性”,则利用MR研究获得的因果效应估计值可能会 存在偏倚,还会增大因果效应检验假设的I型错误率[⑹,从而无法体现出与传统观察 性流行病学方法相比,MR研究设计和方法的灵活性和优越性。

传统的孟德尔随机化方法有Ehret[17]等2011年提出的基于比值估计的逆方差加权 法(Inverse-Variance Weighted, IVW) , IVWft计值由汇总数据计算,该方法只有在 所有遗传变异都无多效性或横向多效性效应恰好抵消时,才能得到一致性估计值。 2013年,Burgess[18]等还提出了基于似然的方法(Likelihood・Based Method, LBM), LBM法在进行效应值的估计时要求所有的遗传变异都无多效性效应且基因关联的估 计值服从双变量正态分布。近年来,为解决MR分析中横向多效性这一难题,又有了 Bowden等2015年提出的MR-Egger法[⑼、加权的中位数估计法如(Weighted Median Estimator, WME)法及Fernando[21]等2017年提岀的基于众数的估计法(Mode・Based Estimate, MBE)。MR-Egger方法用漏斗图直观检验多效性,在满足工具变量强度与 多效性效应相互独立的条件下(Instrument Strength Independent of Direct Effect, InSIDE) , MR-Egger法可以发现并校正多效性带来的偏倚,从而得到因果效应的一 致性估计值,但该方法同时引入了无法检验的InSIDE假设。WME法在有至少50%的 信息来源于有效遗传变异时,就能得到一致性效应估计值,该方法I类错误率小于IVW 法。MBE法理论上也可以放宽多效性假设,在无效遗传变异的比例超过50%时仍能获 得因果效应值的一致性估计。

本研究将通过模拟研究将MBE法与基于中位数的估计方法、IVW、MR-Egger回 归法进行比较,评估MBE法发现因果效应的能力及阐述何种情形下MBE法可以获得 真实因果效应值的一致性估计,用平均因果效应值、标准误、覆盖率(Coverage, 95% 可信区间包含真实因果效应值所占的比例)、效能(Power, 95%可信区间不包含0 所占的比例)等指标评价MBE法、基于中位数的估计方法、MR-Egger法、传统的IVW 法在MR研究中的表现。为基于汇总数据的MR方法的选择提供一些建议。最终将四种 方法及其衍生方法应用于儿童肥胖与1型糖尿病的因果关联研究中,对儿童肥胖与1 型糖尿病的因果关联作出合理、可靠的解释。

1工具变量法

在计量经济学领域中,工具变量,顾名思义就是在模型进行参数估计的过程中扮 演着“工具”的角色,在回归模型中是与误差项具有相关性的随机自变量的“替代者”

[22】。被选择为工具变量的“替代者”需满足如下条件以叭

  • 与其替代的随机自变量具有较强的相关性;
  • 与模型中的随机误差不相关;
  • 与模型中其他自变量不相关,旨在规避多重共线性的问题。

对于一元线性回归模型:

匕=0o+0iXz+E (1.1)

当我们认为X与0相关时,即:

Cov(X,£)hO (1.2)

要想获得当X与&相关时00和01的一致性估计,此时,传统的最小二乘(Ordinary Least Square, OLS)估计法已不再适用了,我们需要引入一个满足某些性质的新变量 Z,其满足两个假定Bl:

  • Z与w的协方差为0,即:(乙£) = 0 (1.3)
  • Z 与X相关,即:C“(Z,X)hO (1.4)

则称Z是X的工具变量。综合上述定义可得,一个合适的工具变量必需具有如下两 种性质:

  • 外生性:工具变量需为外生的变量,即Cov(Z^) = 0o
  • 相关性:工具变量与随机自变量X相关,即Cov(Z, X)h0。

关于工具变量的外生性,由于其涉及到不可观测或未知量0,所以该性质无法进行理 论上的检验,只能通过相关常识进行推断对于其相关性,可直接利用实例数据进 行检验。

在利用传统的流行病学现况研究进行因果推断的过程中,混杂偏倚(Confounding) 时常发生且不可避免,通常可在研究的设计和分析阶段分别采用不同的处理手段对混 杂因素进行控制,在设计阶段常采用的方法有随机化、匹配及在分析阶段主要的处理 包含多因素分析、分层分析、倾向性得分等[旳。这些方法可应用的前提是潜在的混杂 因素是已知或可测量的。然而,在实践操作中,仍存在残差偏倚、不可测量或未知的 混杂因素且无法控制。为解决此问题,将计量经济学领域中工具变量法引入观察性研究中,其基本原理为:利用一个有效的工具变量来替代感兴趣的暴露旨在将观察性研 究的数据转换为随机临床试验的数据形式,最终实现非随机化研究中感兴趣的暴露与 结局变量间效应值的低偏倚估计和因果推断0]。一个有效的工具变量除了需要具备上 述两个性质以外,还必须具备另一个性质:排他性,即,工具变量z唯独通过感兴趣 的暴露x影响结局变量y[28]o如下,以图例形式展示工具变量z的3条性质。寻找一 个甚至多个满足以上3条性质的工具变量是MR方法在流行病学实践应用中的主要难点。

图1・1工具变量分析及其性质的图例

2孟德尔随机化

2.1孟德尔随机化

利用遗传变异作为感兴趣的暴露的“替代者”来建立模型并对暴露与结局间观察 到的关联进行因果推断的过程称为孟德尔随机化研究〔29],简称为孟德尔随机化。1986 年Katan首次提出孟德尔随机化这一概念,其中心思想是寻找一个或多个与感兴趣的 暴露具有高度相关关系的遗传变异作为工具变量建立模型,利用两阶段最小二乘法估 计暴露与临床结局变量间的因果关联㈤]。将遗传变异作为感兴趣的暴露的工具变量的 理由是:在减数分裂过程中等位基因随机分配到子代配子中(孟德尔独立分配定律) 使得遗传变异在种群中的随机分布⑴】。个体在出生时就自然地决定了其是否携带了影 响某种危险因素的遗传变异〔辺。由于岀生后的环境、社会经济地位、行为因素等混杂 对基因遗传变异不会产生影响,且“因”前于“果”,携带遗传变异者与不携带遗传 变异者在结局变量上的差异可归因于某种危险因素的差异,所以通过随访携带变异体 的个体和不携带变异体的个体可以获得感兴趣的暴露和结局的更真实的效应估计值, 而且由于因果时序的合理性可以认为这种观察到的关联是因果关联[辺。同时,随着生 物学信息技术的猛速发展,对遗传变异的定量及定性的精度也越来越高,与传统的工 具变量[刑(家庭住址与医院的距离、医生个人偏好、医疗保险计划等)相比,利用遗 传变异作为工具变量可大大降低由于测量误差带来的偏倚[均。

孟德尔随机化研究中,与工具变量性质类似,被选择的作为工具变量的所有遗传 变异需满足以下3个核心假设[旳:

图2・1孟德尔随机化核心假设图例

IV1:遗传变异G与感兴趣的暴露X相关,即x严。(0幻•是各遗传变异对暴 露的效应);

IV2:遗传变异G与未知或已知的混杂U相互独立;

IV3:遗传变异G只能通过唯一的变量(感兴趣的暴露)对结局产生效应,即 aJ = OCaJ是各遗传变异不经由暴露对结局的直接效应,该现象被称为基因多效性)。

MR分析中常把单核昔酸多态性(Single Nucleotide Polymorphisms, SNPs)位 点用作工具变量,其可直接通过已发布的GWAS的评估遗传变异与感兴趣的暴露、 结局间关联的报告来识别。IV1可以通过经验法则:Cragg-Donald F统计量>10进 行统计学检验卩刀,由于生物学上,单个遗传变异只能解释暴露的小部分变异且与暴 露的相关性较弱,所以孟德尔随机化研究中通常选择多个遗传变异或利用等位基因 得分作为工具变量,从而使工具变量强度增加,降低弱工具变量所带来的偏倚。由 于配子形成时等位基因的随机分配和自由组合且出生后的环境、社会经济地位、行 为因素等混杂对基因遗传变异不会产生影响,从而使除暴露以外的因素在不同组间 保持平衡和各组间均衡可比,为遗传变异独立于混杂因素提供了理论支持,所以一
般情况下可以认为IV2是满足的。由于多效性的存在,使得IV3在多数孟德尔随机 化研究中不易于得到满足,这也是孟德尔随机化方法实施面临的主要问题。针对此 问题,越来越多针对IV3假设不同程度违背下的估计方法衍生而出[9921]。为了方 便阐述因果效应值的不同估计方法的原理,我们以单个遗传变异建立模型来阐述孟 德尔随机化方法的理论形式,以下是对一些特征符号的定义:Gj (j ",…,L )代 表第 j 个与暴露相关的遗传变异; 0表示感兴趣的暴露与结局变量间真实的因果效应值,0屯是以感兴趣的暴露为应 变量,遗传变异为自变量建立回归所获得的回归系数,0与•是以结局变量为应变量, 遗传变异为自变量建立回归所获得的回归系数,理丿代表遗传变异经由暴露以外别 的生物学通路对结局变量的效应。孟德尔随机化基本模型如下:

X』Gij = 0X0 + PxjGij + ^Xij (2.1)

£ | G,= + (0/ + a.)G, + j (2.2)

=0YO + YjGj + ^Yij

PXj > PYj分别表示第丿•个遗传变异与暴露的效应(0£)、与结局变量间效应(0万)

的估计值,则用第j个遗传变异作为工具变量所获得的因果效应估计的比值法估

计值的计算公式如下:

其中,”血•为pg•的标准误,该计算方法为Delta法[网,当遗传变异与感兴趣的

暴露关联的方差•小到可以忽略不计时,b©可简化为cyYj \pxj 量误差(NO Measurement Error, NOME)假设卩刃。由模型(2.1)和(2.2)可知,

当遗传变异是一个有效的工具变量(勺=0)时,•是真实因果效应值0的无偏 估计;当遗传变异是无效的工具变量(勺工0)时,几=0七5 , bj =aj//3Xj

实践中,我们常常使用多个遗传变异作为工具变量,然而,在MR分析中使用 数量越多的遗传变异,一方面:解释暴露变异的信息越多,效应估计值的精确性越 高,因果效应假设的检验效能越强;另一方面:涵盖的无效遗传变异的数量也会增 多,从而得到有偏因果效应估计值及增加检验因果假设的I型错误率[⑹。MBE法理 论上可以放宽多效性假设,在无效遗传变异的比例超过50%时仍能获得因果效应值 的一致性估计,本研究将评估MBE法发现因果效应的能力及阐述何种情形下MBE 法可以获得因果效应值的一致性估计,并与传统的IVW法、MR-Egger法、WME 法进行比较,评估不同方法在因果推断中的表现。本研究所涉及到的MR分析皆是 基于汇总数据的MR估计方法。由于基于比值估计的逆方差加权法和MR-Egger回 归方法的基本原理本课题组已有相关研究对其进行了详细说明㈤],本文不再赘述, 下面将重点介绍基于中位数的估计方法及基于众数的稳健估计孟德尔随机化方法。

2.2基于中位数的估计方法

  • SME 法(Simple Median Estimator, SME)

将所有L个遗传变异的比值法估计值直幻进行由小及大排序,取比值法估计值 的中位数作为最终因果效应的估计值,即,如果总的遗传变异的数目为奇数 (L = 2k + 1),则简单的中位数估计法获得的效应估计值为3,+1;如果总的遗传变 异的数目为偶数(L = 2k ),则简单的中位数估计法获得的效应估计值为*(&+艮+1)。

  • WME 法(Weighted Median Estimator, WME)

同简单的中位数估计法一样,先将所有L个遗传变异的比值法估计值直心•进行

由小及大排序, 弓是赋给第丿个比值法估计值•的权重:

八2 ,

权重: w:=纟牛, 标准化后:W)=「o

>1

久是•由小及大排序后,第1个到第丿个遗传变异权重的累计和,

WME估计值从原理上就是某个经验分布的中位数,该分布把第丿个比值法估计值

加作为其第片=100*(^-0.5*弓)百分位数,第丿个工具变量对整个经验分布的 贡献与其权重厂成正比。SME估计可以认为是所有遗传变异权重相等时的WME 估计。当累计超过50%的权重源于有效的遗传变异时,通过WME方法获得的效应 估计值是真实因果效应0的一致性估计。计算方法为:

S11 — p

PwME = Pk+ (A+l _ A)X   (24)

勺+1 F

k k+1

以上k满足坨=^P. <50且坨+i二工号>50。

j=i

  • PWME 法(Penalized Weighted Median Estimator, PWME)

其基本原理与加权的中位数估计法类似,对存在异质性的比值法估计值直傅的 权重进行调整。异质性检验有多种方法,通常采用卡方检验〔⑹,Cochran^ Q是卡 方检验的统计量,其中0 =工0=工厂(血-励,“为基于比值估计的逆方差加

权方法获得的估计值,每个遗传变异对应的乞统计量服从自由度为1的卡方分布, 与Qj对应的P值用幻表示,最后每个遗传变异的效应估计值的权重的惩罚如下:

W: = Wj x 诫口(1,20 幻) (2.5)

这意味着绝大多数的遗传变异的权重不会受到惩罚的影响,只有那些存在明显异质 性的遗传变异的权重才会被降低。可用Bootstrap㈤]方法计算以上3种基于中位数的 估计值的标准误及置信区间。

2.3 基于众数的估计法(Mode-Based Estimate, MBE)

在比值估计法中血=Z,若存在无效遗传变异,则血=込乞=0 +巧,

Pxj Pxj

巧表示偏倚项,MBE法可得到因果效应的一致性估计的前提是需满足零模型多效

性假设(Zero Modal Pleiotropy Assumption, ZEMPA):在总的遗传变异中,巧的众
数为0。以下是对该假设的详细阐述:令{1,2,.k表示勺不同取值的个数, 例如:假设所有巧值都相等,则k=l;假设所有值都不相等,则k = L;5如・・・,兔表示具有相同巧•值的遗传变异的个数(其中巧按从小到大排序), 因此,有厲+色+・・・+兔=£ o ZEMPA假设用数据形式来展示指的是: 厲 >max(〃2,.…,兔)。

MBE利用多个遗传变异的效应估计值•的平滑经验密度函数的众数作为因 果效应估计值,包括简单MBE和加权MBE法。建立形如f(x)的核密度函数:

2.4软件实现
因此使用MBE方法得到的因果效应估计值为:当f(x)取得最大值时对应的兀的取 值,即:f(3M) = max[f(x)]o假设检验的尸值和可信区间的计算同基于中位数的 估计方法,也应用Bootstrap方法。MBE法将多效性假设弱化了,可将无效的遗传 变异的比例放宽至50%・100%,提岀了新的假设ZEMPAo理论上,在ZEMPA成立 的条件下,MBE法可获得因果效应的一致性估计。

本研究中,遗传变异的筛选步可在R软件中使用for循环和讦条件语句来实现,

MBE、基于中位数的方法(SME、WME、PWME)、IVW 及 MR-Egger 法采用 Yavorska 和 Burgess[41]在 2017 年提供的 R 软件包 MendelianRandomization 中 mr_mbe()> mr_median()> mr_ivw()> mr egger()等函数来实现。

3模拟研究

3.1模拟研究目的

虽然从理论公式上可以证明MBE方法可以提供一致性效应估计值,但是在实 践数据中,与其他方法相比,该方法是否具有良好的估计性能还有待研究。因此, 为了发现不同模型的适用性及存在的问题,评价模型发现因果效应的能力及统计效 能。本研究模拟四种不同情形:模拟1和模拟2旨在评估两样本情形下,不存在因 果效应时(0 = 0) MBE法的表现;模拟3和模拟4旨在评估两样本和单样本情形 下MBE方法的弱工具变量偏倚问题。不同模拟情形下,均采用平均效应估计值、 标准误、覆盖率、效能来评价WMBE、MBE法与SME、WME、PWME、IVW、 MR-Egger>法在因果效应估计方面的优缺点。

3.2模拟数据生成

本文将利用如下模型来生成模拟数据:

Ui=YuZui+sui (3.1)

Xi = Xxzxt + + 8xi (3.2)

Yi = /YZYi + Xj + OyUi + (3.3)

L L L

乙•=(》%©)/%,乙対=乞讣)% ZYi=CEJSYjGij)/aZY (3-4)

J=1 J=1 J=1

其中乙、Zx、Zy分别代表的是厶个遗传变异(常用指标为SNPs, …,q?对

混杂U、暴露X、结局变量Y计算的等位基因得分,8Vj, 3Xj, SYj () = 1,…上)是

Zu、Zx、z,的调整参数。0是暴露X与丫结局之间真实的因果效应值。q是由 二项分布B(2,P)中随机抽样产生的,其中F服从1/(0.1,0.9)的均匀分布,目的为了 在Hardy-Weinberg平衡中模拟双等位基因SNPs的模式。%、%、%均设为1, 在所有的模拟情形中,兀、©都设为正值,提示存在正向的混杂作用。误差项%2、 £&、邑分别由N(0,cr;)、N(0,cr;)、N(0,cf;)的正态分布产生。为了更好地说明 基于众数的方法在MR中的估计性能,参照Fernando和George模拟的情形㈤,根 据MR假设违背程度的不同、重叠样本MR和两独立样本MR的差异,模拟方案分 为四种情形。模拟重叠样本和两独立样本情形旨在对应GWAS数据库中0xjPyj来 自两独立队列和重叠队列情形,同时为研究者选择样本进行MR分析时提供思路。

首先在所有方案中,遗传变异SNPs的数量L = 30,^=^=V03 , yx =Vol, 7u=7y=p40A/l ,其中p = 0,3,6,...,30表示无效工具变量的数目,分别对应 0%?10%, 20%,…,100%无效工具变量的比例。

方案-:InSIDE假设满足但存在正向横向多效性,0 = 0,弘=弘=7500, 无效遗传变异的横向多效性效应第由均匀分布U(0.01, 0.2)产生,有效遗传变异的 第设为0。在该情形下,评价指标效能可以解释为I型错误率。根据无效遗传变异 的比例不同,共有11种情况。

方案X: InSIDE假设违背,0 = 0,他=弘=7500,所有的遗传变异的第都 设为0(即没有直接GtY的横向多效性),但通过设置。个无效遗传变异对应的参 数尙〜U(0.01, 0.2)分布,最终通过GtE/tY产生多效性,根据无效遗传变异的 比例不同,共有11种情况。

方案三:在两样本情形下,不存在横向多效性,即所有的遗传变异均有效 (0 = 0), 0 = 0.1, Nx G {25000,50000,100000}, NY g {25000,50000,100000},根 据弘和弘的不同组合,共有9种情况。

方案四:在重叠样本情形下,重叠比例分别设置为50%、100%(单样本)。0 = 0, 冷=弘丘{1000,5000,10000},根据重叠率和弘、弘的不同,共有6种情况。

分别按照以上模拟方案获得个体口、X"匕数据,由暴露X和遗传变异q•建 立回归模型获得及其对应的标准误,再由结局变量丫与遗传变异q建立回归模 型获得P万及其对应的标准误。所有模拟方案均独立重复3000次。

3.3模拟数据分析及评价

依据上述模拟方案分别产生数据后,可获得遗传变异q与暴露及遗传变异q 与结局分别建立线性回归的效应值及其标准误(即久、久、氏、此,) = 1,2,...,30 ) 的汇总数据,再由汇总数据分别基于众数的估计法(MBE、WMBE)、基于中位数 的估计法(SME、WME、PWME)、IVW法、MR-Egger法所建立的MR模型获得 的模拟结果来进行因果效应值估计的偏倚大小和发现因果效应的能力的评估。本研 究生成的模拟数据及所有数据分析均在软件R 3.4.4中完成。

本研究模拟主要通过平均因果效应估计值直、标准误、效能(Power, 95%可 信区间不包含0所占的比例)、覆盖率(Coverage, 95%可信区间包含真实因果效 应值所占的比例)等指标进行方法评价。采用£□和/二阴统计量评价[vw法

F GX

和MR-Egger法违反NOME假设的程度。

3.4模拟结果及分析

3.4. 1两独立样本情形下,不同方法的表现(0 = 0);

模拟1中,在InSIDE假设满足且存在横向多效性情况下,其模拟结果见表3・1。 当所有的遗传变异都为有效工具变量时,七种方法所获得的效应估计值近似无偏, 且I型错误率都小于或等于5%。正如理论上而言,InSIDE假设满足时,MR-Egger 回归方法获得的效应估计值在所有方法中偏倚最小,尤其是随着无效遗传变异的比 例增加,其优势逐渐体现。SMBE和WMBE方法总体上而言偏倚较IVW、SME、 WME、PWME方法小,但精度比其他方法略差。当无效遗传变异的比例较高时, SMBE法偏倚较WMBE法大。MR-Egger> SMBE和WMBE法随着无效遗传变异 比例的升高,其覆盖率显著高于其他几种方法。

模拟2中,在InSIDE假设违背且存在横向多效性情况下,其模拟结果见表3-2o 当无效遗传变异的比例从10%变化至90%时,SMBE和WMBE相比其他方法而言, 偏倚最小,覆盖率最大,但标准误最大。当无效遗传变异比例达100%时,MR-Egger 法偏倚最小,但I型错误率较大,这可能是由于相比其他情况而言,此时InSIDE 假设违背的程度较小。

3.4.2两独立样本情形下,不同方法发现因果效应的能力(0 = 0.1);

模拟3中不存在无效遗传变异,其模拟结果见表3・3。结果显示:IVW法发现 因果效应的能力最强(>98%),其次是PWME、WME、SME、SMBE、WMBE、 MR-Egger法。当样本量从25000变化至100000时,WMBE法的偏倚最小且因果 效应估计值渐进无偏(即随着样本量的不断增大,估计值为真实因果效应的一致性 估计)。

3.4.3两样本存在重复的情形下(重复率分别为50%、100%),不同方法的表现 (0 = 0);

在模拟4中,两样本存在重复的情况下,其模拟结果见表3-4o结果显示: MR-Egger 回归方法偏倚最大,其次是 IVW、WME、PWME、SME、SMBE、WMBE 法;所有方法中,IVW法精度最大,SMBE、WMBE精度较其他方法略差。模拟4 结果提示在小样本且有重复的情况下,所有MR方法的效能都较低且精度较低、偏倚较大。

无效工具变量比例[%](平均FGX —1/ FGX [%];平均IqX [%])

0(99.7

;97.4)

10(99.7

;97.4)

20(99.7

;97.4)

30(99.7

;97.4)

40(99.7

;97.4)

50(99.7

;97.4)

60(99.7

;97.4)

70(99.7

;97.4)

80(99.7

;97.4)

90(99.7

;97.4)

100(99.7

;97.4)

IVW P 0.004 0.011 0.022 0.057 0.094 0.156 0.221 0.301 0.396 0.483 0.604
标准误 0.089 0.095 0.096 0.096 0.099 0.104 0.111 0.118 0.130 0.138 0.148
覆盖率 95.3 9&1 94.9 92.1 85.0 67.7 56.5 34.7 36.0 2&0 11.1
效能 4.7 1.9 5.1 7.9 15.0 32.3 43.5 65.3 64.0 72.0 8&9
MR-Egger P 0.002 0.009 0.012 0.035 0.058 0.092 0.134 0.163 0.218 0.256 0.336
标准误 0.172 0.179 0.181 0.182 0.188 0.195 0.208 0.221 0.241 0.253 0.270
覆盖率 95.2 94.8 95.8 95.2 94.7 92.7 89.3 8&1 84.7 84.4 77.2
效能 4.8 5.2 4.2 4.8 5.3 7.3 10.7 11.9 15.3 15.6 22.8
SME P 0.008 0.012 0.025 0.059 0.103 0.182 0.253 0.360 0.473 0.594 0.740
标准误 0.152 0.158 0.158 0.157 0.161 0.165 0.172 0.177 0.188 0.193 0.203
覆盖率 97.9 9&1 97.5 96.2 93.6 84.0 71.1 49.4 35.8 31.4 9.8
效能 2.1 1.9 2.5 3.8 6.4 16.0 2&9 50.6 64.2 6&6 90.1
WME P 0.003 0.013 0.016 0.049 0.082 0.137 0.195 0.264 0.349 0.426 0.546
标准误 0.130 0.134 0.135 0.134 0.136 0.138 0.142 0.145 0.152 0.153 0.161
覆盖率 9&8 97.2 97.5 96.2 92.3 86.2 73.5 56.3 40.2 32.7 8.8
效能 1.2 2.8 2.5 3.8 7.7 13.8 26.5 43.7 59.8 67.2 91.2
PWME P 0.002 0.014 0.016 0.049 0.079 0.135 0.192 0.262 0.346 0.425 0.548
标准误 0.130 0.134 0.135 0.134 0.136 0.138 0.142 0.145 0.152 0.154 0.163
覆盖率 9&4 96.8 97.5 95.3 91.3 86.2 72.5 55.7 44.4 37.8 9.0
效能 1.6 3.2 2.5 4.7 8.7 13.8 27.5 44.3 55.6 62.1 91.0
SMBE P 0.005 0.009 0.016 0.050 0.061 0.108 0.125 0.202 0.248 0.231 0.393
标准误 0.202 0.221 0.230 0.231 0.231 0.231 0.230 0.232 0.280 0.282 0.289
覆盖率 9&4 9&9 99.0 9&9 9&5 97.1 94.6 89.8 82.8 76.8 63.0
效能 1.6 1.1 1.0 1.1 1.5 2.8 5.4 10.2 17.2 23.1 37.0
WMBE P 0.004 -0.001 0.015 0.049 0.063 0.105 0.124 0.201 0.243 0.291 0.393
标准误 0.200 0.215 0.215 0.215 0.216 0.217 0.219 0.224 0.268 0.269 0.280
覆盖率 9&3 99.1 99.1 99.0 9&5 97.3 94.7 90.0 82.7 77.6 62.9
效能 1.7 0.9 0.9 1.0 1.5 2.7 5.3 10.0 17.3 22.4 37.1

注:该模拟中,样本量Nx=N『=7500,模拟次数n = 3000 ,效能可解释为I型错误率,° =

无效工具变量比例[%](平均FGX —1/ FGX [%];平均IqX [%])

0(99.7

;97.4)

10(99.7

;97.4)

20(99.7

;97.4)

30(99.7

;97.4)

40(99.7

;97.4)

50(99.7

;97.4)

60(99.7

;97.4)

70(99.7

;97.4)

80(99.7

;97.4)

90(99.7

;97.4)

100(99.7

;97.4)

IVW P 0.003 0.003 0.015 0.033 0.061 0.093 0.130 0.218 0.315 0.325 0.345
标准误 0.134 0.095 0.094 0.093 0.091 0.089 0.086 0.084 0.081 0.079 0.080
覆盖率 97.5 94.7 95.3 93.4 89.4 82.6 25..0 0.0 0.0 0.0 0.0
效能 2.5 5.3 4.7 6.6 10.6 17.4 75.0 100.0 100.0 100.0 100.0
MR-Egger P -0.001 -0.006 0.017 0.022 0.043 0.066 0.092 0.290 0.201 0.198 0.188
标准误 0.181 0.179 0.180 0.178 0.174 0.173 0.171 0.180 0.168 0.165 0.167
覆盖率 97.0 84.5 73.6 64.5 51.6 36.0 10.0 9.4 9.7 12.0 16.0
效能 3.0 15.5 26.4 35.5 4&4 64.0 90..0 90.6 90.3 8&0 84.0
SME P 0.004 0.006 0.016 0.034 0.064 0.100 0.141 0.186 0.238 0.286 0.334
标准误 0.156 0.158 0.155 0.153 0.150 0.146 0.139 0.135 0.129 0.239 0.116
覆盖率 9&0 91.5 77.2 64.0 55.0 46.0 35.0 0.0 0.0 0.0 0.0
效能 2.0 8.5 22.8 36.0 45.0 54.0 65.0 100.0 100.0 100.0 100.0
WME P -0.001 -0.001 0.017 0.025 0.057 0.088 0.121 0.159 0.203 0.239 0.312
标准误 0.134 0.135 0.132 0.130 0.128 0.124 0.119 0.116 0.111 0.106 0.101
覆盖率 9&2 91.5 77.2 64.0 55.0 46.0 35.4 0.0 0.0 0.0 0.0
效能 1.8 8.5 22.8 36.0 45.0 54.0 64.6 100.0 100.0 100.0 100.0
PWME P -0.002 -0.001 0.017 0.024 0.058 0.088 0.119 0.159 0.204 0.239 0.312
标准误 0.134 0.135 0.132 0.131 0.128 0.124 0.119 0.116 0.111 0.106 0.101
覆盖率 97.5 91.5 77.0 64.0 55.0 45.5 35.0 0.0 0.0 0.0 0.0
效能 2.5 8.5 23.0 36.0 45.0 54.5 65.0 100.0 100.0 100.0 100.0
SMBE P -0.002 -0.005 -0.005 0.015 0.014 0.014 0.014 0.090 0.169 0.197 0.231
标准误 0.213 0.214 0.216 0..217 0.219 0.219 0.221 0.223 0.224 0.226 0.229
覆盖率 99.0 9&9 9&2 97.2 96.8 85.0 84.8 75.5 65.8 55.0 30..5
效能 1.0 1.1 1.8 2.8 3.2 15.0 15.2 24.5 34.2 45.0 69.5
WMBE P -0.002 -0.005 0.006 0.015 0.014 0.014 0.014 0.090 0.169 0.197 0.231
标准误 0.212 0.215 0.216 0.217 0.219 0.219 0.220 0.223 0.225 0.226 0.229
覆盖率 99.0 99.0 9&8 96.8 95.5 85.9 84.7 75.5 66.8 45.0 25.0
效能 1.0 1.0 1.2 3.2 4.5 14.1 15.3 24.5 33.2 55.0 75.0

注:该模拟中,样本量Nx=N『=7500,模拟次数n = 3000 ,效能可解释为I型错误率,° =

表3・3模拟3:不存在无效遗传变异,0 = 0.1

方法 统 计 量 样 本 量 平均 FGX —1/ FGX [%] ;平均/二[%]
99.7;

97.4

99.7;

97.4

99.7;

97.4

99.7;

97.4

99.7;

97.4

99.7;

97.4

99.7;

97.4

99.7;

97.4

99.7;

97.4

Nx 25000 25000 25000 50000 50000 50000 100000 100000 100000
Ny 25000 50000 100000 25000 50000 100000 25000 50000 100000
IVW P 0.088 0.093 0.093 0.097 0.098 0.096 0.107 0.106 0.098
标准误 0.058 0.041 0.030 0.028 0.031 0.029 0.015 0.010 0.012
覆盖率 94.5 96.5 95.5 96.2 95.0 96.0 96.5 94.0 9&0
效能 9&6 99.7 100.0 9&5 99.2 100.0 99.2 99.5 99.8
MR-Egger P 0.081 0.078 0.084 0.096 0.097 0.096 0.107 0.111 0.096
标准误 0.061 0.065 0.042 0.061 0.052 0.031 0.029 0.025 0.020
覆盖率 96.5 92.5 95.0 97.5 93.5 97.0 94.0 97.0 97.0
效能 55.8 82.3 90.2 59.2 87.4 95.2 59.8 90.2 96.2
SME P 0.061 0.065 0.100 0..080 0.088 0.096 0.106 0.108 0.097
标准误 0.068 0.068 0.040 0.061 0.039 0.039 0.023 0.021 0.019
覆盖率 99.0 96.5 9&0 95.5 99.0 98.0 97.5 99.0 99.1
效能 94.3 9&5 99..2 94.6 99.5 100.0 99.1 100.0 100.0
WME P 0.085 0.091 0.093 0.099 0.089 0.095 0.105 0.106 0.098
标准误 0.061 0.065 0.041 0.052 0.041 0.038 0.021 0.019 0.019
覆盖率 97.0 95.0 99.0 95.0 97.0 99.0 97.5 9&2 99.0
效能 95.4 96.5 99.4 96.1 99.8 100.0 99.2 100.0 100.0
PWME P 0.086 0.091 0.093 0.099 0.089 0.094 0.105 0.107 0.098
标准误 0.081 0.058 0.041 0.052 0.041 0.038 0.021 0.018 0.012
覆盖率 97.0 94.5 9&5 94.0 95.0 98.0 97.5 99.0 99.2
效能 96.8 95.8 99.2 95.6 99.4 99.8 99.2 100.0 100.0
SMBE P 0.092 0.095 0.099 0.091 0.092 0.100 0.102 0.107 0.097
标准误 0.082 0.078 0.029 0.061 0.032 0.018 0.030 0.028 0.021
覆盖率 9&5 96.5 9&0 97.5 9&5 98.0 99.0 99.2 99.0
效能 75.8 94.5 9&6 82.1 95.6 99.4 85.2 99.0 99.8
WMBE P 0.092 0.095 0.099 0.091 0.092 0.092 0.092 0.107 0.099
标准误 0.082 0.065 0.028 0.061 0.041 0.032 0.032 0.028 0.021
覆盖率 95.0 96.5 9&0 97.5 96.5 98.5 99.0 99.2 99.1
效能 7&1 95.8 99.0 82.2 95.6 95.6 8&5 99.1 99.7

 

Nx 1000 5000 10000 1000 5000 10000
Ny 1000 5000 10000 1000 5000 10000

 

IVW P 0.057 0.028 0.015 0.161 0.071 0.042
标准误 0.182 0.122 0.094 0.165 0.111 0.086
覆盖率 95.0 92.1 93.7 91.8 90.7 91.0
效能 5.0 7.9 6.3 8.2 9.3 9.0
MR-Egger P 0.059 0.024 0.027 0.175 0.096 0.077
标准误 0.221 0.225 0.180 0.284 0.203 0.162
覆盖率 94.0 93.8 94.4 90.3 93.2 94.1
效能 6.0 6.2 5.6 9.7 6.8 5.9
SME P 0.054 0.029 0.008 0.151 0.062 0.030
标准误 0.269 0.192 0.148 0.253 0.184 0.140
覆盖率 94.0 95.3 96.6 91.8 96.8 97.5
效能 6.0 4.6 3.4 8.2 3.2 2.5
WME P 0.050 0.028 0.013 0.157 0.077 0.051
标准误 0.255 0.162 0.122 0.247 0.159 0.118
覆盖率 97.0 95.1 96.2 95.6 95.7 96.2
效能 3.0 4.9 3.8 4.4 4.3 3.8
PWME P 0.053 0.028 0.013 0.157 0.077 0.050
标准误 0.255 0.162 0.123 0.248 0.159 0.118
覆盖率 95.7 93.4 94.5 94.8 94.5 95.4
效能 4.3 6.6 5.5 5.2 4.5 4.6
SMBE P 0.041 0.039 0.007 0.115 0.068 0.048
标准误 0.215 0.120 0.182 0.235 0.215 0.130
覆盖率 9&8 97.7 9&8 9&7 97.3 9&9
效能 1.2 2.3 1.2 1.3 2.7 1.1
WMBE P 0.040 0.039 0.007 0.114 0.066 0.048
标准误 0.213 0.120 0.181 0.232 0.213 0.128
覆盖率 9&8 97.8 9&7 9&9 97.3 9&9
效能 1.2 2.2 1.3 1.1 2.7 1.1

4实例研究

糖尿病可分为1型糖尿病(Type 1 Diabetes Mellitus, T1DM)、2型糖尿病、妊 娠期糖尿病和其他特殊类型的糖尿病四种类型皿1。T1DM被认为是由多种因素引起 的T细胞介导的自身免疫导致胰岛卩细胞被选择性破坏,从而使内源性胰岛素分泌 严重缺陷,随之引发的高血糖症⑷】。传统观念认为1型糖尿病在儿童和青少年人群 高发,现今,T1DM可在任何年龄阶段发病的观点已逐渐被一些学者接受。相关研 究报道,全球儿童T1DM的发病率正在上升,欧洲国家的年增长率达3%・4%屮], 北美年增长率约为5%[45],上世纪90年代末(1988-1996年),一项大规模的流行病 学调查数据显示我国该时期T1DM的总的校正发病率为0.5刀10万人年[他,是当时 世界上已报道的T1DM发病率最低的国家,但该研究显示我国儿童T1DM的发病 率在逐年上升且随年龄的增长而增加。此后,我国便缺乏大规模的流行病学调查和 数据更新,仅有一些单中心研究数据。如研究显示1997-2000年北京市儿童T1DM 发病率为1.01/10万,10・14岁为高发年龄61[47];上海地区儿童T1DM发病率呈现 明显地逐年上升趋势:1994-1996年儿童T1DM的发病率为1.92/10万,2002-2006 年上升至3.36/10万,2007-2011年进一步上升为5.55/10万跑,这些研究均提示我 国儿童T1DM的发病率呈逐年上升的趋向,给社会、家庭、个人带来心理精神上的 压力和经济上的负担。病因学上T1DM被认为可能是由感染引起的T淋巴细胞介导 的免疫自身性疾病㈤],然而,这种观念近来受到挑战。遗传因素虽可解释T1DM发 病69%的变异a】,但仅仅依赖遗传因素己不能解释近年来全球T1DM发病率的迅 猛上升。某些环境危险因素和潜在的自身免疫促进因素如 牛奶摄入量、社会经济 地位、肠道病毒感染等已被相关研究报道[刃,但其因果效应尚未得到证实。

1975年,Baum等血研究显示婴儿期体重增加与T1DM发病相关,随后两大理 论(加速器理论、超负荷理论)显示在肥胖个体中胰岛素抵抗和胰岛素需求明显增 加,引起卩细胞应激和细胞凋亡卩叫 从而导致自身免疫性疾病。在过去几十年中, 美国儿童肥胖率每年增加约0.5%,英格兰、苏格兰和威尔士每年增加1%[54],目前, 全球每年约新增6.6%的5岁以下肥胖症儿童[旳。鉴于全球儿童肥胖率的逐渐增长, 相关研究报道儿童肥胖可能与T1DM发病率升高有关。然而,几项观察性研究未能 发现儿童肥胖与T1DM相关或发病年龄之间存在关联〔殉。研究儿童肥胖与T1DM 间是否存在因果关联的一大难题是T1DM患者体重随着病程下降,因此对研究设计 要求较高,最好是前瞻性研究;除此之外由于T1DM为罕见疾病,在前瞻性研究中 需要大样本量才能达到稳健推断。Verbeeten等旳在对T1DM诊断前进行了体重指 数(Body Mass Index, BMI)的meta分析,该研究发现肥胖儿童发生T1DM的风 险是正常体重儿童的2.03倍(95%CI: 1.46280)。另一项研究结果显示:高出生体 重儿及婴儿期体重迅速增加与T1DM发病风险呈正相关碍。