service phone

Design Works 1

service phone

社会科学中的多元方法研究:基于个案还是基于差异 研究

文章来源:admin    时间:2024-01-20

  

  支承面宽度系数高尔夫球车多元研究方法尝试将不同的方法整合进一个框架里面来助力于因果推断。但这种整合对因果判断的助力何在?又如何实现这种整合呢?本文认为要明晰整合的方法首先要厘清方法之间的区别所在,因此本文将多元方法研究中所使用的方法划分为自下而上的基于个案的方法和自上而下的基于差异的方法。而这两种方法在本体论和认识论上都有所不同,对因果推断的基本假设也截然不同,在推论效果上有各自的优点和缺点。因而作者认为单纯使用三角校正分别验证是不可行的,但将两种方法整合得当可以一定程度上弥补其各自弱点。文章回顾了近期在发展多方法社会科学框架方面的尝试,认为这些方法大多以一种方法为基底进行结合,但这种结合因为没有区分证据等级产生了缺陷。本文对完善社会科学中不同研究方法的弥合有借鉴意义。

  本文综述了近年来多元方法研究在社会科学框架中的尝试。本文首先讨论了个案研究和基于差异的研究方法背后的本体论和认识论基础,并将其方法分为自下而上的基于个案的方法和自上而下的基于差异的方法。基于案例的方法旨在了解一个因果过程如何在一个案例中发挥作用,而基于变异的方法则评估一组案例的平均因果效应。然而,由于基本假设不同,对单个案例的深入研究很难与对大量案例的平均因果效应进行有意义的沟通。结论讨论了这一区别对比较政治研究带来更广泛的挑战。

  近年来,多元方法研究方法日益流行,成为社会科学领域做出更可靠因果推论的工具。最常见的组合包括跨案例比较分析(如统计评估大量案例的平均因果效应)和案例内分析(如过程追踪法)。

  比较政治中多元方法研究的前景在于,不同的方法工具可以弥补彼此的相对弱点,从而能够做出更稳健的因果推论。尽管目前此领域已经取得了很大的进展,但对于不同的因果推理方法的潜在假设和本体论/认识论基础仍然存在相当大的混淆。其结果是,感兴趣并试图在比较政治研究中使用多方法设计的学者,将在不同的叙述中得到截然不同的指导,使其几乎变成一个“无所不能”的情况。

  本文旨在通过确定当前关于多元方法研究的争论背后的关键争论点来澄清混淆。方法上的分歧比通常理解的要大,使得真正的多元方法研究非常困难。本文首先介绍了不同方法的本体论和认识论基础,将方法区分为:“自下而上”的基于个案的研究设计,该方法侧重于追踪因果机制在个体案例中的作用;以及“自上而下”的基于差异的研究设计,它评估总体(或其样本)中变量的平均因果效应,并特别关注它们在进行因果推论时的相对优缺点。基于个案研究设计的关键优势在于,我们了解了一个因果过程在一个给定的案例(或少数案例)中是如何运作的,即文献中对“实际如何”的解释。然而,其缺点在于,我们仍未知道它如何在一个更大、更多样化的总体中使用。相比之下,基于差异的研究设计可以基于平均因果效应(或大样本)的情况进行因果推断,但因为对趋势的推断形式是它在某处起作用,所以很难在个案层面上做出有意义的推断,因为因果异质性始终存在。

  本文认为,这两种方法在一系列基本假设上存在分歧,使得它们难以相互沟通,也就无法声称他们通过三角校正(指通过使用两种或更多不同方法以检验其得出的结论是否有显著方差)就能无缝地弥补彼此的相对弱点。本文认为这两种方法提出了根本不同的问题,并且有不同类型的证据支持因果推论,如果使用得当,它们其实可以一定程度补充彼此的弱点。基于差异的研究设计能够在许多情况中评估X对Y的因果效应的大小。基于个案的研究设计告诉我们,将X和Y连接在一起的机制在特定的环境下是如何运作的。总的来说,当我们有证据证明“什么是因果效应”和“它在这里是如何起作用的”时,因果推论效力就会得到加强。与此同时,两者面临的核心挑战都是如何处理从总体到个体案例之间的因果异质性,反之则是很难找到共同点。

  随后,文章回顾了近期在发展多方法社会科学框架方面的尝试。本文表明,现有的多元方法研究框架以其中一种总体方法(基于案例或基于变异)为出发点,但这对其与案例研究或基于变异的比较相结合的能力产生了影响。现有方法之所以无法弥补这些相对缺陷,是因为它们没有认识到基于案例的方法和基于变异的方法在类型和证据方面的根本区别。文章最后讨论了这些差异给比较政治学研究带来的挑战,并就我们如何通过认真对待两种根本不同方法的存在来推进比较政治学的多元方法研究提出了建议,这两种方法导致了两种平行的证据等级,它们使用非常不同的方法和证据类型来揭示因果关系。

  在所谓的“自上而下”和“自下而上”的研究方法中可以做出关键区分,这种区分很好地反映了一些社会科学家所确定的案例内分析和跨案例分析之间的差异,也反映了比较政治学学者之间的总体差异,一些学者主张在许多国家和时期进行大N数比较,也有学者赞成只包括少数案例的有限比较。科学哲学的工作已经证明了这两种方法背后的本体论和认识论假设的差异的本质——不幸的是,这使得真正的多元方法研究非常困难,因为我们的设问是本质不同的问题。

  基于差异的方法通常使用大N数统计方法,不过,当案例研究被视为提出同类主张(反事实)时,以及当用于因果推论的证据是不同案例之间差异的证据时,案例研究通常也被归入这一范畴。基于个案的方法有时被称为“定性”,但该术语也被用来指各种更具解释主义的方法,因而这种称谓不甚有效。虽然跨案例比较对于选择适当的案例和发现其推广机制也非常重要,但基于个案的方法核心在于使用过程追踪来追踪因果机制。

  值得注意的是,尽管存在许多差异,但从逻辑上讲,因果机制作用的情况总能呈现于单一案例中。用于治疗疾病的药物在单个病人身上有效;但除非它能作用于一个群体,否则该药物并非真正在患者治疗中产生因果影响。同样,否决权人数的增加可能会在政治制度内产生僵局和导致联合决策陷阱,但除非案例间存在扩散或依赖关系,一个国家的改革并不会导致其他国家产生僵局。人们可以通过比较产生该结果的案例和没有产生该结果的案例来了解否决权人数增加带来的影响。但最终,因果关系总是发生在个案中。

  这两种方法在本体论层面(存在反事实逻辑与因果机制法之别)和认识论层面上都有所不同。从这种本体论差异中产生的认识论差异会影响一个人如何认知因果关系。

  根据本体论和认识论的起点不同,结果导向产生巨大的分歧。从自上而下的基于差异的研究设计方法着手,研究分析可以在总体中发现X对Y的平均因果效应。然而,对平均因果效应的了解并不能告诉我们任何关于在特定情况下X对Y的局部因果效应。从个案出发时,目的是跟踪因果机制在其中如何发挥作用,但来自个案的因果机制并不能代表同样的机制会在其他案例中发挥作用,除非有人能在机制的层面上做出强烈同质性的假设。

  因果异质性意味着它会在不同的情况下(单位)之间产生不同的作用。因果异质性指出的是所有类型的因果复杂性,包括相同的原因在不同的情况下可以产生不同的结果(多元性),不同的原因在不同的情况下可以产生相同的结果(等效性),在不同情况下关系的性质不同(例如因素Z1存在的情况下获得肯定结果,因素Z1缺席时获得否定结果)。

  相比之下,机制异质性是指相同的原因和结果在不同的情况下通过不同的机制联系在一起,或者相同的原因触发与不同结果相关的不同机制。对于基于差异的方法,潜在因果异质性的解决方案是在许多情况下对趋势进行概率性推论,但这使得除了对个案进行有根据的猜测之外,很难说明任何事情。对于基于个案的方法,解决方案是将总体划分成小的集合,以避免从个案到广泛的、异质性总体产出有缺陷的推断。

  现在我们来讨论这两种方法,以及使得真正的多元方法研究如此困难的关键差异。

  在基于差异的方法中,黄金标准的方法论是实验法(随机对照试验,或RCT),如果设计得当,它可以对研究样本中给定处理变量的平均因果效应进行强有力的因果推论。基于差异的方法建立在对因果关系的反事实理解之上——通常发展为潜在的结果框架。反事实的因果关系被定义为一个原因产生了一个结果,因为其缺失会导致不产生这种结果结果,而其他条件保持平等。如果不评估一个原因在实际事实和反事实之间可能造成的差异,就不可能进行因果推论。

  为了评估反事实的因果主张,人们需要实证评估反事实(也称为潜在结果),保持所有其他潜在原因和混杂因素的影响不变。在一个实验中,我们保持其他因素不变,比较预与没有预的实验对照组(即反事实状态)的结果值,就能相对容易看到反事实。在这里,对照组作为反事实缺乏干预,使我们能够推断:如果两组的结果值有显著的和实质性的差异,这种差异就是其平均因果效应。鉴于需要在不同案例之间进行比较,基于差异的方法可以被称为“自上而下”的研究方法。

  该方法在实验中表现得淋漓尽致。在实验中,平均因果效应(实验组和对照组结果的平均“差异”)对研究中的案例总体进行评估。因此,“自上而下”一词是合适的,因为因果关系是在总体(或其样本)上通过评估不同案例的趋势来研究的。

  严格地说,以统计多案例因果共变来呈现的观测数据的的原因和结果在许多情况下不能进行因果推论,除非我们假设数据具备科学实验的特点,使我们能够声称我们的总体(在时间上或空间上)可以分为其他条件完全相同的实验组和对照组。更具有挑战性的是,在研究单个案例时,我们可以基于反事实提出因果主张。一种方法是通过将一个案例在空间或时间上分解,将“一个案例转化为多个”,从而以最相似的系统比较的形式对反事实进行(较弱的)评估(除了原因的变化外,其他一切都是相同的)。另一种方法是使用反事实的单个案例研究,对其中关于“什么也许已经发生”的假设证据被用作反事实的比较。其逻辑在于:如果没有一个特定的原因发生,结果就不会发生。

  推断平均因果效应的关键是单位同质性和单位独立性的假设。单位同质性意味着相同的原因将在两个或两个以上的情况下产生相同的结果。单位的独立性意味着在一种情况下的潜在结果不受其他情况下的原因的影响。如果这两个假设不成立,我们对X变化对Y值的影响产生偏差估计。

  基于差异的方法中,有一个明确的证据层次,与在给定研究中作出的因果推断的证据强度(即内部有效性)有关,所在层次关于上述两个假设是否成立。实验法处在证据层次的顶部,它能够做出强有力的因果推论,然后使用观察数据进行实验,可以假设实验组和对照组是“随机”分配的。实验设计实际上是使用观测数据的最相似的系统设计(MSSD)。

  案例研究的发现处于证据层次的最底层,因为当总体中存在因果异质性时,它仅仅能展现关于其发展趋势的少量宝贵信息。当进行小N数的差异比较时,单位同质性和独立性的假设几乎永远不成立。例如,几乎所有试图推而广之的案例都将导致一系列不是因果相似的案例,并且会严重违反案例独立性,即一个案例中的X值会受到之前或同时发生案例中的Y值的影响。关于单位同质性,将谈判作为一个案例在时间上分解为多个阶段(t0、t1、...tn),会导致案例在因果关系上大相径庭,我们可以预期,在比较早期阶段(议程设置)和终局时,原因/机制的作用会出现重大差异。此外,案例之间也不是相互独立的,因为在谈判中,开始阶段(t0)发生的事情自然会影响谈判后期的事件,这意味着案例t0中Y的值会影响后续案例(谈判期间)中X的值。

  此外,案例之间并不是相互独立的,因为在谈判中,谈判开始时(t0)发生的事情自然会影响谈判后期的事件,这意味着案例t0中Y的值会影响后续案例(谈判期间)中X的值。如果我们将谈判分解为不同的问题领域,而不是从时间上进行分解,我们就会发现,一个问题(案例)的交易或僵局会影响到其他重要问题(其他案例),尤其是在一揽子交易是解决谈判的典型形式的情况下。不同的案例也不是千篇一律的。我们可以预期在低关注度问题上,专业知识等因素可能更重要;而在高关注度问题上,专业知识等因素可能不那么重要。在高度突出的问题中,行动者有动力调动必要的信息资源来理解问题。案例研究最多只能帮助我们发现测量误差,或在进行更具探索性的研究时找到潜在的混杂因素,从而帮助我们改进用于探索总体差异的统计模型。

  自上而下、基于差异的研究有两个关键弱点,使其难以与基于案例的研究进行有意义的交流,其中一个弱点在一定程度上可以解决,另一个则无法解决。

  首先,由于是对一个群体(或其样本)的平均因果效应提出概率性主张,因此很难将其上升到个案层面,因为存在潜在的因果异质性。如果总体在因果关系上是完全同质的,那么单位同质性(稳定的单位治疗效果)就会完全成立,这意味着总体水平的趋势可以完美预测个体案例的效果。但鉴于现实世界因果关系的复杂性,可能有很多原因导致这种关系在个案中不成立,包括遗漏变量以及背景因素。正因为如此,我们在本体论上对趋势(即平均因果效应)提出了概率主张。当我们从总体的趋势因果主张转向个体案例时,原因就变成了概率提升者。平均因果效应是研究总体的平均值,但任何特定案例都可能存在其他因素的不同组合。如果X与Y之间存在正相关关系,那么根据我们对不同自变量的平均因果效应和混杂因素影响的了解,理论上可以估算出单个案例的趋势概率。然而,要做到这一点,要么我们有证据表明所研究的总体中存在高度的因果同质性,使我们能够假定总体效果以可预测的方式适用于个别案例;要么我们实际上已经绘制出了总体中蕴含的因果异质性图,从而能够将案例分组为更同质的案例子集(例如,当存在Z1因素时,X与Y之间存在负相关关系,而在不存在Z1因素的案例中则不存在任何关系)。如果两者都不成立,那么从总体水平的趋势推断出个体案例时,就很有可能出现谬误。实际实验的另一个困难是,其推论在受控实验室环境之外并不一定成立,这意味着其用于推断实验室外案例的能力会进一步降低。

  其次,即使我们能够准确估算出单个案例的趋势概率,通过比较不同案例中X和Y的值来研究因果关系也无法告诉我们原因在案例中是如何起作用的。换句话说,我们可以了解到X的变化对Y值的影响,但我们无法了解到连接两者的因果箭头——它仍然是一个黑箱。实验并不能告诉我们干预是如何起作用的——只能告诉我们存在平均因果效应。为了了解案例中的原因是如何实际起作用的,我们需要从反事实的差异分析转向探索因果过程是如何在实际案例中发挥作用的。

  总之,基于差异的方法是一种自上而下的方法,以跨案例平均因果效应的形式评估反事实因果关系。其相对优势包括能够评估净因果效应的大小,以及能够对许多案例(群体或样本)进行因果推断。核心弱点是我们无法应对总体内部存在因果异质性的风险,因此我们最多只能利用案例倾向概率做出有根据的推测。

  基于案例的方法是自下而上的,因为对个案的深入研究是分析的出发点。这里的目标是了解因果机制及其在特定案例中的运作方式。在基于案例的理解中,因果机制不仅仅是低层次的反事实主张。如果我们认真对待机制,那么我们的目标就是探索在案例中究竟是什么过程在起作用。对某些令我们困惑的事件的机制解释之所以具有解释性,正是因为它能够让我们理解某些系统的各个部分究竟是如何合力产生这一事件的。机制不是原因,而是由原因引发的因果过程,是将原因与结果联系在一起的产生性关系。

  在基于案例的方法中,重点是追踪案例中因果机制的运作。因果机制的核心要素以与流程各部分相关的活动所留下的痕迹的形式进行理论解读和实证研究。机制的每个部分都可以用参与活动的实体来描述。实体是参与活动的因素(行动者、组织或结构),而活动则是变化的制造者或通过机制传递因果力量或权力的因素。在这里,机制是以一种比单纯的反事实更全面的方式来看待的,这意味着机制的效果大于其各部分的总和。当一个因果机制作为一个系统被从理论上拆解开来时,我们的目标就变成了通过追踪一个或多个案例中每个部分(或至少是最关键部分)的运作来了解一个过程是如何实际运作的。

  机制是通过收集机制证据,即与机制各部分相关的活动的运行所留下的可观察到的痕迹来进行经验追踪的。这里不存在变异;相反,正是这些经验痕迹及其与活动的关联,使我们能够推断出,我们已经掌握了将一个原因(或一组原因)与一个结果联系起来的机制的证据。机制证据是可观察的数据,试图捕捉个案中发生的真实情况。

  在以案例为基础的研究中,使用机制证据对个案中的过程进行详细追踪是证据层次结构的顶层。其下是较为薄弱的个案内部方法,这些方法只能间接追踪机制(一致性研究和分析性叙述),因此无法进行有力的因果推论。最底层是使用定性比较分析(QCA)等方法进行的个案间比较。这种方法可以用来寻找潜在的原因,选择合适的案例进行案例内部分析,并对小范围的案例集的过程进行谨慎的概括。

  首先,将个案作为分析的出发点需要对机制提出确定性的因果主张。如果我们对趋势感兴趣,为什么要在单个案例中探讨趋势呢?然而,在单个案例中发挥作用的详细因果机制知识并不能轻易地输出到其他案例中,因为机制对哪怕是微小的背景差异都很敏感。这就意味着,机理异质性可能由背景差异产生,背景差异被定义为以下情况:(1)相同的原因在两个或多个案例中引发不同的过程,从而导致不同的结果;或(2)相同的原因通过不同的过程与相同的结果相关联。通过对案例的原因、结果和背景条件值进行评分,对总体进行细致的映射,可以降低第一种变体的风险。然而,第二种情况的问题更大,因为在原因/结果层面看似同质的案例集下可能潜藏着机理异质性。鉴于这种敏感性,我们通过比较从研究案例归纳到其他案例的能力大大削弱。我们用因果推论的较高内部有效性来换取超出研究总体的较有限的概括能力(即较低的外部有效性)。在这种情况下,从个体(或小群体)推断到总体将导致谬误。

  如果我们不认真对待机制的异质性,认识到现实世界案例的复杂性以及机制因情境敏感性而具有的有限泛化边界,那么另一种选择就是将我们理论化机制的抽象程度提升到如此之高的水平,以至于我们理论化的机制实质上对我们了解现实世界案例中是如何运作的作用微乎其微。然而,这并没有告诉我们这些过程在现实世界中是如何运作的。以案例为基础的学者并没有将抽象水平提升到一语道破的程度,而是对在更小、更有限的案例集中运作的过程提出了更广泛的主张。

  许多以变异为基础的学者对做出相对特殊的、有界限的推论持怀疑态度。研究人员越来越有兴趣探索事物在特定环境下是如何起作用的,而不是进行简单的实验,在受控环境中分离出干预效果。就个性化医疗而言,这可能意味着我们了解一种治疗方法对某一特定类型的患者(如因常见并发症而服用其他药物的患者)的疗效,但我们并不假定这种治疗方法对其他患者也有效,因为这些患者可能因其他疾病而服用其他药物。个性化医疗不是一刀切的说法,而是试图了解什么对特定类型的病人有效。

  但认识到复杂性并不意味着我们不能进行积累性研究。理想的情况是,在经过较长时间的深入合作研究后,我们将获得一份以证据为基础的目录,列出在不同情况下由特定原因(或一系列原因)引发的不同机制。当然,这类研究需要更多的资源,但这并不是对机制进行草率概括的借口。

  最后,在政策评估领域,人们越来越关注将机制追踪作为一种分析工具,以研究干预措施如何在特定情境中发挥作用,而不是使用宽泛的命题,因为这些命题对现实世界中事物如何发挥作用的情况知之甚少。

  第二个关键挑战是掩蔽问题。掩蔽是指某一原因可能通过多种机制与同一结果相关联,而这些机制可能对结果产生不同的影响。例如,运动会引发两种不同的机制:一种是通过燃烧卡路里来减肥,另一种是通过锻炼肌肉来增重。追溯运动与减肥之间的燃烧卡路里机制,并不能让我们评估运动对体重的整体因果效应。为了研究和评估净因果效应,我们需要基于差异的设计。

  图1左侧描述了一种自下而上、基于案例的因果推断方法。研究的核心是在个案内部详细追踪个案的因果机制。跨案例分析通常在中间层进行,这里描绘的是中间部分,在这里存在小范围的案例群体。所使用的比较方法通常是QCA等工具,或者是密尔方法的更简单的应用。其主要缺点是存在原子论谬误的风险,即从个体到更大的案例群体的概括存在缺陷。

  相比之下,在基于差异的方法中,研究的核心是在总体中对原因(自变量)进行实验或准实验操作,并控制潜在的混杂因素。这样就能推断出X对Y的平均因果效应。其缺点是,当我们从趋势转向个体时,有可能出现谬误。

  这些弊端使得在一种方法中得出的推论很难应用到另一种方法中。现在,我将对最近几种最著名的多方法方法尝试进行简短回顾,说明这些尝试往往停留在一种方法上,因此也具有与总体方法相同的优缺点。最后,我提出了两种互补的证据等级制度,以此作为前进的方向,同时也承认基于案例的方法和基于变异的方法之间存在根本性的鸿沟。

  在下面,我将简要介绍利伯曼(Lieberman)、汉弗莱(Humphrey)和雅各布斯(Jacobs)、西赖特(Seawright)和戈尔茨(Goertz)的多元方法研究框架,并指出每个人都面临着分析起点(自上而下/自下而上)所产生的相同弱点。

  在2005年一篇被广泛引用的文章中,提出了一个多元方法研究的框架,表明我们总是从大n回归分析开始。如果回归发现X和Y之间存在稳健的相关性,并控制了其他因素,那么分析就可以继续使用小n数分析来检验所发现的X/Y关系。小n数分析被定义为“案例的定性比较和/或案例内因果链的过程追踪,以及理论和事实之间的关系很大程度上以叙述形式被捕获”。

  小n数分析通过选择一个符合大n数分析发现的X/Y关系的案例(或小案例)进行;换句话说,它们在回归线上或回归线附近,残差很小。理想情况下,选择的案例是在大n数分析模型的核心自变量上表现出最大程度的变化。然而,没有指导说明需要多少案例来更新我们对平均因果效应的大n数分析推断的信心。

  在实际的小n数分析中,利伯曼讨论了案例研究的许多变体,并提到了数据集和因果过程观察之间的区别。但小n数分析的核心建立在他评估反事实的观点上。这表明,在其核心上,有差异产生的证据被用于大n和小n的分析。在一个或多个案例中找到符合大n数分析的案例内证据后,分析师可以得出结论,X/Y关系在不同方法之间是稳健的。

  然而,通过从大n数分析开始,利伯曼的框架遇到了所有基于差异的方法的相同挑战,这就是对个别案例说一些有意义的东西。尽管表明小n数分析可以解决与“因果顺序、案例异质性”相关的问题,但他的框架没有提供异质性问题的解决方案。他建议人们应该更多地关注研究少数案例。

  而对一个或少数几个案例进行的小n研究,如果不能提供局部因果效应的证据,又如何能让我们了解总体的平均因果效应?除非我们强加不切实际的假设,即案例是同质的,X和所有可能的混杂因素在总体中以相同的方式起作用。不幸的是,大n相关性可能会掩盖这样的情况:一组案例中存在一组混杂因素,使X对Y产生较大影响,而其他案例中存在另一组混杂因素,导致X的影响较小,对于其他混杂因素组合的案例,X甚至可能产生负作用。这种类型的异质性——在大多数杂乱无章的社会科学数据中都是意料之中的——意味着从X/Y回归中选取几个异常案例,对我们了解平均因果效应毫无意义。

  如果我们把小n个案例研究的贡献理解为侧重于提供中间发生了什么的证据,那么利伯曼关于选择回归异常值的建议也就变得非常有问题了。机制只有在原因实际发生作用时才会出现,也就是说,机制只有在X值高于某一阈值时才会被触发。因此,在X值和Y值较低的情况下,我们不应该期待机制的出现。从逻辑上讲,如果一个人不吸烟,就不会触发任何机制将其与肺癌联系起来。因此,机制学说本质上是不对称的,这意味着只有在存在触发机制所需的原因和背景因素的情况下,才能对其进行研究。根据利伯曼的案例选择建议,我们可能会选择一个低X/Y的案例来追踪机制--这意味着我们会试图在一个我们根据案例评分先验地知道不可能存在机制的案例中研究机制。

  汉弗莱和雅各布斯的贝叶斯框架结合了个案内分析和跨个案分析,其重点是估计跨个案的平均因果效应,而个案内分析则是一种辅助工具,通过使用不同的数据类型来了解因果效应,从而更新我们对跨案例趋势的信心。大样本跨案例分析的目标是估算X对Y在总体中的平均因果效应,而使用过程追踪的案例内分析则是为了提供线索(因果过程观察),以揭示特定案例中X和Y之间是否存在因果关系。然后,根据所研究案例在总体中所占的比例,利用单个案例的信息更新我们对总体平均因果效应的信心。在其他条件相同的情况下,研究的案例数占案例总数的比例越大,我们对总体平均因果效应的大小就越有信心。在此,他们对总体的单位同质性做了强有力的假设,假定个案的关系线索(即局部干预效果)可用于更新我们对平均干预效果的认识。他们承认,在某些情况下,可能存在因果异质性的风险,即总体中不同案例的因果效应不同。他们建议,当存在异质性时,我们应该研究更多的案例,因为每个案例对更新平均因果效应的信心影响较小。当存在很强的异质性时,他们认为案例研究不再能告诉我们任何有关趋势的信息。

  虽然他们提供了一个全面的多方法模型,但其基于差异的出发点造成了两个弱点。

  首先,虽然他们的框架能够进行单个案例到总体的更新,但却没有为我们提供另一个方向的工具,即估计单个案例是否反映了总体趋势。

  其次,他们的框架将过程追踪案例研究视为一种辅助方法,没有为真正的推论提供附加值。但是,如果不打算追踪某些东西(即机制),为什么还要使用过程追踪一词呢?因果过程观察这个术语告诉我们它是个案内部的证据,但它并没有揭示经验观察实际上是什么过程的证据。而当我们没有被明确告知经验材料是什么证据时,就很难评估其证明价值。因此,他们的框架让我们无从知道事情是如何运作的,从而黑箱化了学者非常感兴趣的因果机制。在这方面,只有当我们淡化了最初想要进行案例研究的原因时,多元方法研究才成为可能。

  西赖特2016年出版的这本书在基于差异的方法中为多元方法研究制定了迄今为止最复杂的框架。他的框架以潜在结果框架的形式明确基于反事实因果关系。该框架的核心是关注不同案例的平均因果效应,最好通过实验设计进行评估,这意味着它完全属于基于差异的方法。同时,他认为交叉案例分析和案例研究回答的是不同的研究问题,这意味着他谈论的是方法整合,而非三角校正。书中讨论了案例研究的许多不同潜在用途(如处理潜在的测量问题),但我在此重点讨论与结合案例研究和大n回归分析进行因果推断有关的应用。

  与其他基于差异的方法一样,核心分析是在群体水平上进行的,调查不同案例中的原因差异,即平均因果效应。这可以使用实验、自然实验或大n观测数据来进行。西赖特非常谨慎地指出,单位同质性是有效因果推论必须满足的关键假设。当然,在实验中通过随机选择大量单位来实现这一点并不困难,但实验存在所研究的总体是否与其他总体相匹配的问题。自然实验假设了单位的同质性和独立性,但独立性假设的有效性尤其可能存在问题。西赖特建议,解决这一问题的办法是利用案例研究来检验是否存在分配效应,这种效应可能会使平均因果效应的估计值出现偏差。他指出,只有在模型中包含所有混杂途径和控制变量的情况下,简单的观察研究才能用于因果推论,他认为这是一种不现实的情况。

  案例研究与因果推断有关,被视为发现混杂变量(Z)(即因果异质性)和探索将原因和结果联系在一起的路径的工具,可以使我们对因果联系更有信心,从而对平均因果效应的非实验估计更有信心。他首先建议,可以通过探索因果异质性的原因,利用偏差案例来寻找潜在的混杂因素。一旦找到产生异质性的混杂变量,他建议应根据混杂变量的得分将案例分组为更小的、同质的子集。追踪因果路径还可用于探索平均因果效应的回归估计中是否潜藏着未知的混杂因素,利用因果过程观测(CPOs)来探索原因和结果之间是否存在直接联系。

  就这两个目的而言,该框架对于从研究单个案例中可以获得多少有关总体的知识相对来说都没有提及。西赖特在书中讨论了一项回归分析,发现全球化在经济问题上产生了共识,而经济不平等的总体水平被用作控制变量。他将这一基于回归的研究与土耳其的案例研究进行了比较,发现全球化加剧了不平等,这表明全球化并非控制变量,而是因果模型的一部分,至少在土耳其的案例中是如此。西赖特认为,这一信息应促使原回归报告的作者提出证据,证明不平等现象并没有在其他国家产生(即不平等现象仍可作为控制变量),重新估计没有经济不平等现象作为控制变量的因果模型,或者提出证据,说明为什么土耳其的案例研究分析存在缺陷。然而,这里的关键方法论问题在于,我们不知道根据西赖特的框架我们究竟应该做些什么,也无法回答我们需要多少案例才能重新评估平均因果效应。这并不意味着西赖特的框架是错误的,而是说它只是触及了这些重要问题的表面。

  最后,西赖特认为机制不过是干预变量的结果,这意味着深入追踪机制并不能收集到关于因果关系额外的重要知识。这意味着归根结底案例研究始终是一种辅助方法,可以增强我们对不同总体平均因果效应的信心。由此,案例中的因果效应究竟是如何起作用的,被牢牢地留在了分析的黑匣子中,从而也淡化了这类知识所能带来的贡献。

  在本文所评估的作品中,戈尔茨的综合方法最接近以案例为基础的方法。然而,正如下文将解释的那样,这项工作最终将机制黑箱化,这意味着我们对案例中的实际工作过程了解甚少。相反,戈尔茨声称,研究机制(通常使用反事实假设)使我们对X对Y的整体因果效应更有信心。

  戈尔茨提出了研究因果机制的三要素,即案例研究(过程追踪和反事实分析)和跨案例分析(包括实验性和观察性的大n数分析或QCA)。他建议,分析应从绘制特定机制可能起作用的案例群开始,尽管这是以X和Y为框架的。然后对三类案例进行案例研究:机制可能存在的案例(X=1,Y=1)、机制应该存在但不存在的案例(X=1,Y=0)以及等效案例(X=0,Y=1),即其他原因和机制在起作用的案例。跨案例分析可以对X和Y进行归纳总结,尽管戈尔茨的框架与近期其他多元方法研究尝试存在许多相同的问题:我们如何从研究的案例转向更广泛的总体,反之亦然?不过,他在此提出了一个创新性的解决方案,建议将对少数案例的深入分析与对更多案例的粗略研究结合起来,以便更加确信在更大的案例总体中不存在潜伏的因果异质性。

  然而,在戈尔茨的研究中,机制仍然是一个分析黑箱。当我们将理论化的机制保持在一个非常高的抽象水平上,就不难实现从群体到个案的相对无缝的来回移动,但这样它就无法告诉我们案例中到底发生了什么。

  鉴于基于案例的研究和基于变异的研究提出了根本不同的问题,并使用非常不同类型的证据对其进行研究,因此,在进行比较政治研究时,试图将二者调和成一个无缝的方法论框架,让二者取长补短,是不可能完成的任务。科学哲学的最新发展表明,我们应该接受这些差异,承认有两个黄金标准:利用机理证据对机制进行个案内部的深入追踪,以及随机对照实验。

  然而,这让比较政治学研究陷入了尴尬境地。如果说实验是黄金标准,那么鉴于比较政治学的许多研究问题涉及的是发生在国家层面的宏观现象——在这种情况下,实验操作是不可能的——我们是否只能提出相关性主张?如果个案内的机制追踪是黄金标准,那么比较还有什么作用?

  这种差异带来的第一个结果应该是,比较政治学者在定义他们的比较对象时更加明确。是比较不同情况下的原因差异模式?还是比较案例内部的运作过程,并理解特定过程的触发条件?承认差异而不是试图掩盖差异,是就如何开展比较政治研究进行更富有成效的讨论的第一步。

  下一步是比较政治学者在这两种方法中开发出更强大的方法论工具,以参与积累性研究。在基于变异的方法中,一个富有成效的前进方向是在系统生物学和个性化医学的发展中寻求灵感。学者们应放弃通过探索大量不同案例的平均因果效应来寻求单一原因的普遍解释。取而代之的是,一个更有成效的研究计划将需要尝试了解原因和背景如何在因果关系较为一致的案例集中相互影响。这可能首先涉及某种形式的聚类分析,然后在确定的聚类中进行理论探究,以找出原因的影响以及它们之间的相互作用。

  以案例为基础的方法中的累积研究涉及了解事物在特定环境中的运作方式(即机制)。遗憾的是,自然科学文献中几乎没有关于如何从单个案例中推断出机理结论,以了解在这里有效的东西是否也在那里有效的指导。因此,以案例为基础的比较学家应该尝试超越那些本质上往往只是单一案例研究的设计,或者超越那些将机制视为单行线的设计,因为它们无法告诉我们一个过程在任何特定案例中是如何起作用的。相反,他们应努力开发更好的方法论工具,以便开展以机制为重点的累积性研究计划。

地址:     座机:    手机:
Copyright © 2002-2017 DEDECMS. 织梦科技 版权所有 Power by DedeCms    技术支持:凯发娱乐传媒    ICP备案编号: