FDA有源医疗器械指导原则草案:医疗器械软件(SaMD) 临床评价

医疗器械软件(SaMD): 临床评价

前言

1.0 介绍

国际医疗器械监管机构论坛(IMDRF)旨在就临床评价和证明IMDRF/SaMD WG/N10 文件“医疗器械软件(SaMD): 主要定义”(SaMD N10)中所定义的用于医疗用途的软件的安全性、有效性和性能的原则达成共识。

对于所有医疗器械而言,临床评价是在产品的生命周期中作为质量管理体系的一部分开展的一个过程活动,是对医疗器械相关的临床数据进行评估和分析,以验证其安全性、有效性和性能[1]。所有医疗器械的临床评价原则都是相同的,目前在临床指南中要求的严谨度意在技术无关化。

医疗器械软件(SaMD)是一种医疗器械类型,它对患者和公共健康也有重大影响,因此需要合理的安全性、有效性和性能保证。

医疗器械软件的这种保证需要通过全面规划临床评价方法来提供,这种临床评价方法必须能够生成足够的科学证据来产生透明度和保证对于医疗器械软件就其预期用途和适用范围而言的临床有效性(即医疗器械软件的权利要求)的信心。此评价连同证据一起有助于证明医疗器械软件是安全的和按照预期运行,并且在权衡给患者带来的效益时,与使用医疗器械软件相关的风险是可以接受的。

全球监管机构期望临床评价和为医疗器械软件产生的证据具有与医疗器械软件的风险和影响相称的相同科学严谨程度,以证明对其安全性、有效性和性能的保证。

然而,医疗器械软件的独特之处在于它在一个复杂的、高度互联互动的 会技术环境中运行,能够更快和更有效地实施频繁的变更和修改。医疗器械软件的开发也受到广泛应用程序的新开发人员不熟悉医疗器械法规和术语因素的重大影响。

大多数医疗器械软件,除有限的情况外,不直接影响或与患者接触,只是对数据输入进行计算,并向用户提供数据输出,以告知临床管理,推动临床管理或者对患者进行诊断或治疗。医疗器械软件的输入数据通常依赖于其他生理测量医用设备的输出或体外诊断设备。另一方面,随着医疗决策越来越依赖医疗器械软件的输出所提供的信息,这些决策会影响临床结局和患者护理。

[1] 全球协调工作组(GHTF) 临床评价, 第4页, 2007年5月。http://www.imdrf.org/docs/ghtf/final/sg5/technical-docs/ghtf-sg5-n2r8-2007-clinical-evaluation-070501.pdf

[1] 全球协调工作组(GHTF)是由国家医疗器械监管机构和行业代表自愿组成的一个组织。GHTF已于2012年解散,其使命已由国际医疗器械监管机构论坛(IMDRF)接管。

医疗器械软件临床评价原则和概念的这种应用也依赖于IMDRF IMDRF/SaMD WG/N23FINAL:2015“质量管理体系(QMS)的应用”(SaMD N23) 中所描述的原则和过程。具体而言,SaMD N23 描述了临床评价为什么也是生命周期活动中的一个过程,还介绍了更大规模的质量管理体系框架,包括组织支持、生命周期支持过程和软件实现开发生命周期过程。

2.0 范围

? 可用于产生医疗器械软件临床证据的相关临床评价方法和过程

? 不同SaMD类别必需的临床证据级别

? 独立评审重要或不重要的SaMD类别。

所讨论的原则旨在帮助医疗器械软件制造商和监管机构。这些原则基于一个共同目标,即向依赖医疗器械软件的输出来进行患者护理的医疗器械软件用户(患者,供应商,消费者,临床研究者)提供信心。

对适于医疗器械软件的临床评价方法和过程的描述以及关于多少证据(或证据的肯定度)和独立监管适合医疗器械软件的建议并非意图替代不同管辖地区与医疗器械软件的监管分类相关的上市前或上市后监管要求或者与之发生冲突。同样,这些信息并非意图替代技术或国际标准或者与之发生冲突。

SaMD类别仅限于SaMD N10 中的定义和SaMD N12 中所述的预期用途类别,其中医疗器械软件所提供的信息的用途是在非严重、严重或危急的病症或病情下告知临床管理、推动临床管理或者诊断或治疗疾病或病症。

:欲了解关于什么是SaMD(医疗器械软件)和什么不是医疗器械软件的更多信息和实例,请查阅第8.2节和8.3节。

本指南也没有探讨所有医疗器械的普遍问题或者某个国家或管辖地区特有的问题,例如:

? 标签标示范围外使用或可预见的误用;

? 特定医疗器械软件的器械分类;

? 特定医疗器械软件是否需要上市前许可或认证。

3.0 参考文件

IMDRF文件:

SaMD N10 医疗器械软件(SaMD): 主要定义

SaMD N12 医疗器械软件(SaMD): 风险分类的可能框架和相应的考虑因素

SaMD N23 医疗器械软件(SaMD): 质量管理系统的应用

GHTF文件:

GHTF SG5 /N6 体外诊断医疗器械的临床证据 – 主要定义和概念

GHTF SG5 /N7 体外诊断医疗器械的临床证据 – 科学有效性判定和性能评价

GHTF SG5 /N8 体外诊断医疗器械的临床证据 –关于体外诊断医疗器械的临床性能研究

GHTF SG5 /N3 临床调查

GHTF SG5 /N2 临床评价

GHTF SG5 /N1 临床证据 – 主要定义和概念

GHTF SG5 /N4 上市后临床随访研究

GHTF SG1 /N68 医疗器械安全性和性能的基本原则

国际标准:

ISO 14155-1:2011 人类受试者用医疗器械的临床调查 – 良好临床规范

ISO 14971:2007 风险管理在医疗器械中的应用

IEC 80002-1:2009 医疗器械软件 – 第1部分:关于在医疗器械软件中应用ISO 14971的指南

4.0 定义

? 在SaMD N10中确定的医疗器械软件的定义。

医疗器械软件(SaMD)

术语“医疗器械软件(SaMD)”被定义为适用于一种或多种医疗用途并且不属于硬件医疗器械的一部分的软件。

注:

○ 医疗器械软件(SaMD)是一种医疗器械,包括体外诊断(IVD)医疗器械。

○ 医疗器械软件能够在通用(非医疗用途)计算平台上运行

○ “不属于…的一部分”是指软件不是硬件医疗器械实现其预期医疗用途所必需的;

○ 如果软件的预期用途是推动硬件医疗器械,则软件不符合“医疗器械软件(SaMD)”的定义。

○ 医疗器械软件可以与包括医疗器械在内的其他产品联合使用(例如作为模块);

○ 医疗器械软件可以与其他医疗器械连接,包括硬件医疗器械和其他SaMD软件以及通用软件

○ 符合上述定义的移动应用程序被视为医疗器械软件。

4.1 医疗器械软件的临床有效性

就本指南而言,术语“临床有效性”用于指下列项的组合:

a) 医疗器械软件的输出与临床状况/生理状态的联系(科学有效性);

b) 医疗器械软件在医疗器械软件定义声明中所确定的病症或病情下产生与医疗器械软件输出的目标用途关联的临床上有意义的输出的能力(临床性能)。

根据医疗器械软件的类型而定,临床有效性可以表示如下:

? 对于旨在治疗疾病或病症的医疗器械软件而言,临床有效性是医疗器械软件的输出治疗或预防疾病或病症的有效性的证据。

? 对于非诊断性医疗器械软件而言,临床有效性是科学有效性的证据,证明医疗器械软件的输出在临床护理中的有用性。

? 对于诊断性医疗器械软件而言,临床有效性不仅是医疗器械软件的临床性能证据,还是科学有效性的证据。

4.2 医疗器械软件的科学有效性

科学有效性是将医疗器械软件的输出与临床状况/生理状态关联。

通常根据学术研究来确定科学有效性,并且通常由评估输入的研究以及用于使医疗器械软件的输出与临床状况/生理状态关联的算法来支持。例如:血红蛋白浓度与贫血(临床状况)关联。充血性心力衰竭、高血压、年龄、糖尿病、既往卒中(CHADS-2)评分与预测非瓣膜性房颤患者卒中风险关联。

科学有效性确定医疗器械软件的输出如何准确地与医疗器械软件预期用途的预期临床病症或病情关联。这些证据客观上证明与公认的参考标准(即黄金标准)、另一种医疗器械软件或医疗器械、成文的方法、当前临床实践或护理标准或组合参考标准相比,医疗器械软件使用的输入、算法和输出的临床关联性。当与其他器械(包括其他医疗器械软件)进行比较时,通常使用其他器械用来确定预期临床状况的科学有效性的原始参考标准,而不是器械本身。

科学有效性还基于回顾现有的资料(例如经过同行评审的文献、教科书、历史数据和基于经验的证据、学术研究)来确定医疗器械软件的预期用途与临床状况/生理状态的关联性是否是已知的(即已知分析有效性标准是临床上可接受的,以及分析有效性评估已判定医疗器械软件符合这些标准)或者是否得到以前的研究的支持。

在科学有效性鉴定结束时,医疗器械软件一般可以分为以下类别之一:

“急性生理学和慢性健康评价II(APACHE II)”评分的计算与卒中风险的关联性是已知的。

b) 新的关联性:这些医疗器械软件涉及新的输入、算法或输出,新的预期目标人口或新的预期用途,并且它们不是已知的。实例:新算法利用非标准输入(如步态、血压或其他生理和环境信 )来检测健康恶化的早期发作或诊断疾病。

4.3 医疗器械软件的临床性能

医疗器械软件的临床性能是医疗器械软件在医疗器械软件定义声明中所确定的病症或病情(疾病类型、目标用户和预期人口)下产生与医疗器械软件输出的目标用途相关联的具有临床意义的输出的能力。“临床上有意义”是指医疗器械软件对个人健康的积极影响被指为是具有意义、可测量且患者相关的临床结局,包括与诊断相关的结局或对患者公共健康管理产生的积极影响。

临床性能由制造商在分销医疗器械软件供使用之前(上市前)在医疗器械软件开发过程中进行评估和判定,或者在分销后在医疗器械软件正在使用的时候(上市后)进行评价和判定。

可通过证明下列特性来鉴定医疗器械软件的临床性能:

? ROC曲线 -鉴于将医疗器械软件的负值和正值分开的决策阈值是可变的,显示灵敏度和特异性之间折衷关系的一个图表;

? 阳性预测值:已知医疗器械软件的输出为阳性,表示患者患有疾病或病症的可能性

? 阴性预测值:已知医疗器械软件的输出为阴性,表示患者没有疾病或病症的可能性

? 似然比 -在目标状况的患者中预期出现特定结果的可能性与在没有该状况的个体中预期出现相同结果的可能性的比值;

? 截止阈值、指数或标度 – 对医疗器械软件的预期用途应有意义,并在确认之前确定。

注:灵敏度和特异性取决于选择的截止值(例如,将负值与正值分开)。

注:预测值取决于在相关的人口中疾病或病症的发病率。

4.4 医疗器械软件的分析有效性

医疗器械软件的分析有效性是医疗器械软件根据输入数据准确可靠地产生预期输出的能力,即分析有效性衡量医疗器械软件正确和可靠地处理输入数据并准确、可重复和可再现地(即精确度)产生输出数据的能力。分析有效性还可以包括分析灵敏度指标(例如检出限)以及在医疗器械软件允许的输入数据范围内的输出线性或行为。

通常由制造商在软件开发生命周期的验证和确认阶段使用QMS来评价和确定分析有效性。对于医疗器械软件来说,总是要求分析有效性。

分析有效性确认并提供客观证据表明(a)软件符合其规范,换言之,“正在正确构建软件?”,(b)软件规范符合用户需求和预期用途,以及可以始终如一地实现通过软件实施的特殊需求,换言之,“正在构建合适的软件?”

医疗器械软件的分析有效性将包括旨在证明以下性能的测量:

? 准确性 -一个数量的测量结果与该数量的真实值的接近程度。当医疗器械软件的输出和真值是二进制时,准确性是在所检查的输出值总数中真实结果(真阳性和真阴性)的比例;

? 精确度 -与再现性和可重现性有关,是在不变的条件下重复测量显示相同的结果的程度;

? 检出限 -医疗器械软件在临床状况的信息承载模式和分散信息注意力的随机模式之间进行甄别的能力;

? 线性或关联传递函数 – 在输入数据范围内医疗器械软件提供的输出行为。

? 分析灵敏度 – 医疗器械软件的输出受到输入数据影响的程度(例如,影响输入数据的参数可能包括摄动、图像分辨率、照明、数据空间分布、数据量等)。

5.0 医疗器械软件临床评价的一般原则和环境

如下图2所示,在最高和最简单的抽象层级上,医疗器械软件可以被描述为利用对输入数据(数字化内容)进行操作的算法(逻辑、规则集或模型)来产生医疗器械软件制造商所定义的输出(供医疗用途使用的信息)的软件。

图2: 高层级医疗器械软件组件

医疗器械软件所带来的风险和效益在很大程度上与医疗器械软件的输出不准确(或不正确)、从而影响患者的临床管理的风险有关;而不是医疗器械软件与患者之间直接接触产生的风险。正如医疗器械软件风险框架所述,许多要素都会影响医疗器械软件的输出信息的重要性。一般来说,这些要素可以归入下面的两大因素,这两大因素可以充分地描述医疗器械软件的预期用途:

A. 医疗器械软件所提供的信息对于医疗决策的意义;

B. 病症或病情状态。

当在制造商的预期用途描述中包括这些因素时,可以使用它们来对医疗器械软件进行分类。SaMD N12 第6.0节为医疗器械软件定义声明提供了一种结构化方法来描述预期用途。SaMD N12 第7.0节为基于该定义声明中所确定的主要因素对医疗器械软件进行分类提供了一种方法。(关于SaMD分类,见第8.3节)

在有限的情况下 – 医疗器械软件可能具有接受用户输入或进行“治疗”的功能,利用通用计算机外围设备传递声音、光、画面上的图片或在某些情况下传递低能量振动 – 这种医疗器械软件可以被认为是为患者提供治疗(例如,用于认知行为治疗的医疗器械软件)。

这些类别包括输出对于患者护理而言日益重要的功能。

该范围医疗器械软件的说明性实例包括:

医疗器械软件设计作为放射治疗规划系统,在可能威胁生命并需要重大治疗干预的危急情况下帮助治疗(SaMD N12类别III.ii)。

医疗器械软件使用个人数据预测产生卒中或心脏疾病的风险评分,以创建预防或干预策略(SaMD N12类别II.iii)。

医疗器械软件分析图像、眼球运动或其他信息,以指导进行下一步散光诊断动作。这种医疗器械软件通过提供数据汇总来提供临床信息,不会引发立即或近期的行动来治疗即使不能治愈也可以有效管控的患者病情,而且其干预通常是非侵入性的(SaMD N12类别I.i)。

影响医疗器械软件安全性、有效性和性能的其他因素包括下列考量:

? 在整个产品的设计、开发和安装过程中鉴识有关医疗器械软件的安全性、有效性和性能的效应/影响和适当措施时, 会技术环境考虑因素(SaMD N12 第9.1节)。

○ 应用程序的可用性 – 如何将医疗器械软件集成到现实世界的临床工作流程中。

○ 输入、输出和方法对于用户而言的透明度

? 技术和系统环境考虑因素(SaMD N12 第9.2节)。

? 与安全考虑有关的信息安全 (SaMD N12 第9.3节)。

? 治理结构(SaMD N23 第6.0节)应该支持创建和建立合适的流程,这对于保持质量目标和政策相当重要[1];

? 不管组织使用何种特定的软件产品开发路径或方法,须在整个医疗器械软件生命周期中考虑属于常见的流程和活动的不同医疗器械软件生命周期支持流程的要素(SaMD N23第7.0节)。这些流程(包括产品规划;风险管理:以患者安全为中心的方法;文件和记录控制;配置管理和控制;过程和产品的测量、分析和改进;管理外包的过程和产品)将在整个医疗器械软件的实现和使用过程中运用;

? 在软件工程生命周期方法(过程、活动、任务等)中常见的对于有效的医疗器械软件质量管理体系相当重要的实现和使用流程的要素(SaMD N23第8.0节)包括:需求管理,设计,开发,验证和确认,部署,维护,停用(退役或 废活动)。

正确应用时,质量管理体系必须有足够的严谨性产生有关下列项的证据:

? 管理用于开发和更改医疗器械软件的短期开发周期的独特性(SaMD N23第8.6节)。

? 对分销渠道的控制(SaMD N23第8.5节)。

[1]这些过程、政策和目标应该根据组织的需求、类型、规模和性质进行定制。

? 控制设计/规格变更,控制版本,监视安装基数,管理召回和远程更新(SaMD N23第8.5节)。

? 质量 – 可用性(包括用户界面),符合规格,“适合使用”,合理地避免可能的严重缺陷影响,并制定计划来检测和纠正缺陷,以确保医疗器械软件继续符合预期的安全性、有效性和性能。

? 经过客观验证和确认,以证明符合客户要求。

? 在使用中通过及时维护和持续改进来管理质量。

5.1 临床评价原则

? 可获得的临床证据的级别和证据可信度;

? 用于导出输出信息的临床模型的复杂性;

? 输出信息的已知特异性;

? 软件的临床基础的成熟度和输出可信度;

? 输出信息相对于当前护理标准的效益;

? 可行性(SaMD N23第7.1节);

? 用户和患者需求/预期用途(SaMD N23第8.3节);

? 产品与临床最终用户期望相符的临床证据(SaMD N23第8.4节)。

医疗器械软件临床评价包括收集和评估医疗器械软件的科学有效性、分析有效性和(从患者获得的)临床(现实世界)性能。这些活动的结果一起构成医疗器械软件的临床评价证据。

医疗器械软件所必需的临床评价证据的范围将取决于多种参数,包括但不限于基础算法、算法的透明度以及用户检测错误输出的能力、受试者人口和疾病状态(预期用途目标人口)的变异性程度以及医疗器械软件的预期用户。医疗器械软件的临床评价将是反复持续迭代的。

尽管不打算强加不必要的负担,在探讨与使用医疗器械软件相关的患者风险时,临床证据须支持制造商声明的医疗器械软件的预期用途。医疗器械软件的预期用途定义了医疗目的,并确定了临床评价的类型和深度。这种意图陈述是考虑必要的证据级别和选择执行适当的临床评价的最重要的起点。

? 临床评价范围取决于医疗器械软件制造商定义的“预期用途”。

○ 医疗器械软件的预期用途取决于产品权利要求。该产品权利要求以及医疗器械软件定义声明决定了所需的临床证据级别。制造商定义的性能、功能和特性须与权利要求一致。

○ 医疗器械软件在市场上销售时,权利要求应反映医疗器械软件的实际性能和功能(现实世界性能)。

6.0 医疗器械软件临床评价方法、证据和鉴定

临床评价是一个系统的有计划的过程,旨在持续不断地产生、收集、分析和评估有关医疗器械软件的临床数据,以验证按照制造商的预期用途使用时医疗器械软件的科学有效性以及分析有效性和临床性能。临床评价的必需程度和范围由医疗器械软件用于目标临床条件的作用来决定。临床评价的质量和广度确保了医疗器械软件的输出科学有效和可以可靠和可预测地使用。

虽然前瞻性(例如随机对照)试验可以满足有关现实世界性能的要求,可能没有必要开展前瞻性试验来产生患者数据。“临床评价”一词不应理解为仅限于进行前瞻性随机临床试验。

本节解释临床评价产生证据的目的,哪些技术可供医疗器械软件制造商用于产生该证据以及何时在产品生命周期中进行此类评价。

6.1 临床评价的证据目标是什么?

就医疗器械软件对于用户和最终患者的价值而言,医疗器械软件临床评价过程的结果是至关重要的。如制造商声明的预期用途中所表示,通过执行临床评价并证明以下项目来产生和验证医疗器械软件的临床评价证据:

? 科学有效性 – 用证据表明医疗器械软件输出与临床状况/生理状态之间的关联性;

? 分析有效性 –用证据表明与准确性、可靠性、可重复性和可再现性相关的技术性能;

? 临床性能 – 通常适用于诊断性医疗器械软件(见下面的框),显示证据表明医疗器械软件在病症或病情中产生与医疗器械软件输出的目标用途相关的临床上有意义的输出的能力。

分析有效性探讨器械如何有效测量其声称要测量的参数,而临床性能则讨论该测量的有用性。

对于大多数医疗器械软件而言,临床评价的目的是确定临床有效性和产生证据,利用评价方法和患者数据来了解分析的有效性和临床性能。在大多数情况下,鉴于医疗器械软件的输出对用户的决策有影响,因此临床评价通常侧重于用户按照制造商的意图使用输出的能力。在某些情况下,当医疗器械软件用于治疗病症或病情时,使用患者或者能够代表或与患者的病症或病情相关的数据来执行临床评价,以证明治疗的有效性。例如,旨在提供声音疗法以治疗、缓解或减轻(小的治疗干预能够起作用的)耳鸣效应的医疗器械软件将需要制造商提供分析有效性,以确保治疗输出符合所有适当的性能规格和限制条件。制造商还将证明有已知的科学有效性将特定的声音与预期的治疗联系起来。

一般来说,非预期用于治疗病症或病情的医疗器械软件可分为以下几类:

? 非诊断性医疗器械软件:这些医疗器械软件具有通用功能,可用于各种病症或病情。这种医疗器械软件通常提供数据来帮助诊断,帮助治疗,告知可选方案。这种医疗器械软件的实例包括计算器(放射治疗规划医疗器械软件),搜索和匹配,筛选器,用户定义的基于规则的匹配,处理信 (例如,声音信 的频谱分析),给出得分但没有解释的存储器测试等。

6.2 确定临床评价的必要水平

临床评价是在医疗器械软件整个生命周期中持续开展的一个过程。它基于在产品生命周期的上市前和上市后期间收集的有关医疗器械软件预期用途的数据。

在医疗器械软件生命周期的开发阶段,临床评价使制造商能够客观地评估和证明医疗器械软件在正常使用条件下达到其预期用途和已将与医疗器械软件相关的已知的和可预见的风险降至最低。根据其预期用途与医疗器械软件所带来的效益进行权衡时,剩余风险是可以接受的,并且有关医疗器械软件的任何安全性、有效性和性能权利要求都获得适当证据的支持。临床评价还为评估医疗器械软件的设计特性、算法和技术特征和优化临床效果并最大限度地减少任何潜在风险提供了机会。

医疗器械软件上市后,制造商和用户须定期监察与临床证据有关的信息。作为质量管理体系的一部分,制造商须通过适当的上市后计划(例如上市后监察、不良事件 告、科学出版物等),为持续发现与医疗器械软件的安全性、有效性和性能有关的临床数据制定规划,确保医疗器械软件继续达到预期的安全性、有效性和性能。

下文概述产生临床证据的步骤。

1. 确定医疗器械软件的科学有效性是否是已知的,分析有效性标准在临床上是否是可接受的和分析有效性评估是否已判定该医疗器械软件符合以下标准:

? 如果“是”:第7.2节所述的文件证据;

? 如果“否”:如第6.3节所述产生科学有效性证据

2. 产生分析有效性证据:作为医疗器械软件验证和确认活动的一部分,如第

3. 确定临床性能需求:

? 对于具有较高风险状况的诊断性医疗器械软件(参见第7.2节中医疗器械软件要求以确定需求) – 按7.2节所述进行临床性能评估。

4. 如果临床性能证据是必要的,且科学有效性未知,则在规划医疗器械软件的临床性能评价时应考虑以下问题:

? 是否有患者数据可用于进行性能评价,或者是否是支持预期权利要求所需的新患者数据?

? 如果需要新的患者数据来支持此权利要求,那么需要寻找哪种类型的临床性能证据?

? 有关方法和考虑因素,请参阅下面的第6.3.2节。

6.3 产生医疗器械软件的科学有效性证据

如果基于现有的信息,医疗器械软件的输出与临床状况/生理状态的关联性是已知的,那么没有必要产生医疗器械软件的科学有效性证据。已知关联性的一个实例是在非瓣膜性房颤患者中用于缺血性卒中危险分层的充血性心力衰竭合并高血压(CHADS-2)评分。

科学有效性证据应该源于对其价值和局限性的批判性鉴定,为确定医疗器械软件的输出和算法与临床状况/生理状态之间的关联性,应该对每一条信息进行评价,确定它的相关性和质量。[1]可以通过以下方法产生医疗器械软件的科学有效性证据:

? 进行文献搜索:

○ 回顾专家意见:这些信息可能在包括教科书、临床指导文件以及学术和专业组织的立场声明中找到;

○ 概念研究的证据产生的结果:这些研究通常是较小规模的科学研究,以确定算法与临床状况/生理状态的基本关联性;

○ 先前开展的临床研究的结果:这些研究提供了算法的信 或输出与病症或病情或生理状态的关联性

○ 客户反馈包括投诉、不良事件以及可以系统和科学地提供预期的医疗器械软件输出与病症或病情或生理状态的关联性的其它数据

■ 制造商产生的上市后监察数据(例如,客户测试结果);

■ 投诉处理数据库;

■ 临床相关软件修改的详细信息(例如,召回,客户通知,危险警 )。

? 开展科学有效性研究

○ 这些建立关联性的方法是在医疗器械软件制造商正在建立医疗器械软件输出与病症或病情或生理状态的关联性时规划、设计和有目的地进行的。这些研究通常包括旨在建立临床关联性的前瞻性研究、观察性研究、回顾性和纵向性研究。(欲了解进一步的考虑因素,见6.3.1节)

注:某些低风险的医疗器械软件是在算法和输出的科学有效性正在显现的时候开发的。一个例子是通过顺从药物疗法和开展饮食和活动教育来管理心力衰竭的软件应用程序,后续表明在充分使用它的患者中能够减少住院治疗。随着科学和医学知识的进一步发展,初步确立的科学有效性可能会发生变化和/或扩展。

6.3.1 关于旨在支持科学有效性的文献搜索的考虑因素

医疗器械软件的科学有效性初始对于制造商来说并不明显的情况下,文献检索可能是有用的。

? 通过文献检索产生的数据应该与所讨论的医疗器械软件或早期版本直接相关,并且有理由表明早期版本的数据是适用的(例如由第三方完成的临床研究的 告)。

? 当考虑文献检索数据的相关性时,医疗器械软件制造商需要考虑文献资源的质量,并评估已发表的临床研究与预期的医疗器械软件用途(例如,器械输入,预期使用者,患者人口,预期用途)之间的差异。具体来说,这些考虑应该顾及:

○ 被诊断或治疗的病症或病情的严重程度、疾病发生率和自然史;

○ 预期目标人口;

○ 预期用户

○ 可供选择的诊断测试的可用性和当前的护理标准。

? 文献中引用的科学有效性证据使制造商能够确定医疗器械软件的临床性能的可接受性。

欲了解与文献搜索相关的更多详情,参见GHTF SG5/N7“科学有效性判定和性能评价”第7.2.2节“文献”和GHTF SG5/N2“临床评价”第6.1节“通过文献搜索产生的数据”

6.3.2 关于科学有效性研究的考虑因素

本节适用于由制造商或其代表依照适用的法规专为符合性评估目的开展的科学有效性研究。这些研究通常必须按照当地法规和指南进行设计、实施和 告。

科学有效性研究是由制造商或代表制造商专为证明医疗器械软件的安全性、有效性和性能而开展的研究。很少或没有相关文献或临床经验的医疗器械软件可能需要观察性研究来验证医疗器械软件算法的有效性并证明适用于目标患者群体。观察性研究在研究期间获得的测试结果不用于患者管理并且不影响治疗决策。这些研究的设计需要尽可能减少偏见和混淆,并以风险为基础。这些研究的设计类型包括:

? 横断面研究:在单一时间点建立测试结果与临床状况的相关性。在某些情况下,在初始时点进行测试,但在较晚的时点对患者进行评估(例如,运用医疗器械软件评估未来状态的可能性,或者在测试时不存在适用于确定临床状态的方法);

? 纵向研究:涉及随着时间的推移使用相同的医疗器械软件进行多次患者测量以验证医疗器械软件的临床性能;

? 回顾性研究:患者的病情和医疗器械软件输出的临床关联性是已知的;

? 多临床医师多病例回顾性研究:多名临床医师评估每个病例,这样能够考虑到临床医师可变性;

? 前瞻性研究:在研究期间对医疗器械软件进行测试。如果使用医疗器械软件来确定患者的未来状况,研究通常基于前瞻性设计;

? 前瞻性/回顾性研究:临床状况是已知的,但在研究期间已经建立医疗器械软件输出的临床关联性。鉴于前瞻性/回顾性研究将使用先前生成的测试数据,因此制造商应确保隔离数据,以保证不会因其它测试结果产生混淆或偏见。

欲了解与这些研究有关的更多详情,参见GHTF SG5/N7“科学有效性判定和性能评价”第7.2.1节“临床性能研究”,GHTF SG5/N8“关于体外诊断医疗器械的临床性能研究”。

注:作为软件开发周期验证和确认活动完成的测试(焦点群体客户反馈,外部分析有效性研究和调查研究)不被视为临床性能研究。

6.4 产生医疗器械软件的分析有效性证据

医疗器械软件的分析有效性证据是在制造商的质量管理体系过程的验证和确认活动期间产生的,对于医疗器械软件而言,总是要求分析有效性证据。

欲了解更多详情,请参阅 SaMD N23。

为确定有关医疗器械软件准确性的分析有效性的验证和确认活动应考虑以下一项或多项因素:

? 在文献中存在的公认标准(例如,具有已知的有效性和可靠性并且通常被认为是可供新的测试或结果和方案进行对比的任何已知的最佳临床评估、方法、规程、干预或测量)或当前的护理标准(例如,用于特定血糖水平的胰岛素剂量)中所述的算法;

? 与参考标准的比较(如计算机辅助诊断中检测病灶性肺病的参考标准);

? 与参考物质的比较(例如特定国际标准化比率(INR)的Coumadin[1]剂量);

? 与具有类似的输出与临床状况关联性的其他器械或医疗器械软件的比较。

对于在验证和确认活动中使用参考数据库来证明分析有效性,应进行鉴定。另外,医疗器械软件算法开发过程中使用的训练数据集应当与用于生成分析有效性的数据集保持分开和独立。

在不容易使用上述方法的情况下,可以与已经可用的医疗器械软件进行比较或者与公认的方法进行比较。

在没有可以使用的比较方法的情况下,可以使用不同的方法,例如与成文的方法进行比较,或者与组合参考方法进行比较。如果使用组合参考,则必须保证重新调整该组合的任何部分时参考保持准确。

[1] Coumadin是在预防血栓形成和血栓栓塞中通常使用的抗凝血剂。

6.5 产生医疗器械软件的临床性能证据

除了分析有效性证据之外,还应使用规划、设计、执行、分析和评估的过程和活动来产生临床性能证据,以便最佳地代表预期用途所指的目标人口。这种评价的最佳设计、执行和分析将确保结果的最大普适性(例如,适用于不同的人口或族群,不同医疗保健和地理环境中的多个地点)。

在继续验证相关医疗器械软件的临床性能之前,制造商应考虑:

是否发布了不为制造商拥有并可能帮助制造商确定医疗器械软件的临床性能可接受性的临床性能数据?

是否有可用的性能数据类型是在执行临床性能研究之外的现实世界使用条件下产生的?

对于类似的医疗器械软件输出与临床病情的关联性,是否有现有的医疗器械软件或器械已证明临床性能?

[1] Abràmoff, M. D., Garvin, M. K., & Sonka, M. (2010).

Retinal Imaging and Image Analysis(视 膜成像和图像分析).

选择有关临床性能的信息时,应该对其进行评估以确定其对于解决有关医疗器械软件的问题的相关性和质量以及对于证明医疗器械软件的临床性能(包括有关性能的任何特定权利要求)的贡献。

? 所提供的信息须具有足够的质量,使得能够对医疗器械软件的临床性能进行合理和客观的评估;

? 须对不同的数据集进行审查,以确定多个研究结果的一致性,并酌情评估医疗器械软件的预期目标人口;

? 如果不同的数据集 告了可比较的性能特征,那么关于临床性能的确定性增加。如果在不同的数据集中观察到不同的结果,那么确定造成这种差异的原因会有帮助。不管怎样,所有与医疗器械软件相关的数据集都应包括在内;

? 与给患者带来的效益进行权衡时,与医疗器械的使用相关的任何风险是可以接受的。

对于科学有效性未知的新型医疗器械软件,通过进行临床性能研究来产生临床性能证据可能是重要的(欲了解详情,参见第?节)。临床性能研究并不一定意味着“前瞻性随机对照试验”。相反,根据医疗器械软件的风险状况而定,可以通过下面的途径来收集数据(参见第7.2节):开展“观察性研究”(该观察性研究通常与现有医疗器械软件的使用并行进行),为患者医护管理进行常规诊断检测,在使用医疗器械时被动地收集数据,或者通常的患者护理。然而,对于意在诊断或治疗病症或病情的医疗器械软件而言,如果不准确的结果有高的患者风险(见第8.1节),那么该研究必须管理相关的风险并消除任何偏见或其他混淆假设。

以下部分重点介绍当前GHTF指南中可以通过考虑医疗器械软件的独特特性来实施的不同要素。鼓励读者依赖GHTF指南中的原则和要求。

6.6 临床评价证据的鉴定

医疗器械软件制造商和医疗器械软件的使用者应能通过临床评价得出以下结论:医疗器械软件适用于其预期用途;医疗器械软件达到其预期用途的预期性能;医疗器械软件的安全性、有效性和性能得到充分的证据支持[1];与预期效益权衡时[2],医疗器械软件的风险[3]是可接受的。该鉴定应当考虑到:

[1] 欲了解关于安全概念的更多信息,请参阅“GHTF SG1 /N68医疗器械的基本安全性和性能原则”有关软件的第5节、第6节和第7节。须指出的医疗器械软件的安全评估可能不仅需要对医疗器械软件进行临床评价。

[2] 欲了解关于安全和效益/风险概念的更多信息,请参阅“GHTF SG1 /N68医疗器械的基本安全性和性能原则”有关软件的第6节。

[3] 医疗器械软件风险包括干预或不必要干预的风险,或由于医疗器械软件输出不准确或不正确而未能干预的后果。

? 将医疗器械软件预期用途与临床评价证据匹配;

? 医疗器械软件的效益和风险;包括:

? 在使用医疗器械软件时客观考虑患者的偏好;

? 与当前的疾病或病症护理标准相比的效益。

鉴定证据的目的是根据其优点和局限性来选择信息,以证明临床评价证据符合医疗器械软件的预期用途和相关权利要求。

应对每一条信息进行评估,以确定其相关性和质量。若要是相关的,信息应显示医疗器械软件的输出与“医疗器械软件定义声明”中所述的预期用途之间的明确联系,即它与医疗器械软件所预期的医疗决策和病症或病情的关系。所提供的信息应具有足够的质量,以便能够对临床评价证据与医疗器械软件的预期用途相符的确定性进行合理和客观的评估。要求医疗器械软件制造商(以及第三方酌情)鉴定临床评价所产生的证据。

具体而言,对临床评价产生的证据进行鉴定应该涉及到所有医疗器械软件要素的相关性和质量,包括:

? 医疗器械软件定义声明;

? 风险评估和相关文件;

? 标签,包括权利要求、警告、限制、禁忌等;

? 质量管理体系中的医疗器械软件要求;

? 验证和确认

6.6.1 将临床评价证据与医疗器械软件的预期用途及相关权利要求进行匹配

当临床评价证据不适于医疗器械软件的预期用途和权利要求时,可能需要修改预期用途和权利要求,以减轻或防止不正确的结果给患者造成损害的风险和使用户信赖医疗器械软件。在临床有效性和有关医疗器械软件预期用途的任何限制方面,应当通过在医疗器械软件的标签中向用户提供适当的禁忌、预防措施和警告,给用户提供足够的透明度。

如果用于生成临床性能证据的数据集具有有限的可用性或者未涵盖所期望的算法或输出范围,那么作为标签的一部分,应当向用户和患者透露性能的局限性。另外,改变原有的预期用途声明和权利要求来匹配实际的性能也被认为是适当的。例如,旨在诊断患有某种疾病的患者的一种新型医疗器械软件发现关于分析有效性指标(准确性,检测限,精确度等)的可接受性的证据是有限的。为使用户信赖医疗器械软件的输出和尽可能减少医疗器械软件的不当结果给患者造成的风险,需要以透明的方式清楚地表明这些实际的性能。

如第7.2节所述,在确认医疗器械软件权利要求的有效性所需的临床性能证据类型方面存在灵活性。

6.6.2 效益/风险判定

效益/风险的判定应纳入科学有效性、分析有效性和临床性能评估产生的证据和知识,还应考虑患者的偏好和与医疗器械软件所治疗的病症或病情相关的护理标准的替代方法。风险承受能力因患者不同而不同,并影响个体患者的决策和接受医疗器械软件的风险以换取效益的意愿。评估应侧重于相关的事实、不确定性和主要判断领域。

医疗器械软件通常只会引起与基于医疗器械软件所提供的输出作出的决策有关的风险。在医疗器械软件提供假阳性输出的情况下,可能发生不必要的测试或手术,这会导致相关的手术风险,其中最严重的风险可能包括患者的病症或病情恶化,需要进行手术干预和死亡。如果出现假阴性,则存在不能诊断并正确治疗重大的病症或病情的风险,并可能伴有上述相同的不良事件。

医疗器械软件的可能效益也是基于医疗器械软件所提供的输出。这些效益包括与其他可用的护理方法相比,检测病症或病情的灵敏度和特异性增强。效益/风险评估应确定和评估在预期的使用人口中假阳性和假阴性的可能性,并在可能的情况下将它们与所评估的病情的已知灵敏度和特异性标准进行比较。

应鉴别可用于实现医疗器械软件的预期用途的其他方法。证据的结果应该表明医疗器械软件与其他现有技术相比性能出色。效益/风险的判断应考虑到结果不能推广到比所研究的人口更广泛的人口的影响。鉴于医疗器械软件的非侵入性,患者可能愿意接受与医疗器械软件相关的风险。

总之,现有的信息须支持医疗器械软件结果的定量和定性分析适用于预期用途,并证明可能的效益超过了医疗器械软件可能带来的风险。

7.0 根据SaMD类别确定的证据等级

7.1 SaMD类别

SaMD N12描述了基于在“医疗器械软件定义声明”中所确定的因素对医疗器械软件进行分类的一种方法。如下表和第8.3节所示,类别的判断综合了医疗器械软件所提供的信息对于医疗决策的意义以及医疗器械软件所提供的信息对于病症或病情的影响。

7.2 根据SaMD类别,临床证据和预期的重要性

如前所述,产生临床评价证据的目的是证明适当的分析有效性以及临床有效性;证据级别应以风险为基础。

酌情使用以下因素来确定临床评价证据的级别:

? 医疗器械软件[1] – 类别I和类别II医疗器械软件与类别III和IV中的较高风险医疗器械软件相比,被认为具有较低的风险,后者包括为治疗危急和严重的病症或病情提供诊断或建议的医疗器

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年1月22日
下一篇 2021年1月22日

相关推荐