软件作为医疗器械(SaMD)该如何进行临床评估?(上)
“ 这虽然是个难点,但是这值得研究!”
众所周知,软件已经成为医疗器械产品开发的一个日益重要的领域。快速的技术进步导致了软件功能和接受度的巨大变化,导致越来越多的新型医疗设备能够告知、驱动或取代临床选择,或直接提供治疗。因此世界各地的监管机构希望,软件作为医疗设备(SaMD)的临床证据以与其风险和影响相称的科学严格程度必须匹配,从而并提供安全、有效性和性能的保证。随着人工智能(AI)和机器学习(ML)在医疗保健领域潜在用途的范围和规模的提高,与上市前临床评估相关的新问题变得明显。全球监管机构致力于制定强有力的监管框架和统一的医疗人工智能风险分类和评估行业标准,在平衡创新的同时防范潜在风险。
01—背景介绍与大体原则
医疗软件应用程序的进步与自动化任务和最小化人工干预以提高效率、降低成本和防止错误的持续趋势相一致,因此软件在医疗决策中的作用越来越大,同时也需要对可用性问题、自动化偏差、缺乏操作透明度或仅仅是错误的输出所产生的潜在风险保持警惕,这些风险可能导致灾难性的后果。例如,当一个皮肤和痣检测应用程序(app)错误地告诉用户检测到的黑色素瘤是无害的,这可能会导致治疗的延迟。因此,无论是为更精确的诊断和有针对性的治疗开发新的医疗软件,还是为关心自己健康的个人监测应用程序,制造商都有责任向当局证明其产品的安全性、质量和有效性。通过对使用过程中产生的临床数据进行关键评估,对临床安全性和性能进行评估,以及对产品的总体效益–风险概况进行评估,是作为医疗设备(SaMD)的软件制造商的关键要求之一,因此也是监管机构关注的重点领域。
在软件作为医疗器械进行临床评估的过程中,许多误解是由不同利益相关者对术语和临床评估的法律要求的不同解释引起的。软件开发人员经常根据产品在临床环境中的预期用途进行验证。虽然在商业发布之前对预期性能的演示是临床评估的中心,但在监管环境中,这一概念指的是一个更广泛的概念,即在医疗设备的整个生命周期中进行的系统和持续过程。临床评价要求已被载入各个国家和地区的医疗器械法律。国际医疗器械监管机构论坛(IMDRF)内部的国家监管机构之间的自愿合作最终形成了临床评估指南的发布(以及涉及临床调查和临床证据的密切相关文件),IMDRF谨慎地避免将其建议与任何国家法规绑定,并为所有参与生成、编纂、以及审查足以支持医疗器械销售的临床证据。
临床评估首先在设备的开发过程中执行,以确定为监管目的需要生成的数据,并将确定是否需要一个或多个临床调查,并将其进展记录在临床开发计划(CDP)中。许多关键参数,如研究设计、目标和终点,将基于非临床数据评估过程中确定的证据差距和伴随的最新文献综述。随着医疗器械在使用过程中获得新的安全性、临床性能或有效性信息,定期重复临床评价。临床资料往往是通过对有关装置的临床研究而产生的。数据也可以从科学文献或上市后监测,特别是从上市后临床随访(PMCF)中检索。这个过程是分不同阶段进行的(如下图),结果记录在临床评估计划(CEP)和临床评估报告(CER)中。输出被输入正在进行的风险管理过程,并可能导致制造商的风险评估、临床调查文件、使用说明和上市后活动的更改。
所有医疗设备都需要临床评估,无论其风险分类如何。然而,在确定充分支持预期医疗目的和(个人)临床声明所需数据的类型和数量时,除其他因素外,还应考虑与软件应用程序相关的风险。制造商必须证明所提供的临床证据水平,并证明该设备已在预期的临床环境中进行了适当的测试,任何声明都有证据支持,并且根据目前的技术水平,出现的收益–风险比是明确和可接受的。后者是在全面和客观的文献综述中定义的,是临床评估过程中不可分割的一部分。
02—SaMD医疗器械软件制造商临床评价的具体指引
SaMD的临床评估与传统医疗器械的临床评估基于相同的法律要求。然而,大多数SaMD产品是非常不同的——它们可以在广泛的技术平台上使用,不与患者直接接触,并且经常根据它们提供的信息而不是对患者的任何直接操作来完成它们的角色。鉴于SaMD超越传统医疗设备或硬件的独特特征,监管机构认识到有必要集中在SaMD临床评估的通用方法上,以促进安全创新和保护患者安全。另一个专门的IMDRF指南考虑了这些区别,并将临床评估与更广泛的软件生命周期管理工作紧密联系起来该指南被公认为SaMD临床评估的最先进方法,已被美国食品和药物管理局(FDA)9采用,并在欧盟(EU)内部进行了微小的修改,以反映欧洲监管机构的具体期望。
制造商或开发人员进行临床评估的范围取决于以下因素:
- SaMD的底层算法
- 算法的透明程度
- SaMD的预期用途的特征
- 部署它的平台
- 目标人群
- 面向的用户
在进行临床评价之前,制造商应根据需要从临床角度解决的相关安全和性能要求,以及医疗预期目的和预期临床效益,确定其范围。这被称为临床评估的范围或计划阶段。其结果将决定支持IMDRF指南中定义的证据目标的数据类型和数量,例如有效临床关联的证明(也称为科学有效性),分析或技术有效性,以及SaMD的有效临床表现(如下图)。
有效的临床关联是指基于输入和选择的算法,软件输出与设备预期目的中定义的疾病或生理状态之间的关联。这种关联对于在现实世界中展示SaMD对预期医疗保健状况的临床意义是至关重要的。产生此类证据的必要性取决于SaMD与临床疾病或状态之间的联系是否已经众所周知,即是否得到现有科学框架或证据体的支持。如果是这种情况,可以从临床指南、科学(同行评议)文献、共识声明、国际参考资料或产品标准等来源提供证据。例如:
- 在eGFR计算器应用程序中,使用床边施瓦茨公式计算估计的肾小球滤过率(eGFR),以测量儿科患者的肾功能水平
- 在医学图像处理软件中实现一种放大特征的线性插值算法
- 当给服用地高辛的患者开奎尼丁时,由临床信息系统中的自动临床决策支持(CDS)触发药物–药物相互作用警报
- 应用公认的实践参数,以确保支持乳腺癌筛查的软件的最高图像质量
如果不能通过引用相关临床或技术指南中的循证策略来证明有效的临床关联,制造商必须通过重新利用现有数据或启动新的临床调查,来证明将软件输入、输出、算法或知识库与预期的医疗保健情况联系起来的假设的科学有效性。
分析或技术性能验证是指软件每次都能以相同的方式正确处理数据的能力。制造商应提供健全软件开发过程的“客观证据”,包括验证支持SaMD预期用途的有效数据处理软件设计。这种类型的验证还需要确认软件应用程序的安全性、性能和有效性,并受到可用性、完整性、准确性和数据机密性等方面的保护。在实践中,医疗器械软件验证和验证要求作为IEC 62304和IEC 82304-1软件开发标准的一部分,可以反馈到临床评估中。在临床评估过程中发现的差距将需要生成新的证据,例如,证明与现实生活数据集的可泛化性,或将可用性评估扩展到忽略的用户组。
临床性能验证旨在证明SaMD应用程序的“临床意义”性能。这一概念涉及到SaMD提供预期临床效益的能力。对于某些应用,可能需要测量SaMD对个体的影响,例如,通过计算机辅助导航降低全膝关节置换术后的翻修风险和改善活动能力。对于其他软件,其好处可能在于提供准确的医疗信息,与其他诊断选项和技术获得的医疗信息进行评估,而患者的最终临床结果取决于可用的进一步诊断或治疗选项,例如,一个应用程序可以发送心电图率、行走速度、心率、经过距离、并将基于运动的心脏康复患者定位到服务器上,由医生进行监控。在这种情况下,该设备产生临床相关输出的能力与其准确可靠的技术性能有关。在每种情况下,制造商必须证明该设备已在正确的临床环境中进行了测试。尽管如此,该方法仍将依赖于设备的预期用途、临床声明和相关风险,从IEC 62366 – 1的角度来看,至少需要产品可用性评估的证据,以确保消除与使用相关的危险和可用性问题为了建立科学的有效性或验证临床表现,临床调查的成本和时间负担可能会非常高,这可能成为公司开发新算法的主要障碍。因此,商业化策略可能需要分阶段的方法,并仔细权衡具体的临床声明和支持它们所需的数据。