UDI知识 | 人工智能医疗器械常用语总汇（2024年最全收藏版）-UDI医疗器械网

首页 > UDI > UDI知识 | 人工智能医疗器械常用语总汇（2024年最全收藏版）

UDI| UDI

发布时间：2024-04-16

摘要： 人工智能医疗器械常用术语　　人工智能 artificial intelligence（AI）：表现出与人类智能（如推理和学习）相关各种功能的功能单元的能力，以上由慧铭佳UDI整理。&nbs...

人工智能医疗器械常用术语

　　人工智能 artificial intelligence（AI）：表现出与人类智能（如推理和学习）相关各种功能的功能单元的能力，以上由慧铭佳UDI整理。

　　人工智能医疗器械 artificial intelligence medical device（AIMD）：采用AI技术实现其预期用途的医疗器械。

　　注1：如采用机器学习、模式识别、规则推理等技术实现其医疗用途的独立软件。

　　注2：如采用内嵌AI算法、AI芯片实现其医疗用途的医疗器械。

　　机器学习 machine learning：功能单元通过获取新知识或技能，或通过整理已有的知识或技能来改进其性能的过程。

　　注：也可称为自动学习。

　　深度学习 deep learning ：通过训练具有多个隐层的神经网络来获得输入输出间映射关系的机器学习方法，以上由慧铭佳UDI整理。

　　训练 training：基于机器学习算法，利用训练数据，建立或改进机器学习模型参数的过程，以上由慧铭佳UDI整理。

　　监督学习 supervised learning：一种学习策略，获得的知识的正确性通过来自外部知识源的反馈加以测试的学习策略，以上由慧铭佳UDI整理。

　　注：也可称为监督式学习。

　　无监督学习 unsupervised learning：一种学习策略，它在于观察并分析不同的实体以及确定某些子集能分组到一定的类别里，而无需在获得的知识上通过来自外部知识源的反馈，以实现任何正确性测试，以上由慧铭佳UDI整理。

　　注1：一旦形成概念，就对它给出名称，该名称就可以用于其他概念的后续学习了；

　　注2：也可称为无师（式）学习。

　　强化学习 reinforcement learning：一种学习策略，它强调从环境状态到动作映射的过程，目标是使动作从环境中获得的累积奖赏值最大。

　　集成学习 ensemble learning：通过结合多个学习器来解决问题的一种机器学习范式。

　　注：其常见形式是利用一个基学习算法从训练集产生多个基学习器，然后通过投票等机制将基学习器进行结合

以上由慧铭佳UDI整理。

　　迁移学习 transfer learning

　　利用一个学习领域A上有关学习问题T(A)的知识，改进学习领域B上相关学习问题T(B)的学习算法的性能

以上由慧铭佳UDI整理。

　　过拟合 overfitting：学习器对训练样本过度学习，导致训练样本中不具有普遍性的模式被学习器当作一般规律，降低了泛化性能；典型表现是训练集上的性能越高，测试集上的性能越低。

　　欠拟合 underfitting：学习器对训练样本学习不充分，导致训练样本中包含的重要模式没有被学习器获取，降低了泛化性能；典型表现是训练集上的性能可以继续提高，测试集上的性能同时得以提高。

　　人工智能医疗器械生存周期模型 AIMD lifecycle model：人工智能医疗器械从起始到退役的整个演进过程的框架。

　　注1：包括：需求分析，设计与开发，验证与确认，部署，运维与监控，再评价直至停运。

　　注2：在人工智能医疗器械生存周期中，某些活动可出现在不同的过程中，个别过程可重复出现。例如为了修复系统的隐错和更新系统，需要反复实施开发过程和部署过程。

　　数据 data：信息的可再解释的形式化表示，以适用于通信、解释或处理。

　　注：可以通过人工或自动手段处理数据。

　　个人敏感数据 personal sensitive data：一旦泄露、非法提供或滥用可能危害人身和财产安全，极易导致个人名誉、身心健康受到损害或歧视性待遇等的个人信息。

　　注：个人敏感信息包括身份证件号码、个人生物识别信息、银行账号、通信记录和内容、财产信息、征信信息、行踪轨迹、住宿信息、健康生理信息、交易信息、14岁以下（含）儿童的个人信息等，以上由慧铭佳UDI整理。

　　健康数据 health data：与身体或心理健康相关的个人敏感数据。

　　注：由于目前全球规定了不同的隐私合规性法律和法规。例如，在欧洲，可能需要采取的要求和参考变更为“个人数据”和“敏感数据”，在美国，健康数据可能会变更为“受保护的健康信息（PHI）”，这需要不同国家或地区的制造商进一步考虑中国当地的法律或法规。

UDI知识 | 人工智能医疗器械常用语总汇（2024年最全收藏版）(图1)

　　数据集 data set：具有一定主题，可以标识并可以被计算机化处理的数据集合。

　　训练集 training set：用于训练人工智能算法的数据集，其外部知识源可用于算法参数的计算。

　　调优集 tuning set：用于优化人工智能算法的数据集，其外部知识源可用于算法超参数的选择。

　　注：为避免与医疗器械领域所用术语“确认”进行区分，这里不使用通用人工智能领域的validation set，二者含义一致。

　　测试集 testing set：

　　用于测试人工智能算法性能的数据集，其外部知识源可用于对算法的评估。

　　参考标准 reference standard：筛查、诊断和治疗过程或基于标注过程建立的基准。

　　注：参考标准可包含疾病、生理状态或生理异常以及位置和程度等信息标签。

　　金标准 gold standard：筛查、诊断和治疗可依据的最佳参考标准。

　　数据清洗 data cleaning：检测和修正数据集合中错误数据项的预处理过程。

　　数据采集 data acquisition：数据由生成装置按照数据采集规范生成，以数字化格式存储并传输到目标系统的过程。

　　数据脱敏 data masking：通过去标识化或匿名化，实现对个人敏感信息的可靠保护。

　　数据标注 data annotation：对数据进行分析，添加外部知识的过程。

　　仲裁 arbitration：多名标注人员对同一原始数据的标注结果不一致时用于决定最终结果的过程。

　　软件质量 software quality：在规定条件下使用时，软件产品满足明确或隐含要求的能力，以上由慧铭佳UDI整理。

　　软件质量保证 software quality assurance：

　　a)为使某项目或产品遵循已建立的技术需求提供足够的置信度，而必须采取的有计划的和有系统的全部动作的模式。

　　b)设计以估算产品开发或制造过程的一组活动。

　　可靠性 reliability：在规定时间间隔内和规定条件下，系统或部件执行所要求功能的能力。

　　完整性 integrity：保护数据准确性和完备性的性质。

　　一致性 consistency：在数据集的各阶段、部分之间，一致、标准化、无矛盾的程度。

　　重复性 repeatability：由同一操作员按相同的方法、使用相同的测试或测量设施、在短时间间隔内对同一测试/测量对象进行测试/测量，所获得的独立测试/测量结果间的一致程度。

　　再现性 reproducibility：由不同的操作员按相同的方法，使用不同的测试或测量设施，对同一测试/测量对象进行观测以获得独立测试/测量结果，所获得的独立测试/测量结果间的一致程度。

　　可达性 accessibility：组成软件的各部分便于选择使用或维护的程度。

　　可得性 availability：

　　a）软件（系统或部件）在投入使用时可操作或可访问的程度或能实现其制定系统功能的概率；

　　b）系统正常工作时间和总的运行时间之比；

　　c）在运行时，某一配置项实现指定功能的能力。

　　保密性 confidentiality：数据对未授权的个人、实体或过程不可用或不泄露的特性。

　　网络安全 cybersecurity：通过采取必要措施，防范对数据、模型等攻击、侵入、干扰、破坏和非法使用以及意外事故，使设备处于稳定可靠运行的状态，以及保障数据、模型等的完整性、保密性、可得性的能力，以上由慧铭佳UDI整理。

　　安全性 safety：免除于不可接受的风险。

　　鲁棒性/稳健性：在存在无效输入或急迫的环境条件下，系统或部件其功能正确的程度。

　　泛化能力 generalizability：机器学习算法对陌生样本的适应能力。

　　可追溯性 traceability：系统对其决策过程及输出进行记录的特性。

　　公平性 fairness：系统做出不涉及喜好和偏袒决策的性质。

　　可解释性 explainability：以人能理解的方式，对系统决策因素进行说明的能力。

　　黑盒测试 black-box testing：忽略系统或部件的内部机制只集中于响应所选择的输入和执行条件产生的输出的一种测试。

　　白盒测试 glass-box testing：侧重于系统或部件内部机制的测试。类型包括分支测试、路径测试、语句测试等。

　　对抗[措施] countermeasure：为减小脆弱性而采用的行动、装置、过程、技术或其他措施。

　　对抗样本 adversarial sample：基于原始数据上添加扰动达到混淆系统判别目的新样本。

　　对抗测试 adversarial test：使用对抗性样本开展的测试，或采用不同目标样本分布的特选数据作为压力数据集进行的测试。

　　阳性样本 positive sample：由参考标准确定为带有某一种或几种特定特征的样本。

　　阴性样本 negative sample：除阳性样本以外的样本。

　　真阳性 true positive(TP)：被算法判为阳性的阳性样本。

　　假阳性 false positive(FP)：被算法判为阳性的阴性样本。

　　真阴性 true negative(TN)：被算法判为阴性的阴性样本。

　　假阴性 false negative(FN)：被算法判为阴性的阳性样本。

　　目标区域 target region：在影像评价中，根据参考标准从原始数据中划分出的若干个包含特定类别目标的最小数据子集（子集元素为像素，体素等）。

　　分割区域 segmentation region：在影像评价中，从原始数据中划分出的若干个包含特定类别目标的最小数据子集（子集元素为像素，体素等），以上由慧铭佳UDI整理。

　　病变定位 lesion localization：算法检出病变位置正确标识出参考标准确定的病变位置。

　　非病变定位 non-lesion localization：算法检出病变位置未能正确标识出参考标准确定的病变所在位置。

　　病变定位率 lesion localization rate：病变定位数量占由参考标准确定的全体病变数量的比例。

　　非病变定位率 non-lesion localization rate：非病变定位数量占全体病例数量的比例，非病变定位率可以大于1。

　　假阳性率 false positive rate：假阳性病例数量（阴性病例中包含非病变定位）占全部阴性病例数量的比例。

　　灵敏度 sensitivity

　　召回率（查全率）recall:真阳性样本占全体阳性样本的比例。

　　特异度 specificity:真阴性样本占全体阴性样本的比例。

　　漏检率 miss rate:1减去灵敏度。

　　精确度（查准率） precision

　　阳性预测值 positive prediction value：真阳性样本占被算法判为阳性样本的比例。

　　阴性预测值 negative prediction value：真阴性样本占被算法判为阴性样本的比例。

　　准确率 accuracy：算法判断正确的样本占全体样本的比例。

　　F1度量 F1-measure：召回率和精确度的调和平均数。

　　约登指数 Youden index：灵敏度与特异度之和减去1。

　　受试者操作特征曲线 receiver operating characteristics curve（ROC curve）：以假阳性率为横坐标、真阳性率为纵坐标，根据算法在不同阈值设定下对于给定的测试集得到的一系列结果绘制的曲线。

　　曲线下面积 area under curve(AUC):曲线下与坐标轴围成的积分面积。

　　自由响应受试者操作特征曲线 free-response receiver operating characteristics curve(fROC)：以非病变定位率为横坐标、病变定位率为纵坐标，根据算法在不同阈值设定下对于给定的测试集得到的一系列结果绘制的曲线。

　　候选自由受试者操作特征曲线 alternative free receiver operating characteristics curve(AFROC curve)：以假阳性率为横坐标、病变定位率为纵坐标，根据算法在不同阈值设定下对于给定的测试集得到的一系列结果绘制的曲线。

　　精确度-召回率曲线 precision-recall curve(P-R)：以召回率为横坐标、精确度为纵坐标，根据算法在不同阈值设定下对于给定的测试集得到的一系列结果绘制的曲线。

　　平均精确度 average precision(AP)：精确度-召回率曲线下与坐标轴围成的积分面积。

　　平均精确度均值 mean average precision(MAP)：在多目标检测问题上，算法对于各类目标的平均精确度的平均值。

　　交并比 intersection over union(IoU)：分割区域与目标区域的交集占分割区域与目标区域并集的比例

　　注：也可称为Jaccard系数。

　　Dice系数 Dice coefficient：分割区域与目标区域的交集占分割区域与目标区域平均值的比例。

　　中心点距离 central distance：分割区域中心与目标区域中心的距离，该指标反映两个集合的接近程度。

　　混淆矩阵 confusion matrix：一种矩阵，它按一组规则记录试探性实例的正确分类和不正确分类的个数。

　　注1：通常矩阵的列代表人工智能的分类结果，而矩阵的行代表参考标准的分类结果；

　　注2：也可称为含混矩阵。

　　Kappa系数 Kappa coefficient：一种用于评价结果一致性的指标。

　　信噪比 signal-to-noise ratio(SNR)：信号平均功率水平与噪声平均功率水平的比值。

　　峰值信噪比 peak signal-to-noise ratio：:信号最大可能功率与噪声平均功率水平的比值。

　　结构相似性 structural similarity：是一种衡量两幅图像相似度的指标。

　　余弦相似度 cosine similarity：通过测量两个向量的夹角的余弦值来度量它们之间的相似性。

　　困惑度 perplexity：度量概率分布或概率模型的预测结果与样本的契合程度，困惑度越低则契合越准确，以上由慧铭佳UDI整理。

　　字错率 word error rate：将识别出来的字需要进行修改的字数与总字数的比值。

　　交叉熵 cross-entropy：一种度量两个概率分布之间差异的指标。

　　互信息 mutual information：对两个随机变量间相互依赖性的量度。

　　服务可用性 service availability：服务客户发起服务请求后，服务可访问的时间占总服务时间的比例。

　　注：服务可用性的计算是在一系列预定义的时间段中，服务可用时间之和占预定义时间段之和的比例，可排除允许的服务不可用时间。

上一篇：UDI行业 | 人工智能医疗器械UDI的实施

下一篇：医疗器械UDI【有源植入器械】6月1日将被强制列入UDI实施名单

产品中心

品牌中心

官方公众号

联系我们


4008-699-766