来源:中国中医基础医学杂志,年1月第20卷第1期
摘要:多元统计分析方法、数据挖掘及其他方法在中医证候分类研究中的应用情况,分别对聚类分析、因子分析、主成分分析、判别分析和logistic回归分析、贝叶斯网络分析、信息熵及隐结构模型等方法的特点及在证候研究中的应用情况进行概述。认为在中医证候分类研究中应根据研究目的综合考虑各种方法的优缺点,发挥各自的优势,取长补短或联合应用以提升研究质量。
关键词:证候分类;多元统计分析;数据挖掘;综述
证候分类是中医证候研究中的重要方面,在中医临床诊断和治疗中具有指导性作用。证候分类也是中医临床个体化诊疗的体现,是中医临床疗效评价的基础。中医证候分类是在明确疾病诊断的基础上,收集所有中医证候表型信息,明确中医证候表型信息之间的关联,利用这些关联信息对疾病进行证候分类。但中医证候是一个非线性、多维多阶的复杂巨系统,用传统的线性方法进行证候分类研究很难得到一致性、规范性的结果,因此在证候分类研究中逐步引入数理统计学、信息科学、系统科学及现代医学等多种研究方法来处理具有多重共线性、非线性、模糊性和非正态分布的中医证候数据变量,从而进行疾病的证候分类。本文对目前证候分类常用研究方法的特点及其应用情况进行简要概述。
01
多元统计分析方法
1.1聚类分析
聚类分析聚类分析(ClusteringAnalysis)又称集群分析,是将随机现象归类的一种数理统计方法。聚类是指在不能明确如何分类的前提之下,试图借助数理统计的方法,用已收集到的资料找出研究对象的适当归类。按照分类的目的,可分为指标聚类和样品聚类。指标聚类又称R型聚类,可以将具有共线性关系的证候变量经聚类分析后归到一类,达到对证候降维的目的,消除共线性对进一步回归分析结果的影响。样品聚类又称为Q型聚类,按照样品间的相似程度将整体分成多个类,找同类人群间的共同规律。聚类的主要指标有相关系数和距离。
聚类分析是中医证候分类研究中应用较多的方法。王阶等收集25l例经冠状动脉造影证实的稳定型心绞痛患者的四诊信息,运用聚类分析方法进行证候分类和证候要素组合规律研究,将25个常见症状聚成4类,分别为心气亏虚、脾气虚弱、气阴两虚、痰瘀互阻证。曹洪欣等对例病毒性心肌炎临床病例进行聚类分析,得出病毒性心肌炎常见证型有邪毒侵心、大气下陷、痰阻心络、心脾两虚、气阴两虚、心血瘀阻、阴虚火旺及阴阳两虚证的结论。邹演梅等收集符合纳入标准的冠心病心绞痛患者证候信息,并对其进行聚类分析。研究认为,心病心绞痛的证候聚类分为气虚血瘀证、痰浊内阻证、阴虚痰瘀证、气滞痰热证、寒凝血瘀证、气阴两虚证几类比较合理。邢雁伟等例冠心病心绞痛的69个症状进行聚类分析,将69个症状共聚成6类,经专家辨证为心肾阴阳俱虚、气虚血瘀、肝气郁结、脾气虚弱、痰瘀互阻和气虚证。张月等记录例肺癌患者的临床资料,并进行变量指标聚类分析,发现肺癌患者证候可分为痰浊阻肺、气虚、肝郁化火和瘀血阻络证4类。其他应用聚类分析方法进行证候分类的研究有很多,在此不一一赘述。
聚类分析方法的特点就是不要求预先分类,减少了预先分类的主观性对结果的不良影响。聚类分析的局限性包括结果具有不确定性,无法根据数据内部特点自主地确定分为几类;存在聚类的单分配问题,变量一旦被聚到某一类时就不能再被聚到其他类,中医认为1个症状可以由许多病因引起,见于不同的证候;聚类结果的好坏没有评价的客观标准。
1.2主成分分析
主成分分析(principal北京最好白癜风医院咨询辽宁治疗白癜风医院