基于多模态数据与知识驱动的糖尿病预测方法研究

糖尿病是一种以血糖异常为主要表现的慢性病。当前,机器学习等人工智能方法广泛应用于糖尿病的患病风险预测中,大部分糖尿病预测算法使用的是患者的数值型体检数据,并没有利用患者产生的其他类型NIR‐II biowindow的数据,而且单纯依赖体检数据进行糖尿病的患病风险预测并不可靠。因此,本文对糖尿病的风险预测方面进行分析与研究,提出了基于多模态数据和知识驱动的糖尿病预测方法。本文主要做了以下三个方面的工作:(1)本文提出一种基于多模态数据的糖尿病预测方法(Convolution Neural Network with Multimodal DiabetNSC125066核磁es Data,MDCNN)。现有的糖尿病预测算法主要依赖于数值型的体检数据,很难充分利用患者所产生的其他类型数据,导致预测效果达不到预期。本文利用了患者的数值型体检数据和其对自身的症状描述,将两者所包含的信息进行联合,共同用于糖尿病的预测。在糖尿病预测模型的选择中,本文对比了不同类型的深度学习模型,根据实验效果选定了基于卷积神经网络的预测模型。MDCNN结合了多模态数据和卷积神经网络模型的特点,能够充分利用患者的体检数据和症状描述,提高糖尿病预测的准确率。实验结果表明,基于多模态数据的MDCNN在准确率上优于绝大部分基于单模态数据的糖尿病预测算法,并且在数据源的选择上更加灵活。(2)本文提出了一种基于多模态数据和知识驱动的糖尿病预测方法(Prediction of Diabetes with Multimodal Data and Knowledge,PDMK)。本文使用的多模态数据中含有患者的症状描述,症状描述属于医疗短文本,存在上下文信息不足和罕见词等问题。本文在多模态数据的基础上,引入外部知识对症状描述进行语义增强。首先,通过实体链接方法在患者的症状描述中寻找相关实体,然后使用这些实体在知识库中寻找实体相关的概念知识。在对概念知识进行编码的过程中,引入注意力机制来衡量外部知识的重要性,最后将含有注意力权重的概念知识和患者的症状描述进行融合,以达https://www.selleck.cn/products/jnj-42756493-erdafitinib.html到对症状描述进行语义增强的目的。实验结果表明,外部知识和注意力机制的结合能够充分挖掘症状描述中的有效信息,尤其是在处理罕见的医疗词汇时比较有效。同时,PDMK可以进一步提高糖尿病预测的准确性,也具备一定的可解释性。(3)本文以多模态数据和知识驱动的糖尿病预测方法为算法基础,设计并实现了一个糖尿病预测系统。该系统采用模块化设计,用户可针对自己所持有的数据类型,自由组合自己的数据来获得糖尿病患病概率。系统测试结果表明,该系统具有实用性和高准确性的特点,同时也从工程角度验证了本文方法的有效性和实用性。