本发明涉及智能医疗技术领域,尤其涉及一种基于大数据的生物医学存储系统。
背景技术:
目前,随着我国经济持续稳定的发展和现代科技的日新月异,人们越来越多的关注自身尤其是心血管方面的健康,在满足日常工作和生活的需求之外,人们也迫切希望通过网络或者手机上网就能随时查看自身的健康信息。
对于公共卫生机构,为了进一步为心血管的预防、治疗以及研究提供参考。它们需要一个能够全面获取社区居民各方面健康信息的生物医学存储系统。
但现有的存储系统只能从医院这些单一机构获取他人输入的健康信息,获取范围狭窄,信息更新率低,难以用于医学研究。而且,该存储系统只能限于医院内部人员使用,他人无法查询使用,难以满足人们的需求。
技术实现要素:
为了克服现有技术的不足,本发明提出一种基于大数据的生物医学存储系统,能够通过采集器采集用户的心血管信息,信息更新率高,同时通过多种渠道获取用户的健康信息,信息来源广、更新快,解决了难以用于医学研究的问题,并根据用户的查询指令查询自身的信息,满足了用户的需求。
为解决上述问题,本发明采用的一个技术方案为:一种基于大数据的生物医学存储系统,所述基于大数据的生物医学存储系统包括;采集器、信息处理单元以及存储单元;
所述采集器用于采集用户的心血管信息,并将所述心血管信息反馈给所述信息处理单元;
所述信息处理单元通过互联网接收所述采集器传输的心血管信息,并根据所述用户的身份信息获取所述用户的健康信息,将所述健康信息和心血管信息存储在存储单元中,并根据用户输入的查询指令查询所述存储单元存储的健康信息和心血管信息,其中,所述信息处理单元根据所述身份信息通过互联网获取政府、医院、社区医疗中心中的至少一种机构获取所述用户的健康信息。
进一步地,所述采集器包括血压检测器、可穿戴设备中的至少一种。
进一步地,所述健康信息包括:问卷调查信息、体格检查结果、生理数据、实验室检查数据、靶器官损害数据以及基因数据中的至少一种。
进一步地,所述健康信息还包括辅助检查信息,所述辅助检查信息包括心电图、心脏彩超、颈动脉彩超以及眼底检查中的至少一种。
进一步地,所述问卷调查信息包括所述用户的基本信息以及个人病历信息。
进一步地,所述信息处理单元基于hadoop框架将所述健康信息和心血管信息存储在所述存储单元中。
进一步地,所述将所述健康信息和心血管信息存储在存储单元中的步骤具体包括:
对所述健康信息和心血管信息进行预处理和数据挖掘操作以从所述健康信息和心血管信息中提取与所述用户的心血管相关的生理数据,将所述生理数据存储在所述存储单元中。
进一步地,所述对所述健康信息和心血管信息进行预处理的步骤具体包括:
对所述健康信息和心血管信息进行抽取、清洗操作以纠正所述健康信息和心血管信息中可识别的错误。
进一步地,所述对所述健康信息和心血管信息进行预处理的步骤还包括:
在对所述健康信息和心血管信息进行预处理后,获取所述健康信息和心血管信息的类型和格式,根据所述类型和格式选择相应的数据挖掘模型,通过所述数据挖掘模型处理所述健康信息和心血管信息并获取与所述用户的心血管相关的生理数据。
进一步地,所述心血管信息包括血压、血糖、心率中的至少一种。
相比现有技术,本发明的有益效果在于:能够通过采集器采集用户的心血管信息,信息更新率高,同时通过多种渠道获取用户的健康信息,信息来源广、更新快,解决了难以用于医学研究的问题,并根据用户的查询指令查询自身的信息,满足了用户的需求。
附图说明
图1为本发明基于大数据的生物医学存储系统一实施例的结构图;
图2为本发明基于大数据的生物医学存储系统中hadoop框架一实施例的结构图;
图3为本发明基于大数据的生物医学存储系统中hadoop框架读取文件一实施例的流程图;
图4为本发明基于大数据的生物医学存储系统中hadoop框架写入文件一实施例的流程图;
图5为本发明基于大数据的生物医学存储系统中sqoop的功能一实施例的示意图;
图6为本发明基于大数据的生物医学存储系统中采用mapreduce方式处理医学影像数据一实施例的流程图;
图7为图6中数据划分一实施例的流程图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
请参阅图1-7,其中,图1为本发明基于大数据的生物医学存储系统一实施例的结构图;图2为本发明基于大数据的生物医学存储系统中hadoop框架一实施例的结构图;图3为本发明基于大数据的生物医学存储系统中hadoop框架读取文件一实施例的流程图;图4为本发明基于大数据的生物医学存储系统中hadoop框架写入文件一实施例的流程图;图5为本发明基于大数据的生物医学存储系统中sqoop的功能一实施例的示意图;图6为本发明基于大数据的生物医学存储系统中采用mapreduce方式处理医学影像数据一实施例的流程图;图7为图6中数据划分一实施例的流程图。结合附图1-7对本发明基于大数据的生物医学存储系统作详细说明。
在本实施例中,基于大数据的生物医学存储系统包括:采集器、信息处理单元以及存储单元;采集器用于采集用户的心血管信息,并将心血管信息反馈给信息处理单元;信息处理单元通过互联网接收采集器传输的心血管信息,并根据用户的身份信息获取用户的健康信息,将健康信息和心血管信息存储在存储单元中,并根据用户输入的查询指令查询存储单元存储的健康信息和心血管信息,其中,信息处理单元根据身份信息通过互联网获取政府、医院、社区医疗中心中的至少一种机构获取用户的健康信息。
在本实施例中,信息处理单元基于hadoop框架将获取的健康信息和心血管信息存储在存储单元中,并采用sqoop实现数据提供,其通过jdbc(javadatabaseconnectivity,java数据库连接)访问hive数据。且信息处理单元还提供多维实时查询服务,信息处理单元根据接收的指令将数据导出到外部查询库,基于查询库实现实时查询服务。
在本实施例中,信息处理单元采用的hadoop框架的核心组件为:hdfs(分布式文件系统)、mapruduce(分布式运算编程框架)、yarn(运算资源调度系统),其中,mapruduce是一种编程模型,用于大规模数据集(大于1tb)的并行运算,hdfs是一个分布式文件系统,有着高容错性的特点,适合那些超大数据集的应用程序,yarn是一种新的hadoop资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度。
除了上述核心组件外,hadoop还包括ambari、hive、pig、hbase、zookeeper、sqoop、flume、mahout,其中,ambari是一种基于web的工具,支持apachehadoop集群的供应、管理和监控。ambari已支持大多数hadoop组件,包括hdfs、mapreduce、hive、pig、hbase、zookeeper、sqoop和hcatalog等组件的管理。pig是一个基于hadoop的大规模数据分析平台,pig为复杂的海量数据并行计算提供了一个简单的操作和编程接口。hive是基于hadoop的一个工具,提供完整的sql查询,可以将sql语句转换为mapreduce任务进行运行。zookeeper是一个高效的,可拓展的协调系统,用于存储和协调关键共享状态;。hbase是一个开源的,基于列存储模型的分布式数据库。zookeeper是一个分布式的,开放源码的分布式应用程序协调服务,是google的chubby一个开源的实现,是hadoop和hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。sqoop是一款开源的工具,主要用于在hadoop(hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如:mysql,oracle,postgresql等)中的数据导进到hadoop的hdfs中,也可以将hdfs的数据导进到关系型数据库中。
flume是cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。mahout是apachesoftwarefoundation(asf)旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。mahout包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。此外,通过使用apachehadoop库,mahout可以有效地扩展到云中。
在本实施例中,hdfs的架构为主从架构,主节点为namenode,从节点为至少一个datanode。namenode是管理节点,存放文件元数据,主要包括:文件和数据块的映射表,数据块与数据节点的映射表。datanode是工作节点,存放的是真正的数据块。其中,namenode负责:接收用户操作请求、维护文件系统的目录结构、管理文件与block之间关系,block与datanode之间关系。datanode负责:存储文件,文件被分成block存储在磁盘上,为保证数据安全,文件会有多个副本。secondarynamenode负责:合并fsimage和edits文件来更新namenode中的metedata。
下面以hdfs读写文件的过程对hdfs架构进行说明。
读文件流程:客户端请求namenode,namenode会返回元数据,元数据内容主要包括需要读写哪些数据块,这些数据块都存放在哪些节点上。客户端收到namenode后,去这些节点读取数据块,然后将这些数据块拼接起来。
写文件流程:客户端先将文件拆分成abc...等几组数据块,然后请求namenode存储功能,namenode寻找可存放的区域并返回给客户端。客户端按照namenode返回的数据区域进行存储,先存a,存完a,系统进行流水线复制,备份其副本到其他区域上,最后发送请求给namenode,对元数据进行更新,从而保证映射表都是最新的。a的过程整个存完,客户端才会继续存储b,依次类推实现整个文件的存储。
在本实施例中,信息处理单元与存储单元可设置在云平台、服务器或虚拟服务器中。
在本实施例中,采集器包括用于医院或家庭的血压检测器、血糖检测仪、可穿戴设备中的至少一种,其中,可穿戴设备可以为智能手环、智能手表以及其他能够检测用户心血管信息的设备。
在其他实施例中,采集器采集的信息可以为血压、心率、血脂、血糖、胆固醇、心电图以及其他能够反映用户心血管健康状态的信息。
在本实施例中,采集器可以通过wifi、蓝牙以及其他无线通讯方式与互联网连接,也可以通过网线等有线方式与互联网连接。
信息处理单元根据身份信息通过互联网获取政府、医院、社区医疗中心中的至少一种机构获取用户的健康信息。
在一个具体的实施例中,信息处理单元根据用户的身份信息获取社区医疗卫生数据中心、医院的临床数据中心、互联网数据、政府相关行业、第三方机构存储的与该用户相关的历史健康信息。
其中,互联网数据包括现场和在线问卷调查、互动访谈、在线广播以及其他通过互联网获取和传播的健康信息。
在其他实施例中,信息处理单元也可以从上述机构获取并存储用户的历史健康信息,通过采集器获取用户的心血管信息后,结合该心血管信息和历史健康信息确定用户的健康状态。
在本实施例中,用户的身份信息可以为用户输入的身份证、手机号、账号、指纹以及授权指令中的至少一种。信息处理单元根据该身份信息确认得到用户的授权。
在本实施例中,健康信息包括:问卷调查信息、体格检查结果、生理数据、实验室检查数据、靶器官损害数据以及基因数据中的至少一种。
其中,问卷调查信息包括用户的基本信息以及个人病历信息,基本信息主要包括姓名、性别、年龄、地址、职业、工作环境、联系方式、身份证号、文化程度、婚姻和家庭状况等表明用户身份的信息,个人病历信息包括相关疾病病史及治疗情况、个人史及饮食生活习惯、体育锻炼、心理健康状况、家族疾病史等个人病历信息。
体格检查结果包括用户的身高、体重、腰围、颈围、臀围等身体信息以及颈动脉和心脏听诊结果、眼底检查情况中的至少一种。
生理数据包括通过可穿戴设备或其他人体检查设备采集的血压、心率、血糖、心电活动、睡眠、运动量等用户的生理数据信息。
实验室检查数据包括糖化血红蛋白、血脂、肝肾功能、血尿常规等数据。
在上述实施例中,健康信息还包括辅助检查结果,其中,辅助检查结果包括心电图、心脏彩超、颈动脉彩超等用于辅助判断用户心血管情况的检查结果。
在本实施例中,通过对用户的心电图、心脏彩超、颈动脉彩超和眼底检查,判断肾脏损害情况,从而对靶器官损害情况作出综合评价,实现靶器官损害数据的获取。
在本实施例中,基因数据包括用户身体上所有与高血压、靶器官损害和心血管事件相关的基因以及根据该基因得出的判断结果。
在本实施例中,为了便于医学研究和数据使用,获取用户的健康数据和心血管信息后,信息处理单元将健康信息和心血管信息存储在存储单元中的步骤具体包括:对健康信息和心血管信息进行预处理和数据挖掘操作以从健康信息和心血管信息中提取与用户的心血管相关的生理数据,将生理数据存储在存储单元中。
在本实施例中,对健康数据和心血管信息进行整理的步骤包括预处理以及数据挖掘。其中,预处理主要完成对已接收数据的抽取、清洗等操作以提高后续进行数据挖掘时的指令。其中,通过数据抽取将健康数据和心血管信息中复杂的数据转化为单一的或者便于处理的构型,以达到快速分析处理的目的。数据清洗是指在这些数据中发现不准确、不完整或不合理数据,并对这些数据进行修补或移除以提高数据质量的过程。而通常来说,数据清洗框架由5个步骤构成,第一就是定义错误类型,第二就是搜索并标识错误实例,第三就是改正错误,第四就是文档记录错误实例和错误类型,第五就是修改数据录入程序以减少未来的错误。
数据挖掘包括获取健康信息和心血管信息的类型和格式,根据类型和格式选择相应的数据挖掘模型,通过数据挖掘模型处理健康信息和心血管信息并获取与用户的心血管相关的生理数据。
数据挖掘用于优化从海量数据种提取隐含和潜在的有意义信息的模式,主要数据挖掘模型包括决策树模型、svm模型、ann模型、bayes模型中的任一种,通过观察分析上述挖掘方法的混淆矩阵,分别计算其训练集和测试集的预测准确率、灵敏度、特异度、roc曲线下面积,比较各种挖掘模型的性能,并根据性能比较结果选择相应挖掘模型对健康数据进行处理。
在本实施例中,对健康数据和心血管信息进行整理的内容主要包括:对复杂结构化、半结构化和非结构化大数据的管理及处理能力、异构数据融合技术、大数据挖掘模型的应用等。主要包括以下几个方面:
1、心电图、心脏彩超、颈动脉彩超等辅助与影像学图像的存储架构完善、海量缩略图生成、批量图像格式转换与特征提取、计算机辅助诊断、roi(感兴趣区域)识别与分割、高维图像特征匹配、图像融合、图像聚类分析、相关的数据挖掘和分析等;
2、血压、血糖、心率等生理数据的海量异构模型和存储、感知与接入、组织、过滤、增量处理、智能分析与决策、网络传输与压缩,着力解决大数据的可表示、可处理、可靠性及有效传输等问题;
3、血脂、生化、肝功能等实验室检查大数据获取、识别、适配、存储、组织、分析和决策操作的可视化接口、融合、去冗余和过滤、处理中心上sql-nosql计算的节能及调度优化。
在一个具体的实施例中,对于心电图、心脏彩超、颈动脉彩超等医学影像数据采用mapreduce方式进行并行处理。其中,处理流程主要分为如下4个步骤:(1)split(划分),作为本处理流程的第1步,划分是对输入文件或文件集按照一定规则切分成逻辑的小块(inputsplit)并传输给每个map(映射)操作的过程。在本步骤中输入数据为数据预处理所生成的小影像集大文件(索引和数据)。split函数通过完全读取大文件-索引来分析大文件-数据中医学影像数据的元数据,进而以预定规则对大文件-数据进行逻辑上的划分并分配给map操作。然后,recordreader函数将划分(inputsplit)读取成一条条key-vealue的记录按次序传递给map函数完成数据输入工作。输入数据划分流程图如图6所示。(2)map(映射)。这一阶段是实际执行高分辨率医学影像底层视觉特征的并行检测和描述的步骤。在1个map操作内部,将按照串行的顺序来进行底层视觉特征检测和描述处理。但是为了减少遥感影像文件的读取次数,可将多个检测器组合起来,最后通过1个描述器循环的对检测到的各类底层视觉特征进行描述。map操作输入的记录key-vealue格式为<metadata,remoteimage>,其中metadata为当前影像遥感的元数据,remoteimage为当前遥感影像的二进制数据流;map操作输出的记录key-vealue格式为<featuretype,feature>,featuretype为特征类型,如“mser”,“harrisaffine”等,feature为字符型特征描述。(3)parrtition(分区)。本操作实际上应是map处理阶段的一部分,它根据featuretype对map输出的<featuretype,feature>进行分类,为后续的reduce(归约)操作提供数据准备。在每个map操作的后面都插入1个parrtition操作,让它对本map操作生成的所有<featuretype,feature>进行分区处理,获得与底层视觉特征检测器数目相等的<featuretype,feature>分区。然后,各个map操作输出结果经parrtition操作处理后会在系统后台进行排序重组,再传递给后续的reduce操作。(4)reduce(归约)。这是mapreduce的最后操作阶段,其用于合并保存各种类型的底层视觉特征描述。按类型排序重组的<featuretype,feature>被分配到不同的reduce操作,每个reduce操作实例对应1种类型的底层视觉特征,将接收的多个同类型的底层视觉特征集合合并成1个完整的文件,即意味着reduce操作的数目、输出文件的数目与底层视觉特征检测器的数目三者是相等的。本操作的最终结果可以保存为hdfs中的文件,也可以直接保存到hbase的数据表中。
在本实施例中,整理后的健康数据和心血管信息送入信息处理单元中的健康风险和预警模型进行处理以获取用户的身体状态,根据该身体状态和心血管信息识别用户的健康状态。
在本实施例中,也可以不通过健康风险和预警模型获取用户的健康状态,可直接根据用户的健康数据中的心血管信息判断用户是否患有心血管相关的疾病以及获取用户不同健康状态下的血压范围,根据获取的信息确定用户的健康状态。
在本实施例中,根据健康信息和心血管信息确定用户的健康状态的步骤具体包括:根据健康信息判断用户的身体状态,根据身体状态和心血管信息识别用户的健康状态。
在本实施例中,根据健康信息判断用户的身体状态的步骤具体包括:根据健康信息判断用户是否为高血压人群,根据判断结果确定用户的血压判断标准。
在一个具体的实施例中,信息处理单元根据健康风险和预警模型对用户的健康信息进行处理,根据健康数据中的信息确定用户的性别、年龄、是否患有心血管疾病以及历史健康状态,根据这些信息确定用户是否为高血压人群以及用户不同健康状态下的血压范围,并判断采集器传输的心血管信息所处范围确定用户的健康状态。
在本实施例中,该健康风险和预警模型通过对用户所在社区或区域的人群健康数据进行处理得到。其中数据处理的方式与上述对用户的健康信息和心血管信息处理的方式相同,在此不做赘述。
在本实施例中,健康风险和预警模型还可以根据社区高血压人群的健康信息获取高血压人群中与高血压相关的生理特征,根据这些生理特征判断用户是否存在该生理特征,并在用户存在该生理特征时提醒用户。
在本实施例中,得到该健康风险和预警模型后,通过对该模型进行人群层面验证和通过表型组学分析,从分子机制上验证的方式判断健康风险和预警模型的准确性,并根据判断结果对模型进行修改以提高健康风险和预警模型的准确性。
其中,人群层面验证包括:选取验证人群,应用auc曲线下面积对模型诊断的准确性进行评价;计算模型净重分层改进指数与净重分层改进整合区分指数,根据该指数对其进行检验。
通过表型组学分析,从分子机制上验证包括:分别对测试人群和验证人群进行表型组学分析。表型包括每个时间点的所有生命特征数据、血液生化指标、影像检查指标、临床检测指标。基因型数据包括所有高血压、靶器官损害和心血管事件3个层次风险基因变异。将表型组学分析结果与模型的处理结果对比判断模型的准确性。
在本实施例中,健康风险和预警模型通过血压高数值数据中心获取高血压人群中与高血压相关的生理特征。
其中,血压高数值数据中心可通过对社区人群进行横断面流行病学调研获取的人群生理数据得到。其中,流行病学调研的内容包括问卷调查、体格检查生理数据采集、实验室检查等方面,从获取的人群生理数据中筛选出血压高数值人群的生理数据,根据该生理数据确定与引发高血压相关以及表明可能存在高血压的生理数据。
在一个具体的实施例中,通过选取具有广州市五个中等社区(每个社区常住人口约4-6万人)作为试点社区,进行横断面流行病学调研,从而获取与引发高血压相关以及表明可能存在高血压的生理数据。
在本实施例中,智能终端可以为手机、智能手表、智能手环、电脑以及其他能够接收和显示信息的智能设备。
在本实施例中,为了便于健康数据管理和为疾病治疗提供依据和帮助,信息处理单元通存储单元存储用户的健康状态,并实时存储采集器上传的心血管信息。
在本实施例中,信息处理单元接收输入的查询指令,根据查询指令提供用户的健康信息和健康状态。其中,该查询指令可以为用户输入的,也可以为得到用户授权的医生或其他相关人员输入的。
在本实施例中,为了实现对疾病人群的早发现、早治疗,信息处理单元确定用户的健康状态后,判断该健康状态是否满足预设条件,并在满足预设条件时向指定的医护人员发送预警信息。
在本实施例中,该预警信息可以为邮件、短信、电话的方式发送给医护人员,也可以通过微信、qq以及其他即时通讯软件发送给医护人员。
在其他实施例中,预警信息也可以发送给与用户相关的指定人员如子女、配偶、父母等,只需能够在信息处理单元根据用户的心血管信息和健康信息确定用户需要治疗时能够呼叫相关人员,以使用户得到及时的救治即可,在此不做限定。
在本实施例中,预设条件包括血压值大于预设值、指定用户的血压值超过预警值以及用户的健康状态为预设状态中的任一种。
在本实施例中,预设值、预警值以及预设状态可以为信息处理单元通过健康风险和预警模型得出用户需要进行治疗或休息的数据或范围,也可以为信息处理单元根据输入的指令得到的数值和范围。
在本实施例中,信息处理单元可以将所有存在心血管疾病的人群列为指定用户,也可以根据个人需求将特定用户作为需要实时监控的指定用户。
在本实施例中,信息处理单元接收医护人员发送的沟通指令,根据沟通指令为用户与医护人员之间提供沟通渠道,并根据所述用户的就医请求进行就医安排。
在本实施例中,信息处理单元可以根据该沟通指令通过用户的智能终端联系用户,向用户发送医护人员根据其健康状态给出的治疗方案或处理方式,实现对用户健康指导,便于用户及时了解自身状态。
在一个具体的实施例中,信息处理单元向医护人员发送预警信息,该预警信息包括用户当前的联系方式或联系地址,医护人员通过该联系方式或联系地址与用户沟通,向其提供治疗方案或护理方式。
在本实施例中,信息处理单元根据用户的就医请求联系相应医院,并帮助用户实现网上挂号,在其他实施例中,信息处理单元也可以根据用户的就医请求联系相应医生,向该医生发送就医请求。
在一个具体的实施例中,信息处理单元可通过用户的智能终端上的微信服务号向用户提供健康指导,并向用户发送保持自身健康、远离心血管疾病的文章以实现健康宣教、危险因素干预等功能。也可以通过智能终端上管理身体的app向用户反馈用户当前的健康状态,并向用户提供健康咨询、健康监测与评估、自我健康管理等服务。还可以与社区医疗机构的网站链接,向该网站反馈用户的健康状态信息以实现资源共享,并将该网站反馈的治疗信息发送给用户实现跟踪临床指导,提高社区医师诊疗技术、对危险因素干预、人群健康教育、随访技巧、临床研究等专业知识和管理水平。
有益效果:本发明的基于大数据的生物医学存储系统能够通过采集器采集用户的心血管信息,信息更新率高,同时通过多种渠道获取用户的健康信息,信息来源广、更新快,解决了难以用于医学研究的问题,并根据用户的查询指令查询自身的信息,满足了用户的需求。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的内容相对应,所以描述的比较简单,相关之处参见实施例部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、信息处理单元执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储单元(ram)、内存、只读存储单元(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
上述实施方式仅为本发明的优选实施方式,不能以此来限定本发明保护的范围,本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替换均属于本发明所要求保护的范围。
1.一种基于大数据的生物医学存储系统,其特征在于,所述系统包括:
采集器、信息处理单元以及存储单元;
所述采集器用于采集用户的心血管信息,并将所述心血管信息反馈给所述信息处理单元;
所述信息处理单元通过互联网接收所述采集器传输的心血管信息,根据所述用户的身份信息获取所述用户的健康信息,将所述健康信息和心血管信息存储在存储单元中,并根据用户输入的查询指令查询所述存储单元存储的健康信息和心血管信息,其中,所述信息处理单元根据所述身份信息通过互联网获取政府、医院、社区医疗中心中的至少一种机构获取所述用户的健康信息。
2.如权利要求1所述的基于大数据的生物医学存储系统,其特征在于,所述采集器包括血压检测器、可穿戴设备中的至少一种。
3.如权利要求1所述的基于大数据的生物医学存储系统,其特征在于,所述健康信息包括:问卷调查信息、体格检查结果、生理数据、实验室检查数据、靶器官损害数据以及基因数据中的至少一种。
4.如权利要求3所述的基于大数据的生物医学存储系统,其特征在于,所述健康信息还包括辅助检查信息,所述辅助检查信息包括心电图、心脏彩超、颈动脉彩超以及眼底检查中的至少一种。
5.如权利要求3所述的基于大数据的生物医学存储系统,其特征在于,所述问卷调查信息包括所述用户的基本信息以及个人病历信息。
6.如权利要求1所述的基于大数据的生物医学存储系统,其特征在于,所述信息处理单元基于hadoop框架将所述健康信息和心血管信息存储在所述存储单元中。
7.如权利要求1所述的基于大数据的生物医学存储系统,其特征在于,所述将所述健康信息和心血管信息存储在存储单元中的步骤具体包括:
对所述健康信息和心血管信息进行预处理和数据挖掘操作以从所述健康信息和心血管信息中提取与所述用户的心血管相关的生理数据,将所述生理数据存储在所述存储单元中。
8.如权利要求7所述的基于大数据的生物医学存储系统,其特征在于,所述对所述健康信息和心血管信息进行预处理的步骤具体包括:
对所述健康信息和心血管信息进行抽取、清洗操作以提高数据挖掘的质量。
9.如权利要求8所述的基于大数据的生物医学存储系统,其特征在于,所述对所述健康信息和心血管信息进行数据挖掘的步骤还包括:
在对所述健康信息和心血管信息进行预处理后,获取所述健康信息和心血管信息的类型和格式,根据所述类型和格式选择相应的数据挖掘模型,通过所述数据挖掘模型处理所述健康信息和心血管信息并获取与所述用户的心血管相关的生理数据。
10.如权利要求1所述的基于大数据的生物医学存储系统,其特征在于,所述心血管信息包括血压、血糖、心率中的至少一种。
技术总结