举例说明数据库在日常生活中的重要作用?

GTEx数据库应用举例:人类肝脏基因表达的相关性(4)

Gitix 数据库仍将在 2 02 3 年更新,包含更多人类样本数据。
肝脏资料特别全。
我在北京的时候就想过这个问题。
尺寸非常大,因此您需要知道如何处理它。

首先我们来说一下如何下载这些数据。
官方网站有点复杂。
我当时就一头雾水,盯着屏幕看了好久。
你应该选择一个好的版本。
我最终使用了 2 02 2 版本。
下载后是一个压缩包,相当大,大约有G大小。

打开后,找到读取数据的工具。
使用您熟悉的R语言。
代码编写完成后,读取GTEx_liv_T文件。
结构、基因ID、信号、患者编号,是的,都在那里。
这个阶段不要犯错误,否则以后会遇到麻烦。

看完了,一定要转发。
原来基因是按行排列的,但是现在如果我想看病人,基因是按列排列的,这样很方便。
点击代码并转移。
然后设置列名、基因名和行名是患者的编号。
首先删除非TPM数据,看起来很混乱。

然后选择两个基因并观察它们。
比如ACLY和SREBF1 ,我当时就重点关注这两个。
从数据框中提取这两列。
必须更改数据类型,并且必须将字符转换为数字,否则计算将不正确。

好,我们开始数数。
首先对值分布进行对数,这样看起来更好。
然后使用核心函数计算ACLY和SREEBF1 之间的相关系数。
检查 p 值以查看其是否具有统计显着性。
它一定很重要。

最后画图。
使用ggplot2 、散点图并添加线性回归线。
ACLY和PEG3 ,我称之为这两个。
你画一下图,看到是线性关系,大概就明白了。
这是相关性分析的示例。
Gitix 数据库非常适合进行此类研究。
如果你想将动物模型的研究成果转移到人类身上,你必须使用数据库来验证这一点。
否则临床上不宜使用。

数据库有了,关键是怎么用。
多尝试,多阅读文章。
医疗大数据需要人工操作。
2 02 2 年,我觉得这个很实用我想知道。
你应该学习一些 R 语言和一些统计学。

Hua+医疗大数据是一个公众号。
环顾四周,他们有例子。
一定要专业、认真。
如果您想这样做,可以联系他们。
他们可以提供帮助。

列式数据库举例