SEER 数据库和 Nomogram 的原理、应用、优势和局限

嘿朋友们,我们来谈谈我最近遇到的SEER数据库和Nomogram。
这两种工具在癌症研究界非常受欢迎。
我以前尝试过,发现它非常有用。

我们先来说一下SEER数据库。
这是由美国国家癌症研究所开发的。
它覆盖了美国约3 4 .6 %的人口。
资料还是比较齐全的。
在做乳腺癌研究时,我曾经使用SEER数据来收集人口统计信息;肿瘤症状;我记得有治疗方案之类的。

使用SEER时,这主要是通过SEERSTAT软件来完成的。
这个软件操作非常简单,我没有遇到什么大问题。
但有一次我的朋友想直接下载数据文件却发现必须使用Python或R软件来转换格式。
当时他的节目基础不是很强,所以他几乎放弃了。

说到这让我想起一件事。
有一次我的朋友分析了这个程序。
他根据年龄生活,利用SEER数据来分析分期和治疗方法的效果。
结果非常有趣。
但他表示,SEER 的数据滞后。
例如,新的治疗方案出来后,数据不会更新;这有点困难。

我们来谈谈列线图。
这是患者的年龄。
level 相当于一个可视化工具,根据治疗方法预测生存率。
此前,该工具被用来分析肺癌患者的预后。
通过构建列线图,结果很直观。

曾经,一位患者使用列线图来帮助预测 5 年生存率,患者对结果感到满意。
然而,我发现这个列线图的构建相当复杂。
这需要Cox回归分析并且并不容易启动。

最后,我的朋友想结合SEER数据库和Nomogram进行研究。
于是我就讲了这个过程。
从数据提取到模型评估;这是非常困难的。
但将两者结合起来实际上可以提高研究质量。

总的来说,SEER数据库和Nomogram都是非常有用的工具,但是在使用它们的时候,你不得不担心数据质量;需要注意变量选择和外部验证。
我从来没有经历过这么多。
所以,我不敢说蠢话,但我认为这两件事在癌症研究中具有相当大的潜力。

数据库原理第二章简答题总结

超级键唯一标识一个元组。
候选键是超级键并且没有冗余属性。
主键是用户选择的候选键。

关系模式是记录类型的定义。
关系子模式是一个用户视图。
存储模式是组织文件的方式。

实体完整性主键不能为空。
参照完整性并不是指不存在的实体。
用户定义的完整性是一项业务规则。

参照完整性:外键的值等于参照关系的主键或者为空。
外键和主键可以有不同的名称。
您也可以参考相同的关系模型。

关系代数使用集合运算。
关系计算使用谓词计算。

关系代数包括并、差、积、笛卡尔积、投影、选择等五种基本运算类别。
4 种复合运算。
扩展操作包括外连接。

关系计算包括元组关系计算和域关系计算。

表达式包含约束变量。
自由变量在方程之外。

安全运营不会创造无限的关系。

优化就是提高效率。
笛卡尔积和连接是最耗时的。

优化策略:选择早期执行。
笛卡尔积和选择的组合。
通过组合多个选择来添加阴影。
缓存子表达式。
预处理相关文件。
首先,估计最优计算方法。

等价连接涉及笛卡尔积。
自然连接是等值连接的特例。