最近审了一份主题是质谱数据分析的稿子,领域是分析化学,很明显的感受就是作者但是很明显是为了用新方法而用,没有从问题出发,所以借机讨论总结下科研数据分析的思考视角。 差异

科研数据分析最基础的出发点就是寻找差异,你观察到了两组数据,这个分组是根据实验设计或人为划分的,你想了解两组数据差异。最朴素的思路就是分组聚合,例如选取出现最多的众数,排序中间位置的中位数以及平均值。但是这个思路只是简单的将一组数描述为一个数,并无法表示这组数的离散程度,也就是丢失了一部分可以进行对比的信息。如果你考虑上表示离散程度的方差,结果就成了对比两个数。这样的对比其实只是描述性的,如果你愿意且具备统计与数学功底 …