同时享受是什么生肖?
这个题目很有意思,首先定义一下什么叫“一起”或“同时”。我们假设两个事物是“一起”的,有一个时间先后,则这两个事物的状态必定在某个时间点上是相同的;如果两个事物是“同时”的,那么它们在任何时间的状态都是完全一样。 接下来引入一个概念:互信息和熵。互信息是用来度量两个随机变量间依赖程度的量化值,其定义如下(以自然语言表述为容易理解): 其中, 和 分别表示两个事件的出现概率,而 是在事件出现的情况下另一个事件也出现的概率。显然对于任意两个事件 和 ,都有 0≤I(A, B)≤1,且I(A,B)=0当且仅当A与B无关。
利用公式 I(A,C)+I(B,C)≥ 2[MI(A,B)]可以看到,如果一个事件A发生的概率很大,而另一个事件B发生的概率也很大的话,那么两者共现的概率MI(A,B)就会很高;反之,当一个事件发生概率很小的时候,不管另一个事件是否发生都会降低MI(A,B)。总之,两种事件发生得越频繁,它们的共同出现概率就越大。 最后,根据公式 H(A)+H(B)− MI(A,B)> 可以看出,当且仅当A与B独立时,MI(A,B)=0,此时H(A)+H(B)=H(A,B)。因此可以利用互信息来计算两个事件同时发生的频率来估计它们之间的相关性。 如果用p[x]表示样本空间中事件X的所有可能取值,并且假设每个事件都发生的可能性很小,即|p[x]|都很小,那么就可以近似有 p'[x]≈ \frac{1}{n} (\sum_{i=1}^{n}{p[xi]})^{\alpha'} ,其中 n 是样本容量,α'>0是一个调节参数。利用以上公式可以计算出两个事件同时发生的概率。 当把不同的样本容量 n 进行加和问题再对不同 α' 进行求极限时,可以得到两个事件同时出现的频率 f(x,y) 。
利用上述方法,可以根据数据来估计同时性相关的概率 P_{xy} 。为了简化计算,可以先通过计算机模拟的方法生成大量没有相关性的事件样本,然后应用以上方法对 P_{xy} 进行估计。