幻数据压缩算法猜想(1 / 2)

 数压缩法记法

递增素数之间,可以使用加法,得出相对小的数,可以用乘法,得出相对大的数,可以用乘方号,得出很大很大的数。

当使用定长度把一个大数分割成n个小片时,就可以进行统计,比如全体相加,然后除以总数得到全局平均数。

然后使用1kb的平均数,1b的平均数,1gb的平均数作为比大小准。

然后还有定数(比如出现了一次以上的多次数)(比如只出现了一次的一次数)(比如出现的最大值)(比如出现的最小值)。

现在的问题就是,统计能够获得数的过滤掉了很多息的压缩后的数,如何使用统计获得的数,来逆推原始数(包括各种统计的后顺序)(当然,因为数的缺失,导致必使用试错方式来实现)。

在处理大数时,如何减少解压缩时试错次数,就是大数压缩专用法的重难点。

示

如果有一个二进制数1010010010011100110001000100010,统计出其二进制的1总有12个,二进制的0总有19个;转换为八进制为12223461042,统计出其八进制的0总出现了1次,八进制的1出现了2次,八进制的2出现了4次,八进制的3出现了1次,八进制的4出现了2次,八进制的6出现了1次;转换为十进制为1380868642,统计出其十进制的0出现了1次,十进制的1出现了1次,十进制的2出现了1次,十进制的3出现了1次,十进制的4出现了1次,十进制的6出现了2次,十进制的8出现了3次(当然了,为了加碰撞,一般都是使用素数进制的方式,而不是使用这种方式,作者用这种方式示,只是为了方便使用微软自带的程序员计换进制,从而进行统计),那么下来,就要通过进制碰撞的方式,来逆推统计得出的原始数。

当然了,也可以使用d4,d5和其他的哈希值生成法,用于快生成哈希值,以记录上大小,然后是二进制的0和1,然后是八进制,16进制(一般都2的正数次方进制的方式,来加快压缩时的度,换快)。

另外还有一种快碰撞的方式,使用大于x的(y+1次方),小于x的y次方的方式。

第一次比大小范围:

示:x16;y18;

161975,557,863,725,914,323,419,136

16184,722,366,482,869,645,213,696

第二次比大小范围:

示:x15;y7;

1582,562,890,625

157170,859,375

当然了,因为作者并没有使用1619-1618,然后把结果进行开15次方,然后进行筛查,可能就会导致第二次和第一次的相关度不高。

一个二进制数位数,可以表达多少数值?

1位二进制,有两种可能,1和0。

2位二进制,有四种可能,00,01,10,11。

16位二进制,有2的16次方种可能,然而一个数本身使用这么多位是一种浪费。