第壹小說 > 腦回路清奇的主角們 > 幻數據壓縮算法猜想1
  =數據壓縮算法=速記算法=

  遞增素數之間,可以使用加法,得出相對小的數,可以用乘法,得出相對大的數,可以用乘方號,得出很大很大的數。

  當使用特定長度把一個大數據分割成N個小片段時,就可以進行統計,比如全體相加,然后除以總數得到全局平均數。

  然后使用1KB的平均數,1MB的平均數,1GB的平均數作為比大小基準。

  然后還有特定數(比如出現了一次以上的多次數)(比如只出現了一次的一次數)(比如出現的最大值)(比如出現的最小值)。

  現在的問題就是,統計能夠獲得數據的被過濾掉了很多信息的被壓縮后的數據,如何使用統計獲得的數據,來逆推原始數據(包括各種統計的先后順序)(當然,因為數據的缺失,導致必須使用試錯方式來實現)。

  在處理大數據時,如何減少解壓縮時試錯次數,就是大數據壓縮專用算法的重難點。

  [示例]

  如果有一個二進制數1010010010011100110001000100010,統計出其二進制的1總共有12個,二進制的0總共有19個;轉換為八進制為12223461042,統計出其八進制的0總共出現了1次,八進制的1出現了2次,八進制的2出現了4次,八進制的3出現了1次,八進制的4出現了2次,八進制的6出現了1次;轉換為十進制為1380868642,統計出其十進制的0出現了1次,十進制的1出現了1次,十進制的2出現了1次,十進制的3出現了1次,十進制的4出現了1次,十進制的6出現了2次,十進制的8出現了3次(當然了,為了加速碰撞,一般都是使用素數進制的方式,而不是使用這種方式,作者用這種方式示例,只是為了方便使用微軟自帶的程序員計算器換算進制,從而進行統計),那么接下來,就需要通過進制碰撞的方式,來逆推根據統計得出的原始數據。

  當然了,也可以使用MD4,MD5和其他的哈希值生成算法,用于快速生成哈希值,以及記錄上大小,然后是二進制的0和1,然后是八進制,16進制(一般都采取2的正整數次方進制的方式,來加速快速壓縮時的速度,換算更快)。

  另外還有一種快速碰撞的方式,使用大于X的(Y+1次方),小于X的Y次方的方式。

  第一次比大小范圍:

  示例:取X=16;Y=18;

  16^19=75,557,863,725,914,323,419,136

  16^18=4,722,366,482,869,645,213,696

  第二次比大小范圍:

  示例:取X=15;Y=7;

  15^8=2,562,890,625

  15^7=170,859,375

  當然了,因為作者并沒有使用16^19-16^18,然后再把結果進行開15次方,然后再進行篩查,可能就會導致第二次和第一次的相關度不高。

  一個二進制數據根據位數,可以表達多少數值?

  1位二進制,有兩種可能,1和0。

  2位二進制,有四種可能,00,01,10,11。

  16位二進制,有2的16次方種可能,然而一個數據本身使用這么多位是一種浪費。

  也就是說,一個16位二進制所表達的數,是一個固定數,是大于或等于0,小于2的16次方+1。

  就比如說,一個1ZB大小的數據,只要其本身是固定的,那么就注定大于或等于0,然后小于2的多少次方來著???+1。

  表達固定的數,并不一定需要使用到很長的長度。

  比如2的987654321次方,可以是一個很大的數,其換算成二進制,會占用多大的存儲空間?然后是不是可以逆推為算術內容:2的987654321次方?

  問題就是,并非所有的數,都是規律數,都可以使用A的B次方+C乘以D+E階乘方式正好等于該數,也就導致往往只能采取使用比大小的方式,無限近似,大于某個最接近該數的小數,小于某個最接近該數的大數。

  比如說,想要記錄一個5,那么在只能使用素數的表達方式時,就可以記錄為該數大于3,小于7。

  使用大于和小于之后,就可以獲得一個數據范圍,該范圍內可能包含有有數的可能性,接下來的方法,就是把這個可能性減少,比如說(3+7)/5=2,則表示這個數正好處于大于和小于的中間值,比如說(3+7)/4=2.5,則表示這個數正好大于大于和小于的中間值;以此類推;

  設定一個數為未知數B,A大于B小于C。

  那么就可以取近似值(A+B)/C=D

  一般情況下,D都是帶有小數的,那么把D的小數去掉,那么D的整數部分就可以作為第二輪的最小值,D+1就可以作為第二輪的最大值。

  取(A+B)/C=區間值1(也就是C更靠近A,還是更靠近B)。

  (A-B)/(B-C)=區間值2

  (A+C)/B=區間值3

  (B+C)/A=區間值4

  還有一種固定數大于小于法,就是A+→B←+C}總長度為多少位,特定數大于某個可以用循環速記法記錄的數,小于某個可以用循環速記法記錄的數。

  然后就是使用特定算法生成一個數,該數大于B,然后使用特定刷房生成一個數,該數小于B。

  示例:3*7=21;4*5=20;3*7大于B小于4*5;那么就可以獲得該數百分之八十的近似值,然后再使用不斷精準的繼續用比大小法接近的方式,獲得。

  比如26

  第一次比大小:4大于圓周率大于3

  第二次比大小:小于圓周率小于

  第三次比大小:2小于圓周率小于3

  比大小之后,就是使用一個算術,來生成更接近的比大小精準度。

  比如第一次比大小,大和小之間相差2的16次方,第二次比大小,大和小之間相差2的14次方,第三次比大小,大和小之間相差2的12次方,以此類推,就能快速還原出原始數據。



網頁版章節內容慢,請下載好閱小說app閱讀最新內容

請退出轉碼頁面,請下載好閱小說app 閱讀最新章節。