那位高人为我讲讲paq压缩算法?小弟英语看不太明白?谢谢了??

来源:百度知道 编辑:UC知道 时间:2024/05/27 02:55:55
Alexander Ratushnyak 发明的无损压缩算法。可以将维基百科上面摘取的100M大小的内容压缩到17M,这个压缩比很高了。
就是这个
谢谢了
文章地址
http://blog.chinaunix.net/u/16690/showart_284932.html
英文的看不明白

高人为小弟讲解一下

PAQ
从维基百科,免费的百科全书
跳转到:导航、搜索
PAQ是一系列的开源的数据压缩archivers协同发展,通过对进化上的排行榜上,几个基准测量压缩率(尽管在昂贵的速度和内存使用)。在这个系列赛的最佳压缩PAQAR得到释放Ratushnyak 4.0亚历山大,2004年7月25日,2004年7月27日(更新数据,对大多数non-text)或PASqDa Skibinski由Przemyslaw发布4.1 2005年7月1日,为大学英语课文。在压缩标准是超越的模式,以WinRK PWCM马尔科姆·泰勒在2005年1月,释放。PWCM(PAQ加权背景混合)是一种独立开发实施PAQ闭源的算法。

算法。
使用一种混合算法PAQ语境。相关背景混在压缩机PPM分为预测和一个算术编码,但不同的是,next-symbol预测计算的概率使用重结合估计从大量的模型,在不同的语境制约。不像PPM,上下文不必相邻。大多数PAQ版本next-symbol收集统计下面的脉络。

n-grams。上下文是最后的n字节的符号(如前预测在PPM)。
整词n-grams,忽视情况,以及在文本文件的角色(有用。
“稀疏的“脉络,例如,第二和第四字节前预测的象征是很有用的二进制格式(一些)。
“模拟”的情境下,由高阶位前8或16位字(用于多媒体文件)。
两个空间的背景(用于图像、表格和表格)。一排排的长度是由寻找步频重复字节的模式。
尽管中会落在字节边界,其实是一种单一的比特预测的符号。在每一个截然不同的语境中,两项良好,没有,是零,n1,比特数为1位。为了支持最近的历史,一半的数超过2被观察到的时候是相反的。举例来说,如果当前状态相关的背景是,n1)=(没有)和1 12,3观察,然后是更新到(7,4)。

算术编码一点是与空间的比例,其可能性P(1)或P(0)= 1 - P(1)。这个概率加权计算出的数的0和1。

win0i S0 =∑

win1i∑S1)


S = S0 +