前缀压缩词典内容分析
前缀压缩词典内容分析
包含多个固定索引,一个可变索引,
固定索引使用一个内存池和一个数组保存项目在内存中的偏移,并且使用前缀压缩,使用空间最小(每个词条4个字节的索引空间)
可变索引不压缩,并且可以动态插入词条,占用空间较大(每个词条20个字节的索引空间)
存储 1000 万个词,占用内存 100M 左右,平均每个词10个字节(包括了字符串空间和索引空间)。
接口采用 stl 容器的风格
前缀压缩词典内容分析
包含多个固定索引,一个可变索引,
固定索引使用一个内存池和一个数组保存项目在内存中的偏移,并且使用前缀压缩,使用空间最小(每个词条4个字节的索引空间)
可变索引不压缩,并且可以动态插入词条,占用空间较大(每个词条20个字节的索引空间)
存储 1000 万个词,占用内存 100M 左右,平均每个词10个字节(包括了字符串空间和索引空间)。
接口采用 stl 容器的风格