python中nilsimsa的简单用法

nilsimsa是一种局部敏感哈希,在python中其实已经有实现了。

但是搜了搜发现并没有使用文档,但是其实GitHub仓库中有一个test.py文件,里面有一些对nilsimsa库基本功能的测试。从这里可以知道一些基本使用方法。

生成摘要

1
2
3
4
5
6
7
import nilsimsa

s="qwq"

nil_test=nilsimsa.Nilsimsa(s.encode())

out=nil_test.hexdigest()

对比摘要

compare_digests返回-127到128之间的数字,128说明相同,-127说明非常不同。

1
2
3
4
5
6
7
8
9
10
11
12
13
from nilsimsa import Nilsimsa,compare_digests

def getHash(data:str)-> str:
nil=Nilsimsa(data.encode())
return nil.hexdigest()

s1="qwq"*19+"abb"

s2="qwq"*20

print(getHash(s1)+'\n'+getHash(s2))

print(compare_digests(getHash(s1),getHash(s2)))