引言
sift1M是一个近似最近邻搜索(ANNS)的数据集,它可用于评估ANNS的性能。它包含3个向量子集,分别为:
- 基矢量:执行搜索的矢量
- 查询向量
- 学习向量:查找特定方法中涉及的参数
此外,它以预先计算的k个最近邻居及其平方欧式距离的形式为每个集合提供真值。
每个向量取 $ 4+d\times 4B$ ,其中 $ d$ 是维数,$B$ 是字节,具体如下:
域值 | 域值类型 | 描述 |
---|---|---|
d | int | 向量维度 |
d*4B | float | 向量分量 |
C++读取.fvecs
格式数据
1 |
|
参考文献
[1]付聪, NSG : Navigating Spread-out Graph For Approximate Nearest Neighbor Search, https://github.com/ZJULearning/nsg, 2019.8.12.