whenever

  • Home

  • Tags21

  • Categories6

  • Archives122

  • About

通过查询历史优化近邻图上的贪婪搜索|树与图联合索引|微软亚洲研究院 CCF A类会议

Posted on 2020-08-14 In 近似最近邻搜索

论文题目

Query-Driven Iterated Neighborhood Graph Search for Large Scale Indexing

相关信息

作者与单位

Jingdong Wang; Shipeng Li
Microsoft Research Asia, Beijing, P. R. China {jingdw, spli}@microsoft.com

出处与时间

ACM International Conference on Multimedia (CCF A类), 2012

作者拟解决的主要问题

近邻图搜索易陷入局部最优,而且穷尽式连续搜索易导致低搜索效率。本文就是对传统贪婪搜索进行优化。

论文主要研究内容

本文主要研究近邻图搜索过程的一些问题。

  1. 通过重启局部搜索和引入判据缓解局部最优;
  2. 利用查询和搜索历史提升搜索效率。

论文使用的方法

查询驱动迭代邻域图搜索方法。采用迭代局部搜索策略(ILS)寻找解决方案。

  1. 处理了一个关键问题——扰动,它产生新的起始点来重启局部搜索。
  2. 提出一个判据,判断局部搜索是否达到了局部最优。
  3. 利用查询和搜索历史设计一个扰动方案,从而使搜索更有效。

上述扰动方案其实就是产生新入口点的操作。

局部最优检测

通过图梯度检测。具体地,对于当前访问点$x$,它距查询$q$的距离记为$d(x,q)$,$x$的任一邻居$y$与$q$的距离$d(y,q)$,若$d(x,q)-d(y,q) \le 0$,则贪婪搜索陷入局部最优。反之,称$y$为有希望的点(promising point)。

扰动 (Perturbation)

根据先前的查询和搜索历史产生新入口点。入口点获取仍使用树,与之前不同的是,获取的过程会受到先前搜索历史和搜索结果影响。

查询驱动迭代贪婪搜索总过程

  1. kd树产生初始点;
  2. 近邻图上贪婪搜索;
  3. 扰动重启初始点;
  4. 近邻图上贪婪搜索;
  5. 重复3.和4.直至终止条件发生。

论文的创新点

本文主要解决的就是在近邻图上执行贪婪搜索时(1)入口点获取问题;(2)易陷入局部最优问题。作者采用查询驱动迭代贪婪搜索的策略同时解决这两个问题。入口点获取是采用kd树的方法,开始获取时与之前的工作一样,本文创新的地方是在图上贪婪搜索时仍会根据一些判断条件从kd树上多次获取新入口点,文章介绍了两个判断条件:(1)经过一定量的邻居扩展后仍没有获取到有希望的点(promising point);(2)从kd树中获取的点不超过一定的比例上界。

论文的结论

  1. 获取入口点时,依赖于查询的方案具有比独立于查询的方案更好的搜索性能;
  2. 通过查询和搜索历史驱动产生新的起始点,重启贪婪搜索。迭代执行这一过程多次,从而缓解了局部最优问题,取得更好的搜索性能。

我的观点或思考

  1. 近邻图的构建成本普遍比其它流派的方法高。
  2. 通过预先存储近邻图中每个顶点到它的邻居的距离,在搜索时可通过三角不等式减少距离计算。
稀罕作者
Mengzhao Wang WeChat Pay

WeChat Pay

Mengzhao Wang Alipay

Alipay

# 论文阅读 # ANNS # 近邻图
阿里巴巴淘宝拍立淘可视化搜索关键技术 | 二进制分布式近邻图:BDG
根据查询需求自适应k值构建近邻图|日本电信电话株式会社|SIGKDD CCF A类会议
  • Table of Contents
  • Overview
Mengzhao Wang

Mengzhao Wang

Try? All the way !
122 posts
6 categories
21 tags
  1. 1. 论文题目
  2. 2. 相关信息
    1. 2.1. 作者与单位
    2. 2.2. 出处与时间
  3. 3. 作者拟解决的主要问题
  4. 4. 论文主要研究内容
  5. 5. 论文使用的方法
    1. 5.1. 局部最优检测
    2. 5.2. 扰动 (Perturbation)
    3. 5.3. 查询驱动迭代贪婪搜索总过程
  6. 6. 论文的创新点
  7. 7. 论文的结论
  8. 8. 我的观点或思考
© 2021 Mengzhao Wang