精准搜索方法(精确查找算法)
基于树: 搜索树算法(深度优先搜索/回溯算法 广度优先搜索 双向广度优先搜索), 蒙特卡洛树搜索基于hash: hash查找
其他: 枚举算法 A*算法
相似搜索方法(精确查找算法) 基于树: kd树算法基于hash: lsh算法, 百万到千万量, 如FALCONN和NMSLIB
基于矢量量化: pq算法, 亿级以上, 如Faiss
传统聚类 基于划分: kmeans 基于层次: 分解/聚合 基于统计: EM 基于密度: meanshift, dbscan高维聚类
难点: 1.距离函数难于定义 2.基于距离的聚类可能失效(如果簇间距太小) 3.维度高引入的计算复杂度基于超图:边有多点
基于子空间聚类(特征选择): clique, optics 基于降维(向量压缩): 自组织特征映射,PCA,多维缩放 联合聚类: OLAP思想