文本相似度量方法(2): LCS 和编辑距离

ZMonster at 
文本相似度量方法(2): LCS 和编辑距离的配图
目录最长公共子序列问题定义求解方法数学表示与相似度量编辑距离所谓编辑距离求解方法从编辑距离到相似度量一点看法《文本相似度量方法(1): 概览》 一文的后续,着重讲述最长公共子序列(Longest Common Subsequence, LCS)和编辑距离的原理和实现。最长公共子序列问题定义 C 中每一个元素都对应 A 和 B 中一个元素从 C 中挑选两个元素 \(C_{i}\) 和 \(C_{j}\) ,其中 \(i\) 和 \(j\) 表示这两个元素在 C 中的序号(从左至右),假设这两个元素分别对应 \(A_{m}\) 和 \(A_{n}\) ,那么有 \((j - i)\cdot(n -……