初识 Elasticsearch 中的分词器

Michael翔 at 
初识 Elasticsearch 中的分词器的配图
Analysis 与 AnalyzerAnalysis:文本分析是把全文本转换一系列单词(term/token)的过程,也叫分词 Analysis 是通过 Analyzer 来实现的可以使用 Elasticsearch 内置的分析器或者按需定制化分析器除了在数据写入时转换词条,匹配 Query 语句时也需要使用相同的分析器对查询语句进行分析 Analyzer 的组成分词器是专门处理分词的组件,Analyzer 由三部分组成:Character Filters 针对原始文本处理,例如去除 HTML 标签 Tokenier 按照规则切分为单词 Token Filter 将切分的单词进行 二次加工,……