你的位置:首页 > 信息动态 > 新闻中心
信息动态
联系我们

Elasticsearch Dynamic Mapping(动态映射机制),springboot注解原理

2021/12/11 10:38:43

数字类型检测。同样如果数字类型的值在JSON中是用字符串表示的话,如果开启日期类型检测,同样在创建映射时会映射为数字类型,而不是字符串类型。

PUT my_index

{

“mappings”: {

“_doc”: {

“numeric_detection”: true

}

}

}

默认情况下,numeric_detection为false。

2、Dynamic templates

Dynamic field mappings默认情况下是根据elasticsearch支持的数据类型来推测参数值的类型,而动态模板允许您定义自定义映射规则,根据自定义的规则来推测字段值所属的类型,从而添加字段类型映射。

动态映射模板通过如下方式进行定义:

“dynamic_templates”: [ // @1

{

“my_template_name”: { // @2

… match conditions … // @3

“mapping”: { … } // @4

}

},

]

代码@1:在类型映射时通过dynamic_templates属性定义动态映射模板,其类型为数组。

代码@2:定义动态映射模板名称。

代码@3:匹配条件,其定义方式包括:match_mapping_type, match, match_pattern, unmatch, path_match, path_unmatch。

代码@4:匹配@3的字段使用的类型映射定义(映射参数为类型映射中支持的参数)

动态类型映射模板的核心关键是匹配条件与类型映射,接下来按照匹配条件定义方式来重点讲解动态类型模板映射机制。

2.1、match_mapping_type

首先使用json解析器解析字段值的类型,由于JSON不能区分long和integer,也不允许区分double和float,所以它总是选择更广泛的数据类型, 例如5,在使用字段动态映射时,elasticsearch会将字段动态映射为long而不是integer类型,那如何将数字5动态映射为integer类型呢,利用match_mapping_type可以实现上述需求,例如,如果希望将所有整数字段映射为整数而不是long,并将所有字符串字段映射为文本和关键字,可以使用以下模板:

PUT my_index

{

“mappings”: {

“_doc”: {

“dynamic_templates”: [

{

“integers”: {

“match_mapping_type”: “long”,

“mapping”: {

“type”: “integer”

}

}

},

{

“strings”: {

“match_mapping_type”: “string”,

“mapping”: {

“type”: “text”,

“fields”: {

“raw”: {

“type”: “keyword”,

“ignore_above”: 256

}

}

}

}

}

]

}

}

}

一言以蔽之,match_mapping_type为字段动态映射(字段类型检测)得出的类型建立一个映射关系,将该类型转换为mapping定义中的类型。

2.2、match and unmatch

match参数使用模式匹配字段名,而unmatch使用模式排除匹配匹配的字段。

match、unmatch示例如下:

PUT my_index

{

“mappings”: {

“_doc”: {

“dynamic_templates”: [

{

“longs_as_strings”: {

“match_mapping_type”: “string”, // @1

“match”: “long_*”, // @2

“unmatch”: “*_text”, // @3

“mapping”: { // @4

“type”: “long”

}

《一线大厂Java面试题解析+后端开发学习笔记+最新架构讲解视频+实战项目源码讲义》

【docs.qq.com/doc/DSmxTbFJ1cmN1R2dB】 完整内容开源分享

}

}

]

}

}

}

PUT my_index/_doc/1

{

“long_num”: “5”, // @5

“long_text”: “foo” // @6

}

代码@1:表示该自动映射模板针对的字段为JSON解析器检测字段的类型为string的新增字段。

代码@2:字段名称以long_开头的字段。

代码@3:排除字段名称以_text的字段。

代码@4:符合long_开头的字段,并且不是以_text结尾的字段,如果JSON检测为string类型的新字段,映射为long。

代码@5:long_num,映射类型为long。

代码@6:long_text虽然也满足long_开头,但是以_text结尾,故该字段不会映射为long,而是保留其JSON检测到的类型string,会映射为text字段和keyword多字段(参考字段动态映射机制)。

2.3、match_pattern

使用正则表达式来匹配字段名称。

“dynamic_templates”: [

{

“longs_as_strings”: {

“match_mapping_type”: “string”,

“match_pattern”: “regex”, // @1

“match”: “^profit_\d+$” // @2

“mapping”: {

“type”: “long”

}

}

}

]

代码@1:设置匹配模式为regex代表java正则表达式

代码@2:java正则表达式

2.4、path_match and path_unmatch

path_match与path_unmatch的工作方式与match、unmatch一样,只不过path_match是针对字段的全路径,特别是针对嵌套类型(object、nested)。

下面一个示例:将name下的字段除了middle字段为copy到name属性并列的full_name字段中。

PUT my_index

{

“mappings”: {

“_doc”: {

“dynamic_templates”: [

{

“copy_full_name”: {

“path_match”: “name.*”,

“path_unmatch”: “*.middle”,

“mapping”: {

“type”: “text”,

“copy_to”: “full_name”

}

}

}

]

}

}

}

PUT my_index/_doc/1

{

“name”: {

“first”: “Alice”,

“middle”: “Mary”,

“last”: “White”

}

}

2.5、{name} and {dynamic_type}

{name}展位符,表示字段的名称。

{dynamic_type}:JSON解析器解析到的字段类型。

PUT my_index

{

“mappings”: {

“_doc”: {

“dynamic_templates”: [

{

“named_analyzers”: { // @1

“match_mapping_type”: “string”,

“match”: “*”,

“mapping”: {

“type”: “text”,

“analyzer”: “{name}”

}

}

},

{

“no_doc_values”: { // @2

“match_mapping_type”:"*",

“mapping”: {

“type”: “{dynamic_type}”,

“doc_values”: false

}

}

}

]

}

}

}