Skip to content

Latest commit

 

History

History
78 lines (68 loc) · 2.13 KB

6.6.1-lowercase-uppercase.md

File metadata and controls

78 lines (68 loc) · 2.13 KB
description
이 문서의 허가되지 않은 무단 복제나 배포 및 출판을 금지합니다. 본 문서의 내용 및 도표 등을 인용하고자 하는 경우 출처를 명시하고 김종민([email protected])에게 사용 내용을 알려주시기 바랍니다.

6.6.1 Lowercase, Uppercase

영어나 유럽어 기반의 텍스트는 대소문자가 있어 검색할 때는 대소문자에 상관 없이검색이 가능하도록 처리 해 주어야 합니다. 보통은 텀 들을 모두 소문자로 변경하여 저장하는데 이 역할을 하는 것이 Lowercase 토큰 필터입니다. Lowercase 토큰 필터는 거의 모든 텍스트 검색 사례에서 사용되는 토큰 필터입니다.

Uppercase 토큰 필터는 모든 텀을 대문자로 변경하는 것 이며 Lowercase 와 동일하게 설정합니다. 다음은 "Harry Potter and the Philosopher's Stone" 문장을 lowercase와 uppercase 로 분석한 예제입니다.

{% tabs %} {% tab title="request" %} {% code title="lowercase 토큰 필터로 문장 분석" %}

GET _analyze
{
  "filter": [ "lowercase" ],
  "text": [ "Harry Potter and the Philosopher's Stone" ]
}

{% endcode %} {% endtab %}

{% tab title="response" %} {% code title="lowercase 토큰 필터로 문장 분석 결과" %}

{
  "tokens" : [
    {
      "token" : "harry potter and the philosopher's stone",
      "start_offset" : 0,
      "end_offset" : 40,
      "type" : "word",
      "position" : 0
    }
  ]
}

{% endcode %} {% endtab %} {% endtabs %}

{% tabs %} {% tab title="request" %} {% code title="uppercase 토큰 필터로 문장 분석" %}

GET _analyze
{
  "filter": [ "uppercase" ],
  "text": [ "Harry Potter and the Philosopher's Stone" ]
}

{% endcode %} {% endtab %}

{% tab title="response" %} {% code title="uppercase 토큰 필터로 문장 분석 결과" %}

{
  "tokens" : [
    {
      "token" : "HARRY POTTER AND THE PHILOSOPHER'S STONE",
      "start_offset" : 0,
      "end_offset" : 40,
      "type" : "word",
      "position" : 0
    }
  ]
}

{% endcode %} {% endtab %} {% endtabs %}