国产gaysexchina男同gay,japanrcep老熟妇乱子伦视频,吃奶呻吟打开双腿做受动态图,成人色网站,国产av一区二区三区最新精品

Solr分析器、標(biāo)記器和過濾器

2018-11-13 16:22 更新
以下各部分描述了 Solr 如何分解和處理文本數(shù)據(jù)。有三個(gè)主要的概念要理解:分析器、標(biāo)記器和過濾器。
  • 字段分析器在接收期間、文檔被索引時(shí)以及在查詢時(shí)使用。分析器檢查字段的文本并生成標(biāo)記流。分析器可能是一個(gè)單獨(dú)的類,或者它們可能由一系列的標(biāo)記器和過濾器類組成。
  • 標(biāo)記器將字段數(shù)據(jù)分解為詞法單位或標(biāo)記。
  • 過濾器檢查標(biāo)記流并保留它們、轉(zhuǎn)換或丟棄它們,或者創(chuàng)建新的標(biāo)記。標(biāo)記器和過濾器可以組合起來形成管道或鏈,其中一個(gè)的輸出被輸入到下一個(gè)。這樣的標(biāo)記器和過濾器序列稱為分析器,分析器的輸出結(jié)果用于匹配查詢結(jié)果或生成索引。

使用分析器,標(biāo)記器和過濾器

雖然分析過程同時(shí)用于索引和查詢,但不需要對兩個(gè)操作使用相同的分析過程。對于索引,你通常想簡化或規(guī)范化單詞。例如,將所有字母設(shè)置為小寫,消除標(biāo)點(diǎn)符號和重音符號,將單詞映射到其詞干等等。這樣做會(huì)增加回憶,因?yàn)槔纾骸皉am”、“Ram” 和 “RAM” 都將匹配 “ram” 的查詢。為了提高查詢時(shí)間精度,可以使用過濾器來縮小匹配范圍,例如,如果您對雄性綿羊感興趣,而不是隨機(jī)存取內(nèi)存,則忽略全部縮寫詞。

分析過程輸出的令牌定義了該字段的值或術(shù)語,并用于在添加新文檔時(shí)建立這些術(shù)語的索引,或者用于標(biāo)識哪些文檔包含您要查詢的術(shù)語。

了解更多信息

這些部分將向您展示如何配置字段分析器,并且還將作為配置每個(gè)可用標(biāo)記器和過濾器類的詳細(xì)信息的參考。它還可以作為指導(dǎo),以便您可以配置您自己的分析類,如果您有特殊的需求,而這些需求無法用所包含的過濾器或標(biāo)記器來滿足。

對于分析儀,請參閱:

  • 分析器:有關(guān) Solr 分析器的詳細(xì)概念信息。
  • 運(yùn)行您的分析器:關(guān)于測試和運(yùn)行您的 Solr 分析器的詳細(xì)信息。

對于 Tokenizers,請參閱:

  • 關(guān)于 Tokenizers:關(guān)于 Solr 標(biāo)記器的詳細(xì)概念信息。
  • 標(biāo)志符:關(guān)于配置標(biāo)志轉(zhuǎn)換器的信息,以及關(guān)于此分發(fā)的 Solr 中包含的標(biāo)志器工廠類的信息。

對于過濾器,請參閱:

  • 關(guān)于過濾器:有關(guān) Solr 過濾器的詳細(xì)概念信息。
  • 過濾器描述:有關(guān)配置過濾器的信息,以及有關(guān) Solr 發(fā)行版中包含的過濾器工廠類的信息。
  • CharFilterFactories:有關(guān)用于預(yù)處理輸入字符的過濾器的信息。

要了解如何使用各種語言的 Tokenizers 和 Filters,請參閱:

  • 語言分析:關(guān)于用于字符集轉(zhuǎn)換或用于特定語言的標(biāo)記器和過濾器的信息。
以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號