国产gaysexchina男同gay,japanrcep老熟妇乱子伦视频,吃奶呻吟打开双腿做受动态图,成人色网站,国产av一区二区三区最新精品

Solr索引介紹

2018-11-16 14:12 更新

本節(jié)介紹 Solr 索引的過程:將內(nèi)容添加到 Solr 索引中,并在必要時修改該內(nèi)容或?qū)⑵鋭h除。

通過向索引添加內(nèi)容,我們可以通過 Solr 進行搜索。

Solr 索引可以接受來自許多不同來源的數(shù)據(jù),包括 XML 文件、逗號分隔值(CSV)文件、從數(shù)據(jù)庫表格中提取的數(shù)據(jù)以及常用文件格式(如 Microsoft Word 或 PDF)中的文件。

以下是將數(shù)據(jù)加載到 Solr 索引中的三種最常見的方法:

  • 使用基于 Apache Tika 構建的 Solr Cell 框架來獲取二進制文件或結(jié)構化文件,如 Office、Word、PDF 和其他專有格式。
  • 通過向任何可以生成此類請求的環(huán)境發(fā)送 HTTP 請求到 Solr 服務器來上傳 XML 文件。
  • 編寫自定義 Java 應用程序以通過 Solr 的 Java Client API(在客戶端 API 中更詳細地描述)來獲取數(shù)據(jù)。如果您正在使用提供 Java API 的應用程序(如內(nèi)容管理系統(tǒng)(CMS)),則使用 Java API 可能是最佳選擇。

不管用于提取數(shù)據(jù)的方法如何,都有一個共同的基本數(shù)據(jù)結(jié)構,用于將數(shù)據(jù)輸入到 Solr 索引中:一個包含多個字段的文檔,每個字段都有一個名稱并包含內(nèi)容,可能是空的。其中一個字段通常被指定為唯一的 ID 字段(類似于數(shù)據(jù)庫中的主鍵),盡管 Solr 并不要求使用唯一的 ID 字段。

如果在與索引關聯(lián)的架構中定義了字段名稱,那么當該內(nèi)容被標記時,與該字段相關聯(lián)的分析步驟將被應用于其內(nèi)容。如果存在與字段名稱匹配的字段,則在架構中未明確定義的字段將被忽略或映射到動態(tài)字段定義(請參閱文檔:字段和架構設計)。

有關 Solr 索引的更多信息,請參閱 Solr Wiki。

Solr 示例目錄

當使用 “-e” 選項啟動 Solr 時,該 example/ 目錄將被用作所創(chuàng)建的示例 Solr 實例的基本目錄。該目錄還包含一個 example/exampledocs/ 子目錄,其中包含各種格式的示例文檔,您可以使用這些格式對各種示例中的索引進行測試。

用于傳輸文件的 curl 實用程序

本節(jié)中的許多說明和示例都使用該 curl 實用程序通過 URL 傳輸內(nèi)容。curl 通過 HTTP,F(xiàn)TP 和許多其他協(xié)議發(fā)布和檢索數(shù)據(jù)。大多數(shù) Linux 發(fā)行版都包含一份 curl 的副本。您可以在 http://curl.haxx.se/download.html 找到適用于 Linux、Windows 和許多其他操作系統(tǒng)的 curl 下載。curl 文檔可在這里找到:http :  //curl.haxx.se/docs/manpage.html。

Tip:使用 curl 或其他命令行工具發(fā)布數(shù)據(jù)對于示例或測試來說是很好的,但是這不是在生產(chǎn)環(huán)境中實現(xiàn)最佳性能更新的推薦方法。使用 Solr Cell 或本節(jié)中介紹的其他方法可以獲得更好的性能。您可以使用 GNU wget(http://www.gnu.org/software/wget/)來代替 curl,或者使用 Perl 來管理 GETs 和 POSTS,雖然命令行選項會有所不同。
以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號