Solr用語集

これらはSolrで使用される一般的な用語です。

Solr用語

可能な場合、用語は詳細な情報のためにSolrリファレンスガイドの関連部分にリンクされています。

文字にジャンプ

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

A

アトミック更新

ドキュメント全体を再インデックス作成する代わりに、ドキュメントの1つ以上のフィールドのみを更新するアプローチ。

B

ブール演算子

これらは、AND、OR、NOTなどの演算子を使用して、クエリでのキーワードの包含または除外を制御します。

C

クラスタ

Solrでは、クラスタはZooKeeperを介して相互に連携して動作し、ユニットとして管理されるSolrノードのセットです。クラスタには多くのコレクションが含まれる場合があります。SolrCloudも参照してください。

コレクション

Solrでは、単一の構成とスキーマを使用して、単一の論理インデックスにグループ化された1つ以上のドキュメント

SolrCloudでは、コレクションは複数の論理シャードに分割され、それらは多くのノードに分散される可能性があります。

シングルノードインストールおよびユーザー管理クラスタは、代わりにコアの概念を使用します。「コレクション」はSolrCloudコンテキストで最も頻繁に使用されますが、「論理インデックス」を表すため、この用語はユーザー管理クラスタの個々のコアを参照するためにも使用できます。

コミット

ドキュメントの変更をインデックスで永続的にすること。追加されたドキュメントの場合、コミット後に検索可能になります。

コア

個々のSolrインスタンス(論理インデックスを表します)。複数のコアを単一のノードで実行できます。SolrCloudも参照してください。

コアの再ロード

スキーマファイル、solrconfig.xml、またはその他の構成ファイルへの変更後、Solrコアを再初期化すること。

D

分散検索

分散検索とは、クエリが複数のシャードにまたがって処理される検索のことです。

ドキュメント

フィールドとその値のグループ。ドキュメントは、コレクションの基本データ単位です。ドキュメントは、標準ハッシュを使用して、またはドキュメントID内で特定のシャードを割り当てることによって、シャードに割り当てられます。ドキュメントは、各書き込み操作後にバージョン管理されます。

E

アンサンブル

ZooKeeper の用語で、フォールトトレランスのために、複数の ZooKeeper インスタンスが同時に連携して動作していることを示します。

F

ファセット

インデックスされた用語に基づいて検索結果をカテゴリに分類すること。

フィールド

Solr による処理方法を定義するメタデータとともに、インデックス/検索されるコンテンツ。

I

逆文書頻度 (IDF)

用語の一般的な重要度の尺度。コレクション内の特定の単語が出現するドキュメント数で、ドキュメントの総数を割った値として計算されます。TF-IDFベースのスコアリングと、特にLuceneのスコアリングの詳細については、http://en.wikipedia.org/wiki/Tf-idf および Lucene TFIDFSimilarity javadocs を参照してください。 用語頻度も参照してください。

転置インデックス

単語とその単語を含むドキュメントをリスト化する検索可能なインデックスを作成する方法。これは、単語とその単語が見つかるページをリスト化する本の巻末にある索引に似ています。キーワード検索を実行する場合、この方法は、ドキュメントのリストと各ドキュメントで使用されるすべての単語をペアにする代替方法よりも効率的であると考えられています。ユーザーはドキュメントに存在すると予想される用語を使用して検索するため、ドキュメントの前に用語を見つけることで処理リソースと時間を節約できます。

L

リーダー

シャードの単一のレプリカで、同じシャード内の他のレプリカへのインデックス更新(ドキュメントの追加または削除)の調整を担当します。これは、選挙によってノードに割り当てられる一時的な責任であり、現在のシャードリーダーがダウンした場合、新しいノードが自動的に選出されてその役割を引き継ぎます。SolrCloudも参照してください。

M

メタデータ

文字通り、データに関するデータ。メタデータは、ドキュメントのタイトル、作成者、場所など、ドキュメントに関する情報です。

N

自然言語クエリ

「アスピリンとは何ですか?」のように、ユーザーが通常話したり書いたりするように入力される検索。

ノード

Solrを実行しているJVMインスタンス。Solrサーバーとも呼ばれます。

O

楽観的同時実行制御

「楽観的ロック」とも呼ばれ、ロックやバージョン管理を維持しながら、現在インデックスにあるドキュメントの更新を可能にするアプローチです。

監督者

SolrCloud内の単一のノードで、クラスター全体に関わるアクションの処理と調整を担当します。既存のノード、コレクション、シャード、レプリカの状態を追跡し、新しいレプリカをノードに割り当てます。これは、選挙によってノードに割り当てられる一時的な責任であり、現在の監督者がダウンした場合、新しいノードが自動的に選出されてその役割を引き継ぎます。SolrCloudも参照してください。

Q

クエリパーサー

クエリパーサーは、ユーザーが入力した用語を処理します。

R

リコール

検索エンジンがユーザーのクエリに可能なすべての一致を取得する能力。

関連性

ユーザーが行った検索に対するドキュメントの適切さ。

レプリカ

SolrCloudコレクション内のシャードの物理的なコピーとして機能するコア

レプリケーション

リーダーインデックスを1つのサーバーから1つ以上の「フォロワー」または「子」サーバーにコピーする方法。

RequestHandler

検索結果を返す、ドキュメントをインデックス化する、または他のカスタム状況を処理するかどうかにかかわらず、受信した「リクエスト」をSolrがどのように処理するかを指示するロジックと構成パラメーター。

S

SearchComponent

クエリリクエストを処理するためにリクエストハンドラーが使用するロジックと構成パラメーター。検索コンポーネントの例には、ファセット、ハイライト、「これに似たもの」機能が含まれます。

シャード

SolrCloudでは、単一のコレクションの論理パーティション。すべてのシャードは、少なくとも1つの物理的なレプリカで構成されますが、フォールトトレランスのために複数のノードに分散された複数のレプリカが存在する可能性があります。SolrCloudも参照してください。

SolrCloud

スケーラビリティ、フォールトトレランス、高可用性のために、Solrノードクラスターを管理できるSolrの機能スイートの総称。

Solrスキーマ (managed-schema.xml または schema.xml)

Solrインデックススキーマは、インデックス化するフィールドとフィールドの型(テキスト、整数など)を定義します。デフォルトでは、スキーマデータはSchema APIを使用して実行時に「管理」でき、通常はSolrが必要に応じて変更するmanaged-schema.xmlという名前のファイルに保存されますが、コレクションは静的スキーマを使用するように構成できます。静的スキーマは、人間が編集した構成ファイル(通常はschema.xmlという名前)から起動時にのみロードされます。詳細については、スキーマファクトリ構成を参照してください。

SolrConfig (solrconfig.xml)

Apache Solr構成ファイル。インデックスオプション、RequestHandler、ハイライト、スペルチェック、およびその他のさまざまな構成を定義します。ファイルsolrconfig.xmlは、Solrホームのconfディレクトリにあります。

スペルチェック

スペルミスが原因で結果がほとんどまたはゼロになるのを防ぐために、検索用語の代替スペルをユーザーに提案する機能。

ストップワード

一般に、ユーザーの検索にはほとんど意味がなく、自然言語クエリの一部として入力された可能性のある単語。ストップワードは、一般的に非常に小さな代名詞、接続詞、前置詞(「the」、「with」、「and」など)です。

サジェスター

ユーザーが入力するときに、可能性のあるクエリ用語を提案する機能を提供するSolrの機能。

同義語

同義語は一般に意味が近く、互いに代用できる用語です。検索エンジンの実装では、同義語は、単語だけでなく、略語や、一貫してハイフンで区切られていない用語である場合があります。このコンテキストにおける同義語の例としては、「Inc.」と「Incorporated」や「iPod」と「i-pod」などがあります。

T

用語頻度

特定のドキュメントで単語が出現する回数。http://en.wikipedia.org/wiki/Tf-idf および Lucene TFIDFSimilarity javadocs を参照して、TF-IDFベースのスコアリングと、特にLuceneのスコアリングに関する詳細情報を参照してください。逆ドキュメント頻度(IDF)も参照してください。

トランザクションログ

レプリカによって維持される書き込み操作の追記のみのログ。このログはSolrCloudの実装で必要であり、Solrによって自動的に作成および管理されます。

W

ワイルドカード

ワイルドカードを使用すると、スペルや時制の可能なバリエーションを考慮して、単語の1つ以上の文字を置き換えることができます。

Z

ZooKeeper

Apache ZooKeeperとしても知られています。SolrCloudがクラスターの構成ファイルとノード名を追跡するために使用するシステム。ZooKeeperクラスターは、クラスターの中央構成ストア、分散同期を必要とする操作のコーディネーター、およびクラスタートポロジの記録システムとして使用されます。SolrCloudも参照してください。