Solr用語集
これらはSolrで使用される一般的な用語です。
Solr用語
可能な場合、用語は詳細な情報のためにSolrリファレンスガイドの関連部分にリンクされています。
文字にジャンプ
A
- アトミック更新
-
ドキュメント全体を再インデックス作成する代わりに、ドキュメントの1つ以上のフィールドのみを更新するアプローチ。
C
- クラスタ
-
Solrでは、クラスタはZooKeeperを介して相互に連携して動作し、ユニットとして管理されるSolrノードのセットです。クラスタには多くのコレクションが含まれる場合があります。SolrCloudも参照してください。
- コレクション
-
Solrでは、単一の構成とスキーマを使用して、単一の論理インデックスにグループ化された1つ以上のドキュメント。
SolrCloudでは、コレクションは複数の論理シャードに分割され、それらは多くのノードに分散される可能性があります。
シングルノードインストールおよびユーザー管理クラスタは、代わりにコアの概念を使用します。「コレクション」はSolrCloudコンテキストで最も頻繁に使用されますが、「論理インデックス」を表すため、この用語はユーザー管理クラスタの個々のコアを参照するためにも使用できます。
- コミット
-
ドキュメントの変更をインデックスで永続的にすること。追加されたドキュメントの場合、コミット後に検索可能になります。
- コア
-
個々のSolrインスタンス(論理インデックスを表します)。複数のコアを単一のノードで実行できます。SolrCloudも参照してください。
- コアの再ロード
-
スキーマファイル、
solrconfig.xml
、またはその他の構成ファイルへの変更後、Solrコアを再初期化すること。
E
- アンサンブル
-
ZooKeeper の用語で、フォールトトレランスのために、複数の ZooKeeper インスタンスが同時に連携して動作していることを示します。
I
- 逆文書頻度 (IDF)
-
用語の一般的な重要度の尺度。コレクション内の特定の単語が出現するドキュメント数で、ドキュメントの総数を割った値として計算されます。TF-IDFベースのスコアリングと、特にLuceneのスコアリングの詳細については、http://en.wikipedia.org/wiki/Tf-idf および Lucene TFIDFSimilarity javadocs を参照してください。 用語頻度も参照してください。
- 転置インデックス
-
単語とその単語を含むドキュメントをリスト化する検索可能なインデックスを作成する方法。これは、単語とその単語が見つかるページをリスト化する本の巻末にある索引に似ています。キーワード検索を実行する場合、この方法は、ドキュメントのリストと各ドキュメントで使用されるすべての単語をペアにする代替方法よりも効率的であると考えられています。ユーザーはドキュメントに存在すると予想される用語を使用して検索するため、ドキュメントの前に用語を見つけることで処理リソースと時間を節約できます。
S
- SearchComponent
-
クエリリクエストを処理するためにリクエストハンドラーが使用するロジックと構成パラメーター。検索コンポーネントの例には、ファセット、ハイライト、「これに似たもの」機能が含まれます。
- シャード
-
SolrCloudでは、単一のコレクションの論理パーティション。すべてのシャードは、少なくとも1つの物理的なレプリカで構成されますが、フォールトトレランスのために複数のノードに分散された複数のレプリカが存在する可能性があります。SolrCloudも参照してください。
- SolrCloud
-
スケーラビリティ、フォールトトレランス、高可用性のために、Solrノードのクラスターを管理できるSolrの機能スイートの総称。
- Solrスキーマ (managed-schema.xml または schema.xml)
-
Solrインデックススキーマは、インデックス化するフィールドとフィールドの型(テキスト、整数など)を定義します。デフォルトでは、スキーマデータはSchema APIを使用して実行時に「管理」でき、通常はSolrが必要に応じて変更する
managed-schema.xml
という名前のファイルに保存されますが、コレクションは静的スキーマを使用するように構成できます。静的スキーマは、人間が編集した構成ファイル(通常はschema.xml
という名前)から起動時にのみロードされます。詳細については、スキーマファクトリ構成を参照してください。 - SolrConfig (solrconfig.xml)
-
Apache Solr構成ファイル。インデックスオプション、RequestHandler、ハイライト、スペルチェック、およびその他のさまざまな構成を定義します。ファイル
solrconfig.xml
は、Solrホームのconf
ディレクトリにあります。 - スペルチェック
-
スペルミスが原因で結果がほとんどまたはゼロになるのを防ぐために、検索用語の代替スペルをユーザーに提案する機能。
- ストップワード
-
一般に、ユーザーの検索にはほとんど意味がなく、自然言語クエリの一部として入力された可能性のある単語。ストップワードは、一般的に非常に小さな代名詞、接続詞、前置詞(「the」、「with」、「and」など)です。
- サジェスター
-
ユーザーが入力するときに、可能性のあるクエリ用語を提案する機能を提供するSolrの機能。
- 同義語
-
同義語は一般に意味が近く、互いに代用できる用語です。検索エンジンの実装では、同義語は、単語だけでなく、略語や、一貫してハイフンで区切られていない用語である場合があります。このコンテキストにおける同義語の例としては、「Inc.」と「Incorporated」や「iPod」と「i-pod」などがあります。
T
- 用語頻度
-
特定のドキュメントで単語が出現する回数。http://en.wikipedia.org/wiki/Tf-idf および Lucene TFIDFSimilarity javadocs を参照して、TF-IDFベースのスコアリングと、特にLuceneのスコアリングに関する詳細情報を参照してください。逆ドキュメント頻度(IDF)も参照してください。
- トランザクションログ
-
各レプリカによって維持される書き込み操作の追記のみのログ。このログはSolrCloudの実装で必要であり、Solrによって自動的に作成および管理されます。
Z
- ZooKeeper
-
Apache ZooKeeperとしても知られています。SolrCloudがクラスターの構成ファイルとノード名を追跡するために使用するシステム。ZooKeeperクラスターは、クラスターの中央構成ストア、分散同期を必要とする操作のコーディネーター、およびクラスタートポロジの記録システムとして使用されます。SolrCloudも参照してください。