Inverted Index
Definition / 定义
(信息检索/搜索引擎中的)倒排索引:一种数据结构,把词项(term)映射到包含该词项的文档列表(postings list),常用于快速全文检索。除检索领域外,“inverted”也可指“倒置的/反向的”。
Pronunciation / 发音
/ɪnˈvɜːrtɪd ˈɪndeks/
Examples / 例句
The search engine builds an inverted index to find documents quickly.
搜索引擎会建立倒排索引来快速找到相关文档。
To support fast phrase queries, the inverted index stores positions of each term in every document.
为了支持快速的短语查询,倒排索引会存储每个词项在各文档中的出现位置。
Etymology / 词源
Index 源自拉丁语 index,意为“指示者、目录”。Inverted 来自拉丁语词根 *invert-*(“翻转、颠倒”)。在信息检索中称“倒排”,是因为它与“正排索引”(按文档列出其包含的词)方向相反:倒排索引按“词 → 文档”组织信息。
Related Words / 相关词
Literary Works / 文学作品
- Introduction to Information Retrieval(Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze):系统讲解倒排索引与检索模型的经典教材。
- Modern Information Retrieval(Ricardo Baeza-Yates, Berthier Ribeiro-Neto):多处讨论倒排索引、查询处理与效率优化。
- Information Retrieval: Implementing and Evaluating Search Engines(Stefan Büttcher, Charles L. A. Clarke, Gordon V. Cormack):以工程实现视角介绍倒排索引与索引构建。