Large Language Model

释义 Definition

大型语言模型（简称 LLM），指通过海量文本数据训练而成的人工智能模型，能够理解和生成自然语言文本，执行翻译、问答、写作等多种语言任务。

发音 Pronunciation

/lɑːrdʒ ˈlæŋɡwɪdʒ ˈmɒdl/

例句 Examples

Many companies are now using large language models to improve their customer service.
许多公司现在正在使用大型语言模型来改善客户服务。

The development of large language models has raised important questions about the ethical implications of artificial intelligence, particularly regarding bias in training data and the potential for misuse.
大型语言模型的发展引发了关于人工智能伦理问题的重要讨论，特别是在训练数据中的偏见以及被滥用的可能性方面。

词源 Etymology

这是一个现代技术术语，由三个词组成：large（大型的）、language（语言）和 model（模型）。language model 这一概念最早出现于20世纪80年代的自然语言处理（NLP）领域，指能够对语言进行概率建模的系统。随着深度学习技术的发展，特别是2017年 Transformer 架构的提出，语言模型的规模急剧增长，参数量从数百万扩展到数千亿，因此加上 large 来强调其庞大的规模。该术语在2020年代初随着 GPT、PaLM、Claude 等模型的广泛应用而成为主流词汇，缩写 LLM 也被广泛使用。

文学与文化引用 Literary & Cultural References

由于"large language model"是近年来出现的技术术语，它尚未进入传统文学作品。但在以下重要著作和文献中有大量讨论：

Attention Is All You Need（2017）—— Vaswani 等人发表的论文，提出了 Transformer 架构，为大型语言模型的诞生奠定了技术基础。
On the Dangers of Stochastic Parrots（2021）—— Emily Bender 等人发表的论文，深入讨论了大型语言模型带来的社会风险与伦理问题。
Sparks of Artificial General Intelligence: Early Experiments with GPT-4（2023）—— 微软研究院发表的论文，探讨了大型语言模型是否展现出通用智能的早期迹象。