命名实体识别 (NER)

从文本中自动识别和分类人名、地名、组织名等命名实体的自然语言处理技术。

命名实体识别 (NER: Named Entity Recognition) 是从文本中自动识别和分类人名、地名、组织名、日期和金额等命名实体的自然语言处理技术。

NER 是信息提取、问答系统、知识图谱构建和文档摘要等众多 NLP 应用的基础技术。spaCy、Stanford NER 和基于 BERT 的模型被广泛使用。自然语言处理实践书籍介绍了实现方法。

日语 NER 中,形态分析的准确性对结果影响很大。区分人名和普通名词、处理新词和缩写仍是挑战。

在字符计数中,分析 NER 提取的命名实体的字符数分布有助于了解文本的信息密度和构成。NLP 与机器学习书籍提供了更多背景知识。