在spaCy中,可以使用similarity
方法来计算两个文本之间的相似度(文本距离)。以下是一个示例代码:
import spacy # 加载预训练的模型 nlp = spacy.load("en_core_web_sm") # 创建两个文本 text1 = "apple" text2 = "banana" # 处理文本 doc1 = nlp(text1) doc2 = nlp(text2) # 计算文本相似度 similarity = doc1.similarity(doc2) print(similarity)
在上面的示例中,我们加载了英文的预训练模型en_core_web_sm
,然后创建了两个文本text1
和text2
,并将它们分别处理为spaCy文档对象doc1
和doc2
。最后,我们使用similarity
方法计算了这两个文本之间的相似度,并打印输出结果。
请注意,文本相似度的值范围在0到1之间,值越接近1表示文本越相似。