在spaCy中,可以使用similarity
方法来计算两个文本之间的相似度。首先,需要将文本转换成spaCy的Doc
对象,然后使用similarity
方法来计算相似度。示例如下:
import spacy # 加载spaCy模型 nlp = spacy.load("en_core_web_lg") # 将文本转换成Doc对象 doc1 = nlp("apple") doc2 = nlp("banana") # 计算文本相似度 similarity = doc1.similarity(doc2) print(similarity)
在上面的示例中,我们通过加载spaCy的en_core_web_lg
模型创建了一个spaCy的Doc
对象,并计算了两个文本"apple"和"banana"之间的相似度。similarity
方法返回一个0到1之间的值,表示两个文本之间的相似程度,值越接近1表示相似度越高。