开源文本相似度工具(中文文本纠错工具pycorrector)
开源文本相似度工具(中文文本纠错工具pycorrector)
支持音似、形似错字(或变体字)纠正,可用于中文拼音、笔画输入法的错误纠正。python3开发。pycorrector依据语言模型检测错别字位置,通过拼音音似特征、笔画五笔编辑距离特征及语言模型困惑度特征纠正错别字。
开源:https://github.com/shibing624/pycorrector
体验1:https://huggingface.co/spaces/shibing624/pycorrector
体验2:http://42.193.145.218/product/corrector/
安装使用非常简单:
pip install pycorrector
import pycorrector
corrected_sent detail = pycorrector.correct('少先队员因该为老人让坐')
print(corrected_sent detail)