《自然语言处理》- 字符串常用操作

1. 字符串操作1.1 去空格和特殊符号strip() 去除两端的空格lstrip() 去除左边空格lstrip(str) 去除左边以 str 开头的部分, 必须完全匹配rstrip() 去除右边空格rstrip(str) 去除右边以 str 结尾的部分, 必须完全匹配s = ' hello , w

NLTK - 通用词下载

1. 停用词下载NLTK : https://www.nltk.org/data.html停用词下载地址 : http://www.nltk.org/nltk_data/2. 安装将下载后的 stopwords 放在虚拟环境的指定位置, nltk_data 和 corpora 是需要自己创建的3.