1.IndentationError:unindent does not match any outer indentation level 回答: 当前用的文本编辑器Notepad++,有个设置,可以显示所有的字符的。 在: 视图 –> 显示符号 –> 显示空格与制表符 这样就可以看到我们Python代码的到底有没有该缩进的都缩进了。 发现了个问题,发现copy过来的Python代码都没有进行缩进,当我们copy别人的代码时,缩进这点需要额外注意。不要看起来代码缩进了就感觉ok了,实际上是没有缩进的。 2.inconsistent use of tabs and spaces in indentation 报错说的很清楚,你混用了tab和space,找个编辑器写,一般的编辑器会把tab转换成空格的 3.测试发现不完整的路径,不能使用request读取器html,(python官网是完整路径,可以实现)好奇怪
import urllib.request

url = 'http://www.ximalaya.com/35878101/album/3475911/'
#url = 'https://www.python.org'

response = urllib.request.urlopen(url)
print(type(response)) #<class 'http.client.HTTPResponse'>
html = response.read().decode('utf-8')

print(html)
3.正则匹配错误 expected string or bytes-like object是为什么? it's likely that it's ok in python 2,I got the same error when i run the code on python3, so i change a little bit,it works
tokens = [x.lower() for x in token_pattern.findall(line)] ##wrong
tokens = [x.lower() for x in token_pattern.findall(str(line))]##right