关于乱码问题 #3

mikiihuang · 2018-04-12T05:27:10Z

大佬您吼~~我按照您word2vec+聚类的代码跑了一遍，但是输出的csv文件的关键词一直存在着编码的问题，key那一列对应的是b"b'\xe8\x8d\xaf\xe7\x89\xa9' b'\xe5\x..这种格式，不知道您有没有好的建议可以修改？

mikiihuang · 2018-04-12T05:44:43Z

哈哈哈哈哈我改好啦~~~谢谢大佬的代码啦~~(#^.^#)

ShawWang1991 · 2018-07-16T10:46:55Z

可以分享一下解决方法吗？

gezimonkey · 2018-11-26T06:38:15Z

哈哈哈哈哈我改好啦~~~谢谢大佬的代码啦~~(#^.^#)

我也一样遇到这个问题了,请问怎么解决的?

mikiihuang · 2018-11-26T13:23:33Z

哈哈哈哈哈我改好啦~~~谢谢大佬的代码啦~~(#^.^#)

我也一样遇到这个问题了,请问怎么解决的?

具体改的哪里我记不清了，还是中文编码的问题，看一下那个读取的csv文件是什么编码方式，然后找代码里哪里读入的，你可以在读入的时候打印一下是不是这个时候就变成乱码了，然后一点一点的改。

xiamaozi11 · 2018-12-05T05:53:27Z

把里面的encode都给去了就好了，楼主的是2.7的版本

liyang0 · 2020-05-30T03:05:16Z

name.append(word.encode('utf8'))把这种encode去掉就行了

201901 · 2020-12-23T07:28:33Z

name.append(word.encode('utf8'))把这种encode（‘utf8’）去掉就okok

Provide feedback