目标:

  1. 导出微信的好友聊天记录
  2. 简单处理聊天记录
  3. 使用 WorldCloud 词云生成一张漂亮的词频图片

步骤:

  1. iPhone 连接 Mac,打开 iTunes,选择备份,备份到本电脑,切记不可勾选给 iPhone 备份加密,因为加密后就打不开了。
  2. 找到备份文件。借助 iPhone Backup Extractor 这款工具来找到微信聊天数据库。(免费版依然可以实现找到数据库) 找到刚才的的 iPhone 备份,然后点击 Expert Mode,登上一会,目录就展开了,Applications/com.tencent.xin/Doucuments/{md5(你的微信号)}/DB/MM.sqlite 这个,就是聊天记录数据库。
  3. 选中 MM.sqlite,点击 Extract selected ,然后等待十秒后点击 continue,即可导出数据库。
  4. MM.sqlite 使用 DB Browser for SQLite 来打开。
  5. 其中 Chat_{md5(好友的微信号)} 即是你和某位好友的聊天记录了。其中 Message 字段,便是聊天记录了。
  6. 执行 sql 语句,查找了下和女友的聊天记录,有将近15000条记录,导出csv文件
  7. 聊天记录里面表情太多了,在 sublime 中打开使用正则匹配全部,<msg>(.|\n)*?</msg>,然后删除。然后就是其他各种匹配,剔除无用的符号。
  8. 将聊天记录保存为 txt 文件。
  9. 使用 WorldCloud 生成图片。针对中文,必须自己指定中文字体才可以,否则生成的图片会乱码。

     

效果图:发现太喜欢发表情了,其中的表情被解析为文字,叠词部分大都是表情,?

 

参考文章:

  1. https://github.com/Unknwon/wuwen.org/issues/15
  2. https://daily.zhihu.com/story/8807166