之前提到我的数据找不到了,后面发现Archive.org对我的站点收录的很全,nice啊。

赶紧抽空写了个python脚本尝试恢复数据。

主要原理流程:

  1. 从web.archive.org上抓blog页面
  2. 分析blog页面,提取出文章信息
  3. 生成支持wordpress导入的XML格式
  4. 从wordpress后台导入XML
    代码写很糟糕,不过好歹是能用了,基本上数据都找回来了,就是以前的格式排版都丢了,不过无所谓啦。

代码地址:https://github.com/hackqiang/RWFA.git