如何使用Python备份Blog?
如何使用Python备份Blog?
昨天又更新了程序,修改了程序结构,可以更好的进行扩展支持其他Blog,只需编写相应的parse函数即可。新版本的程序支持CSDN Blog,SINA Blog。由于SINA Blog系统比较复杂,比较个性化,解析的方法跟CSDN Blog的不同。
具体做法是:首先在首页中找到用户ID(这是申请sina blog时给用户分配的),然后构造出文章目录列表的URL(该URL是固定格式,只是ID不同),该URL的内容是rss xml,跟2.0规范不一样,sina做了修改。通过解析这些xml,取得所有文章的URL,最后,就是取文章内容,写入本地文件中了。
总的来说,比处理CSDN Blog时要复杂些。
使用方法还是一样,把上篇文章的CSDN Blog地址换成SINA Blog地址即可。
在这里下载更新版本,里面打包我下载的几个用户的Blog,有一个是我女朋友的,呵呵。