CSDNtoHexo迁移脚本
前言
这一阵子,刚换了落脚地儿,没想好该去折腾什么,恰好看到可以用git page
搭建一个博客,就搞了搞。关于主题啊,配置啊什么的,网上都有好多,偏偏迁移这个事儿挺麻烦,幸好有找到一前辈的脚本,可以将CSDN的博客导出为markdown格式,但是其导出来的md文件并不能直接用hexo,想要显示的好一些还需要再用脚本将它二次润色。
本人重写了润色的脚本,并增加了对CSDN的分类的爬取,将其作为hexo md文件里面的标签。
记录于此,方便大家。
还有,欢迎访问我的新博客 shiyi.fightcoder.com
环境
###python 2.7
这个就不说了,os-x,linux都是自带的,window的话自己下个就完了。
BeautifulSouphttps
去BeautifulSoup官网下载源码包,解压后进入BeautifulSoup文件夹下执行下面命令即可。
python setup.py install
html2text
下载源码包:html2text-2016.9.19.tar.gz。解压后进入html2text-2016.9.19文件夹下执行下面命令即可。(和上面是一样的)
python setup.py install
脚本
CSDN转MarkDown
因为代码篇幅问题,请点击CSDN转MD脚本自行拷贝到本地,运行下面命令
python main.py -u 你的CSDN用户名
它会将你的CSDN所有的文章全部爬取并在本地以md格式保存。
MarkDown润色使其符合Hexo
跟上一步一样,请点击MarkDown润色脚本自行拷贝。没问题的话代码开头是下面这样的,按着下面的提示进行更改,然后执行就好了。
1 |
|
这个脚本的功能就是去爬取对应文章的时间和分类,将这些信息对应填写到md的头部,使其符合hexo的标准,最终的结果是如下的。
1 |
|
CSDNtoHexo迁移脚本
https://shiyi.threebody.xyz/posts/14430.html