#FeedSpider

我们之前聊过基于Feed的 #搜索引擎 ,利用 #爬虫 是其中一种思路。Feed Compass 和 Feed Curator 的作者 Maurice Parker 打算这么干了,他的项目名叫「Feed Spider」。简单来说,爬取RSS Feed后,基于机器学习对Feed所含的文本进行分类;把Feed归入各个类别后基于这个Feed库制作搜索应用。Maurice Parker把他的动机、思路和数据流框图都发在了他的博客上请读者提意见:

https://vincode.io/2020/05/14/feed-spider-part.html
https://vincode.io/2020/05/15/feed-spider-part.htm

Comments

Be the first to add a comment