<!--go-->
陆道升重生后第一个新年过得是很幸福的,不过享受完春节后的重生第一个寒假过得很辛苦了。
之前开发的爬虫系统这段时间在韩教授实验室里兢兢业业地运转了一段时间,经过抓取、过滤、验证以及不断地参数调整和重跑,终于拿到了约两万多个可用的网址。剩下的,就是人工的审核和整理了。
李兴平在hao123创建之前,最多收集了5000个实用网址。这些都是来自网吧真实顾客的需求,所以针对性非常不错。反观陆道升,通过自动化爬虫的搜集,加上如无效网址检测、去重、针对某些网址或规则的黑白名单等策略,最终搜集到了更多的网址,但这些网址是否合用,能否满足大众需求,陆道升并无十足把握,最终还是要走一遍人工的审核流程。
搜集可以自动化,但分类和排序确实需要大量人力劳动的工作,陆道升准备模仿hao123,按照网站热度分三级来组织网址的展现。
早期的hao123有名站导航、实用酷站精选和网站分类目录三个板块,分别占据页面的中上、中下和左侧。名站导航会放诸如中华网、搜狐网、腾讯OICQ等热度高知名度大的顶流网站,展现字体最大,用户点击后直接跳转。实用酷站精选则是用更小的字体,将一些类目下的头部网站进行展现(比如新闻栏下放着新华社、新浪新闻、光明日报等),也可以点击后直接跳转。最后网站分类目录则是点击后进入一个列满该类目下网址的列表页,可以在列表页中找到对应的网址名并点击跳转。
Loading...
未加载完,尝试【刷新】or【关闭小说模式】or【关闭广告屏蔽】。
尝试更换【Firefox浏览器】or【Chrome谷歌浏览器】打开多多收藏!
移动流量偶尔打不开,可以切换电信、联通、Wifi。
收藏网址:www.ifeiyanqing.com
(>人<;)