10大优享服务
62项会员特权
500
直接雇佣
小程序开发
收藏
网页数据采集程序
任务圆满完成
需求描述:
 项目描述:
这是我最近研究项目中的一部分,拿淘宝作示例,从网页采集数据,但本人对html不甚了解,琢磨了几天,想不出个万全之策,特此悬壶求被世济。

情况是这样的,如图(附件),任意淘宝店铺信用界面。要求:

1、采集图中红圈内的数据,以字符串数组的形式传递出来即可。你可以不考虑怎么下载网页html,这个由我负责,以字符串的形式传递给你,你只需负责从这个html字符串中提取数据。另外,凡是在服务器上的资源你都不要考虑怎载,但要提供下载URL,例如,网页下半部的买家评论,评论可能不止一页,你要提取当前页和“下一页”网址,等我下载下一页html,然后你继续采集相关数据。

2、由于存在“下一页”这样的情况,那么数据不要求一次提取、传递出来,可以分批。当然还是要尽量少。

3、网页的形成机制太丰富、多变,我也不能保证传递过来的html字符串能所见所的,我会提供一些html文件作为字符串样板,一方面作为开发、验收样板,一方面也麻烦你和实际网页对比一下,看看有什么出入或者欠缺,给我个建议。

4、Windows XP + .Net30 以上平台,编程语言JScript吧,让我好偷点懒。其它编程语言C++、C#、VB,酬金减半。

5、验收标准:提供源代码,另外再写段程序说明软件的调用方法,样板的采集结果。

有兴趣参与的朋友请首先提供开发方案。方案最好包含类图、正则表达式之类的资料,以便于我评估方案的优劣,也好考虑和整个项目其它部分的融合。

这个项目不大,对熟悉有关技术的朋友恐怕不难,很多人都能做出来。当然我也预计不到会有多少人提交开发方案。无论如何,为了答谢大家的厚爱,不让大家失望,除最终被选中方案外,我准备另选不超过两个最有价值方案,最终被选中的方案将获得总酬金的70%,其余最有价值方案平分剩余的30%。所以请尽量提供详细方案。

不清楚的地方请在此留言,或发Email,上班时间无法保证QQ在线,请谅解。

多谢大家!


温馨提醒:任务征集期间,交易双方交流可通过一品威客站内信、任务交流区联系雇主!



该任务为直接雇佣,仅限雇佣双方可见
任务流程:

雇主

发起雇佣

威客

同意合作

雇主

托管赏金

威客

在线工作

雇主

验收付款

任务圆满完成

该任务为直接雇佣,任务全程仅限雇佣双方可见

1
收到稿件数