需求描述:
1 点击进入以下网站 “/strain/list”
2 该页面下有712页,每一页有许多“Strain Details”的超链接,比如“/strain/show/107”
3 需要把这些超链接里面的网页信息提取,并按照信息的标题进行分类,最终储存在一个csv文件里。该csv文件的行代表每一个超链接的信息,列为超链接页面中的标题。
例如,“/strain/show/107” 整理进csv文件的一行,该行的首列(ID列)为“Pseudomonas aeruginosa PAO1”(该页面的第一行),“Strain Overview-Organism Name”列为“Pseudomonas aeruginosa PAO1 (Stover et al., 2000)”,“Assembly-Assembly Accession”列为“GCF_000006765.1”。
4 对抓取的编程语言没有要求,但python或者R优先。
2 该页面下有712页,每一页有许多“Strain Details”的超链接,比如“/strain/show/107”
3 需要把这些超链接里面的网页信息提取,并按照信息的标题进行分类,最终储存在一个csv文件里。该csv文件的行代表每一个超链接的信息,列为超链接页面中的标题。
例如,“/strain/show/107” 整理进csv文件的一行,该行的首列(ID列)为“Pseudomonas aeruginosa PAO1”(该页面的第一行),“Strain Overview-Organism Name”列为“Pseudomonas aeruginosa PAO1 (Stover et al., 2000)”,“Assembly-Assembly Accession”列为“GCF_000006765.1”。
4 对抓取的编程语言没有要求,但python或者R优先。
登录查看详细需求描述
任务流程:
雇主
发布需求
威客
报名竞价
雇主
选择中标
雇主
托管赏金
威客
在线工作
雇主
验收付款
任务圆满完成
为保障雇主与服务商的共同权益,任务结束后稿件详情将不对外展示!
1
收到稿件数














