需求:
1、从PDF中,自动识别出版面图的每一个文本块,并分别提取每一个文本区域的标题、文字和图片并组成完整的且没有错误的文章,同时还要有该文本块相应的坐标和尺寸大小,坐标会在map area coords中来使用的;
2、要有相应的api接口,方便其它系统和程序进行调用处理;
3、最终效果可以查看:/;
4、PDF另行提供;
欢迎有这方面经验的开发者,无这种开发经难的勿扰!
雇主
发布需求
威客
报名竞价
雇主
选择中标
雇主
托管赏金
威客
在线工作
雇主
验收付款
任务进行中
一品威客网已聚集超千万专业人才,为雇主提供一站式优质服务